FlashMorph将混合层选择形式化为预算约束优化问题,通过可变形模型和线性化正则化提升Transformer的长上下文效率。
想读得更深?AI Insight Pro 解锁全部深度研报与资讯完整解读。