← 返回资讯
大模型 @lmsysorg 2026-06-12

SGLang 新增 MiniMax-M3 原生支持:60 层 MoE、1M 上下文、多模态融合

该模型总计约 428B 参数、23B 活跃参数,60 层架构。MSA 稀疏注意力在 1M 上下文下比 M2 提速 9 倍/15 倍(预填充/解码),Token 计算量降至 1/20,支持 NVIDI…

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。