vLLM 支持 Ring-2.5-1T:1 万亿参数混合线性注意力模型,长序列吞吐提升 3 倍
vLLM 宣布支持蚂蚁 AntLing 的 Ring-2.5-1T 模型,总参数 1T、活跃参数 63B,采用混合线性注意力架构,长序列吞吐提升 3 倍。推理能力达 IMO 2025 金牌水平,原生支持 128K 上下文。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
vLLM 宣布支持蚂蚁 AntLing 的 Ring-2.5-1T 模型,总参数 1T、活跃参数 63B,采用混合线性注意力架构,长序列吞吐提升 3 倍。推理能力达 IMO 2025 金牌水平,原生支持 128K 上下文。
查看原文