← 返回资讯
大模型 @vllm_project 2026-02-27

vLLM 支持 Ring-2.5-1T:1 万亿参数混合线性注意力模型,长序列吞吐提升 3 倍

vLLM 宣布支持蚂蚁 AntLing 的 Ring-2.5-1T 模型,总参数 1T、活跃参数 63B,采用混合线性注意力架构,长序列吞吐提升 3 倍。推理能力达 IMO 2025 金牌水平,原生支持 128K 上下文。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。