vLLM v0.17.1:首日支持 NVIDIA Nemotron 3 Super,吞吐量提升 5 倍
vLLM 宣布 v0.17.1 首日支持 Nemotron 3 Super,相比上代吞吐量提升 5 倍、准确率翻倍,支持多 Token 预测和可配置思考预算。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
vLLM 宣布 v0.17.1 首日支持 Nemotron 3 Super,相比上代吞吐量提升 5 倍、准确率翻倍,支持多 Token 预测和可配置思考预算。
查看原文