← 返回资讯
产品发布 @vllm_project 2026-03-11

vLLM v0.17.1:首日支持 NVIDIA Nemotron 3 Super,吞吐量提升 5 倍

vLLM 宣布 v0.17.1 首日支持 Nemotron 3 Super,相比上代吞吐量提升 5 倍、准确率翻倍,支持多 Token 预测和可配置思考预算。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。