← 返回资讯
大模型 @vllm_project 2026-06-15

vLLM v0.23.0发布:408次提交、200位贡献者

支持DeepSeek-V4多后端、Model Runner V2成为Llama/Mistral默认配置、Gemma 4统一框架新增MTP、多层KV cache卸载及统一推理工具调用解析器。

查看原文
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。