大模型 @vllm_project 2026-06-15

vLLM v0.23.0发布：408次提交、200位贡献者

支持DeepSeek-V4多后端、Model Runner V2成为Llama/Mistral默认配置、Gemma 4统一框架新增MTP、多层KV cache卸载及统一推理工具调用解析器。

本解读由 AI 自动生成 · 模板：事件解读 · 仅供参考，请以原文为准。