vLLM v0.22.0发布
vLLM v0.22.0正式发布,459个提交来自230位贡献者。新特性包括DeepSeek V4优化(NVFP4混合专家、CUDA图、ROCm支持)、Rust前端实验版本、Cutlass FP8延…
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
vLLM v0.22.0正式发布,459个提交来自230位贡献者。新特性包括DeepSeek V4优化(NVFP4混合专家、CUDA图、ROCm支持)、Rust前端实验版本、Cutlass FP8延…
查看原文