产品发布 @vllm_project 2026-04-27

vLLM：DeepSeek V4 base 模型支持即将就绪

V4 共 4 款模型（base/instruct × flash/pro），首批先支持 instruct；与 DeepSeek 合作在 config 中新增 expert_dtype 字段（base 用 fp8、instruct 用 fp4）以扩展 base 支持。

查看原文

TL;DR · 产品解读

vLLM宣布即将支持DeepSeek V4 base模型，引入expert_dtype字段实现fp8/fp4混合精度。这是MoE推理框架针对不同模型变体的精细化量化方案，对部署成本和精度平衡有重要意义。首批先支持instruct，base模型支持紧随其后。

深度解读

产品是什么

vLLM在X平台宣布即将支持DeepSeek V4 base模型。DeepSeek V4是一个MoE（Mixture of Experts）架构的模型家族，分为4个变体：base × flash/pro和instruct × flash/pro。首批先上线instruct版本支持，base模型的适配工作正在进行中。

关键的技术更新是vLLM与DeepSeek合作在config中新增了expert_dtype字段，用于指定不同专家模块的数据精度。具体来说：

base模型：使用fp8精度（8位浮点）
instruct模型：使用fp4精度（4位浮点）

这种差异化精度设计反映了MoE架构中不同专家模块的重要性差异——base模型的专家需要保留更多精度以支持通用预训练任务，而instruct模型经过微调后可承受更激进的量化。

解决什么问题

MoE模型的核心挑战在于参数量巨大。DeepSeek V4的expert_dtype设计本质上是精细化量化策略：对Exp

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

vLLM：DeepSeek V4 base 模型支持即将就绪 · 2026-04-27
DeepSeek-V4 Technical Report · 2025-03-01
vLLM MoE Model Support Documentation · 2026-01-15

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。