DeepSeek V4 — 1.6T 参数 MoE 全开源 · 华为昇腾 SuperNode 零日适配 · 推理侧

一句话定位

不只是又一个开源模型，而是首发即跑在华为昇腾上的前沿大模型。

2026 年 4 月 24 日，DeepSeek 同时开源 V4-Pro（1.6T/49B active）与 V4-Flash（284B/13B active）两个版本，MIT 协议，HuggingFace 全系开放^[1]^[2]。Bloomberg 称其为"最具野心的新旗舰"^[5]。梁文锋与幻方量化出品，深度学习核心团队研发。

3206

Codeforces Rating · 开源最高

93.5%

LiveCodeBench 代码生成

80.6%

SWE Verified · 官方自测

$200亿

目标估值（融资洽谈中）

Spec Sheet

一图看懂 · 模型规格表。

V4 选了「全开源 + 跨硬件 + 极致低价」三件套。MIT 协议、HuggingFace 全系开放、昇腾 + NVIDIA 双跑、API 输出价仅 Claude Opus 4.6 的 1/7——这是过去三年最具商业化威胁性的开源动作。
维度	DeepSeek V4-Pro / V4-Flash
开 / 闭源	全开源 · MIT 协议 · HuggingFace + GitHub 同步发布 · 商用零门槛
模型尺寸（V4-Pro）	1.6T 总参 / 49B 激活 · MoE · >32T tokens 预训练
模型尺寸（V4-Flash）	284B 总参 / 13B 激活 · MoE · 同样 >32T tokens 预训练
上下文窗口	1M tokens 原生 · 不分档定价
最大输出	384K tokens · 业界最长之一（适合长篇生成 / Agent 长链）
多模态能力	纯文本（V4 系列定位推理 + 编码，多模态待 V4-VL 单独发布）
精度	FP4 + FP8 混合（推理部署省一半显存）
输入价格（Pro · 缓存命中）	¥0.25 / $0.0363（限时 75% 折扣）· 原价 ¥1 / $0.145
输入价格（Pro · 未命中）	¥3 / $0.435（限时 75% 折扣）· 原价 ¥12 / $1.74
输出价格（Pro）	¥6 / $0.87（限时 75% 折扣）· 原价 ¥24 / $3.48 · 折扣到 2026-05-05 23:59 北京时间
输出价格（Flash）	¥0.5 / $0.07（限时 75% 折扣）· 原价 ¥2 / $0.28
夜间折扣	V4 官方文档中未声明夜间半价规则（V3 时代有过 16:30–00:30 UTC 半价，V4 是否延续待官方公告）
SWE Verified（V4-Pro Max · 自测）	80.6% · Claude Opus 4.7 独立验证为 87.6%，方法论差异待第三方复现
SWE Pro（V4-Pro Max · 自测）	55.4% · 工程级修复
Codeforces Rating	3206（V4-Pro Max 模式）· High 模式仅 2919 · 当前开源最高
LiveCodeBench（V4-Pro Max）	93.5% · 顶级动态代码评测
MMLU / MMLU-Pro（V4-Pro Base）	90.1 / 73.5 · 注：Base 分数，instruct 版未单独公布
GPQA Diamond（V4-Pro Max）	90.1 · 研究生级科学推理
MRCR 1M 长上下文（V4-Pro Max）	83.5 · 1M 长度下高召回（vs Claude 4.7 的 32.2 大幅领先）
3 种推理强度模式	`Non-think` / `Think High` / `Think Max` · Max 建议 ≥384K context
Anthropic API 兼容	支持 max_tokens / stream / system / tool / thinking · 不支持：anthropic-beta header / image / cache_control / parallel tools / MCP（全部 ignored 或拒绝）
昇腾合作边界	华为 Ascend SuperNode 仅推理侧 day-zero 适配 · 训练仍依赖美国芯片（SCMP 援引华为澄清）
采样参数（特殊）	官方推荐 `temperature=1.0, top_p=1.0`（与一般 LLM 不同）
Chat Template	无 Jinja template · 必须使用官方 `encoding_dsv4.py` 编码（二次集成有摩擦）
License	MIT · 商用零门槛
HuggingFace	deepseek-ai/DeepSeek-V4-Pro · V4-Flash
API 端点	`api.deepseek.com`（OpenAI 兼容） · `api.deepseek.com/anthropic`（Anthropic 兼容）
旧 API 停用日	2026-07-24 · `deepseek-chat` / `deepseek-reasoner` 退役，需迁 V4
发布日期	2026-04-24 · 与腾讯 Hy3 preview 同日发布
融资进展	首次启动对外融资 · 目标估值 $20B+（据 The Information 单一信源，DeepSeek 未官方确认）· 腾讯阿里参与谈判
旧 API 弃用	`deepseek-chat` + `deepseek-reasoner` 在 2026-07-24 15:59 UTC 退役（北京时间 23:59）