一句话定位
"不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型(同时兼容 NVIDIA GPU)。"
- 2026 年 4 月 24 日发布,Pro 与 Flash 两个版本同时开源[1][2]
- MIT 协议,HuggingFace 全系开放,商用零门槛
- Bloomberg:"最具野心的新旗舰"[5]
- 梁文锋 & 幻方量化出品,深度学习核心团队研发
两个版本
V4-Pro 与 V4-Flash 同日发布,分别对应旗舰推理与高速部署两条产品线[1][2]:
| 规格 | V4-Pro | V4-Flash |
|---|---|---|
| 总参数 | 1.6T | 284B |
| 激活参数(MoE) | 49B active | 13B active |
| 预训练 Tokens | >32T tokens | >32T tokens |
| 上下文窗口 | 1M tokens | 1M tokens |
| 最大输出 | 384K tokens | 384K tokens |
| 精度 | FP4 + FP8 混合 | FP4 + FP8 混合 |
| 开源协议 | MIT | MIT |
架构三大创新
创新 1
混合注意力(CSA + HCA)
1M 上下文下(相比 V3.2)单 token 推理 FLOPs 降至 27%,KV Cache 占用降至 10%。CSA = Compressed Sequence Attention(压缩序列注意力),HCA = Heavily Compressed Attention(重度压缩注意力),两种机制协同降低超长上下文的计算与显存开销。
创新 2
流形约束超连接(mHC)
在深层 Transformer 中引入流形约束,抑制深层梯度弥散,显著提升深层信号稳定性。对超长训练序列和大规模 MoE 路由尤为关键,防止专家激活分布随深度坍缩。
创新 3
Muon 优化器
替代 AdamW,基于矩阵正交化的动量更新机制,在等计算量下收敛更快、最终损失更低。DeepSeek 团队验证在超过 32T tokens 预训练规模下效果稳定。
Benchmark 成绩(V4-Pro 官方自测)
注:MMLU/MMLU-Pro/C-Eval/HumanEval/GSM8K/MATH 为 Base 模型分数;LiveCodeBench/Codeforces/SWE/Terminal-Bench/MRCR/CorpusQA 为 Max 模式分数。
3206
Codeforces Rating
开源模型最高
开源模型最高
93.5%
LiveCodeBench
代码生成
代码生成
90.1
GPQA Diamond
研究生级科学
研究生级科学
80.6%
SWE Verified
官方自测
官方自测
| 评测项 | V4-Pro 成绩 | 说明 |
|---|---|---|
| MMLU | 90.1 | 多学科综合 |
| MMLU-Pro | 73.5 | 专业级推理 |
| C-Eval | 93.1 | 中文综合评测 |
| GPQA Diamond | 90.1 | 研究生科学 |
| HumanEval | 76.8 | 代码补全 |
| LiveCodeBench | 93.5 | 动态代码测试 |
| Codeforces Rating | 3206 | 开源最高 |
| GSM8K | 92.6 | 小学数学 |
| MATH | 64.5 | 竞赛数学 |
| SWE Verified | 80.6% | 官方自测 * |
| SWE Pro | 55.4% | 工程级修复 |
| Terminal Bench | 67.9 | 终端任务 |
| MRCR 1M | 83.5 | 长上下文召回 |
| CorpusQA 1M | 62.0 | 长文档问答 |
* SWE Verified 80.6% 为 DeepSeek 官方自测数据。Claude Opus 4.7 官方披露为 87.6%,两者方法论差异导致数字不可直接对标,建议等待第三方复现。
API 定价
DeepSeek V4 API 提供缓存命中折扣,对大批量任务具有极强吸引力[3]。
| 模型 | 输入(缓存命中) | 输入(未命中) | 输出(/1M tokens) |
|---|---|---|---|
| V4-Flash | ¥0.2 / $0.028 | ¥1 / $0.14 | ¥2 / $0.28 |
| V4-Pro | ¥1 / $0.145 | ¥12 / $1.74 | ¥24 / $3.48 |
- 旧 API 即将停用:deepseek-chat / deepseek-reasoner 将在未来停用,需迁移到 v4-flash / v4-pro(据发布说明转述)
- 旧 API(
deepseek-chat/deepseek-reasoner)2026 年 7 月 24 日停用 - 对标闭源旗舰:V4-Pro 输出 $3.48 vs GPT-5.4 $15 vs Claude Opus 4.6 $25(约 1/4 到 1/7)
- Think Max 模式建议配置 ≥384K 上下文,充分释放推理链潜力
华为昇腾首发部署
首发即在华为昇腾平台上运行(据 WSJ 报道,V4 同时兼容 NVIDIA GPU 和 Huawei Ascend NPU)
硬件:昇腾 950PR(prefill/recommendation)+ 950DT(decode/training)路线图;部分报道称 Ascend 910C 参与核心算力
硬件:昇腾 950PR(prefill/recommendation)+ 950DT(decode/training)路线图;部分报道称 Ascend 910C 参与核心算力
- 代码从 CUDA 迁移到华为 CANN(统一异构计算架构)[7]
- 2026 年 4 月 24 日 19:00,华为昇腾 CANN 官方 B 站账号独家首发直播
- Pro 吞吐目前受限——国产算力供给约束所致
- 下半年昇腾 950 量产后预计吞吐提升 + 价格下调[7]
"DeepSeek running on Huawei chips is a bad result for the United States."
— Jensen Huang(黄仁勋),评 DeepSeek V4 昇腾首发[8]
Anthropic API 兼容
V4 提供原生 Anthropic API 格式兼容层,Claude Code 用户两行环境变量即可切换[4]:
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_API_KEY=your_deepseek_api_key
| 功能 | 状态 | 备注 |
|---|---|---|
| max_tokens / stream / system | 支持 | 完整兼容 |
| tool use / thinking | 支持 | 工具调用 + 推理链 |
| anthropic-beta header | 不支持 | Beta 特性无法透传 |
| image / document 块 | 不支持 | 多模态内容类型 |
| cache_control | 不支持 | 缓存控制由 DeepSeek 自管 |
| parallel tool calls | 不支持 | 并行工具调用 |
| MCP servers | 不支持 | 仅限 Anthropic 原生端点 |
融资转折
DeepSeek 长期以"不缺钱,缺高端芯片"拒绝外部融资,此次转变标志着公司走向商业化新阶段[6]。
- 长期立场:拒绝融资,核心瓶颈是高端算力,而非资金
- 2026 年 4 月:首次启动对外融资洽谈[6]
- 目标估值 200 亿美元(此前外界估计约 100 亿美元)
- 腾讯、阿里均参与谈判[6]
- 据 Bloomberg Law 报道,腾讯提议认购最多 20% 股权(谈判中,尚未落地)
- 融资方向:算力采购与基础设施扩张,非运营资金
开发者迁移指南
| 场景 | 操作 |
|---|---|
| 旧 API 迁移(7/24 前) | deepseek-chat → deepseek-v4-flashdeepseek-reasoner → deepseek-v4-pro |
| Claude Code 用户 | 设置 ANTHROPIC_BASE_URL=api.deepseek.com/anthropic |
| Think Max 模式 | 建议 context ≥384K,充分释放推理链 |
| 批处理任务 | 跑夜间时段(23:00—07:00 北京时间),享受半价 |
| Pro 生产部署 | 建议等待下半年昇腾 950 量产后(吞吐限制解除) |
编辑观点
DeepSeek V4 最重要的意义不是 benchmark 排名,而是前沿大模型首发即适配华为昇腾(据 WSJ 报道同时兼容 NVIDIA GPU)。这是一个地缘战略信号——在出口管制持续收紧的背景下,它证明前沿 AI 的算力路径正在多元化。黄仁勋的评论(对美国是"horrible"的结果)直接说明了局势的敏感性。
1.6T 开源 + MIT 协议 + 1/4 到 1/7 的定价 + 夜间半价的组合,对企业部署决策的影响是实质性的。过去"开源 vs 闭源"的争议更多是能力层面,而现在开源旗舰的能力已经足够接近,成本差距才是决策核心。
融资转折是另一个值得关注的拐点。DeepSeek 从"幻方内部实验室"向"独立商业实体"的转变,以及腾讯阿里的参与,意味着中国 AI 生态的资本站队正在加速。这场融资的最终落地金额和股权结构,将是观察 DeepSeek 商业路径的重要信号。
需要保持谨慎的地方:SWE Verified 80.6% 是官方自测,与 Claude Opus 4.7 独立验证的 87.6% 差距显著,建议等待第三方复现;Pro 的吞吐限制在下半年昇腾 950 量产前是真实的部署障碍,不适合当前高并发生产场景。
参考文献
[1] HuggingFace DeepSeek-V4-Pro — huggingface.co/deepseek-ai/DeepSeek-V4-Pro
[2] HuggingFace DeepSeek-V4-Flash — huggingface.co/deepseek-ai/DeepSeek-V4-Flash
[3] DeepSeek 官方 API 定价 — api-docs.deepseek.com/quick_start/pricing
[4] DeepSeek Anthropic 兼容 API — api-docs.deepseek.com/guides/anthropic_api
[5] Bloomberg — DeepSeek V4 发布报道,2026-04-24 bloomberg.com/news/articles/2026-04-24
[6] Bloomberg — DeepSeek 融资洽谈,目标估值 200 亿美元,2026-04-22 bloomberg.com/news/articles/2026-04-22
[7] TrendForce — 昇腾 950PR 算力分析 trendforce.com
[8] SCMP — 黄仁勋评 DeepSeek 昇腾首发 scmp.com
[9] 华尔街见闻 — DeepSeek V4 超越 Sonnet 分析 awtmt.com/articles/3770782
[10] IT之家 — DeepSeek V4 发布报道 ithome.com/0/942/955.htm