产品解读 · DeepSeek

DeepSeek V4 深度解读
1.6T 参数 MoE 全开源 · 华为昇腾首发部署

华为昇腾首发 · 1M 上下文 · Anthropic API 兼容 · 目标估值 200 亿美元

📅 2026.04.24 发布
🏗 参数 1.6T / 49B active
🚀 Anthropic API 兼容
💰 夜间 半价
一句话定位
"不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型(同时兼容 NVIDIA GPU)。"
两个版本
V4-Pro 与 V4-Flash 同日发布,分别对应旗舰推理与高速部署两条产品线[1][2]
规格 V4-Pro V4-Flash
总参数 1.6T 284B
激活参数(MoE) 49B active 13B active
预训练 Tokens >32T tokens >32T tokens
上下文窗口 1M tokens 1M tokens
最大输出 384K tokens 384K tokens
精度 FP4 + FP8 混合 FP4 + FP8 混合
开源协议 MIT MIT
架构三大创新
创新 1
混合注意力(CSA + HCA)
1M 上下文下(相比 V3.2)单 token 推理 FLOPs 降至 27%,KV Cache 占用降至 10%。CSA = Compressed Sequence Attention(压缩序列注意力),HCA = Heavily Compressed Attention(重度压缩注意力),两种机制协同降低超长上下文的计算与显存开销。
创新 2
流形约束超连接(mHC)
在深层 Transformer 中引入流形约束,抑制深层梯度弥散,显著提升深层信号稳定性。对超长训练序列和大规模 MoE 路由尤为关键,防止专家激活分布随深度坍缩。
创新 3
Muon 优化器
替代 AdamW,基于矩阵正交化的动量更新机制,在等计算量下收敛更快、最终损失更低。DeepSeek 团队验证在超过 32T tokens 预训练规模下效果稳定。
Benchmark 成绩(V4-Pro 官方自测)

注:MMLU/MMLU-Pro/C-Eval/HumanEval/GSM8K/MATH 为 Base 模型分数;LiveCodeBench/Codeforces/SWE/Terminal-Bench/MRCR/CorpusQA 为 Max 模式分数。

3206
Codeforces Rating
开源模型最高
93.5%
LiveCodeBench
代码生成
90.1
GPQA Diamond
研究生级科学
80.6%
SWE Verified
官方自测
评测项 V4-Pro 成绩 说明
MMLU 90.1 多学科综合
MMLU-Pro 73.5 专业级推理
C-Eval 93.1 中文综合评测
GPQA Diamond 90.1 研究生科学
HumanEval 76.8 代码补全
LiveCodeBench 93.5 动态代码测试
Codeforces Rating 3206 开源最高
GSM8K 92.6 小学数学
MATH 64.5 竞赛数学
SWE Verified 80.6% 官方自测 *
SWE Pro 55.4% 工程级修复
Terminal Bench 67.9 终端任务
MRCR 1M 83.5 长上下文召回
CorpusQA 1M 62.0 长文档问答
* SWE Verified 80.6% 为 DeepSeek 官方自测数据。Claude Opus 4.7 官方披露为 87.6%,两者方法论差异导致数字不可直接对标,建议等待第三方复现。
API 定价
DeepSeek V4 API 提供缓存命中折扣,对大批量任务具有极强吸引力[3]
模型 输入(缓存命中) 输入(未命中) 输出(/1M tokens)
V4-Flash ¥0.2 / $0.028 ¥1 / $0.14 ¥2 / $0.28
V4-Pro ¥1 / $0.145 ¥12 / $1.74 ¥24 / $3.48
华为昇腾首发部署
首发即在华为昇腾平台上运行(据 WSJ 报道,V4 同时兼容 NVIDIA GPU 和 Huawei Ascend NPU)
硬件:昇腾 950PR(prefill/recommendation)+ 950DT(decode/training)路线图;部分报道称 Ascend 910C 参与核心算力
"DeepSeek running on Huawei chips is a bad result for the United States." — Jensen Huang(黄仁勋),评 DeepSeek V4 昇腾首发[8]
Anthropic API 兼容
V4 提供原生 Anthropic API 格式兼容层,Claude Code 用户两行环境变量即可切换[4]
export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic
export ANTHROPIC_API_KEY=your_deepseek_api_key
功能 状态 备注
max_tokens / stream / system 支持 完整兼容
tool use / thinking 支持 工具调用 + 推理链
anthropic-beta header 不支持 Beta 特性无法透传
image / document 块 不支持 多模态内容类型
cache_control 不支持 缓存控制由 DeepSeek 自管
parallel tool calls 不支持 并行工具调用
MCP servers 不支持 仅限 Anthropic 原生端点
融资转折
DeepSeek 长期以"不缺钱,缺高端芯片"拒绝外部融资,此次转变标志着公司走向商业化新阶段[6]
开发者迁移指南
场景 操作
旧 API 迁移(7/24 前) deepseek-chatdeepseek-v4-flash
deepseek-reasonerdeepseek-v4-pro
Claude Code 用户 设置 ANTHROPIC_BASE_URL=api.deepseek.com/anthropic
Think Max 模式 建议 context ≥384K,充分释放推理链
批处理任务 跑夜间时段(23:00—07:00 北京时间),享受半价
Pro 生产部署 建议等待下半年昇腾 950 量产后(吞吐限制解除)
编辑观点

DeepSeek V4 最重要的意义不是 benchmark 排名,而是前沿大模型首发即适配华为昇腾(据 WSJ 报道同时兼容 NVIDIA GPU)。这是一个地缘战略信号——在出口管制持续收紧的背景下,它证明前沿 AI 的算力路径正在多元化。黄仁勋的评论(对美国是"horrible"的结果)直接说明了局势的敏感性。

1.6T 开源 + MIT 协议 + 1/4 到 1/7 的定价 + 夜间半价的组合,对企业部署决策的影响是实质性的。过去"开源 vs 闭源"的争议更多是能力层面,而现在开源旗舰的能力已经足够接近,成本差距才是决策核心。

融资转折是另一个值得关注的拐点。DeepSeek 从"幻方内部实验室"向"独立商业实体"的转变,以及腾讯阿里的参与,意味着中国 AI 生态的资本站队正在加速。这场融资的最终落地金额和股权结构,将是观察 DeepSeek 商业路径的重要信号。

需要保持谨慎的地方:SWE Verified 80.6% 是官方自测,与 Claude Opus 4.7 独立验证的 87.6% 差距显著,建议等待第三方复现;Pro 的吞吐限制在下半年昇腾 950 量产前是真实的部署障碍,不适合当前高并发生产场景。

参考文献
[1] HuggingFace DeepSeek-V4-Pro — huggingface.co/deepseek-ai/DeepSeek-V4-Pro
[2] HuggingFace DeepSeek-V4-Flash — huggingface.co/deepseek-ai/DeepSeek-V4-Flash
[3] DeepSeek 官方 API 定价 — api-docs.deepseek.com/quick_start/pricing
[4] DeepSeek Anthropic 兼容 API — api-docs.deepseek.com/guides/anthropic_api
[5] Bloomberg — DeepSeek V4 发布报道,2026-04-24 bloomberg.com/news/articles/2026-04-24
[6] Bloomberg — DeepSeek 融资洽谈,目标估值 200 亿美元,2026-04-22 bloomberg.com/news/articles/2026-04-22
[7] TrendForce — 昇腾 950PR 算力分析 trendforce.com
[8] SCMP — 黄仁勋评 DeepSeek 昇腾首发 scmp.com
[9] 华尔街见闻 — DeepSeek V4 超越 Sonnet 分析 awtmt.com/articles/3770782
[10] IT之家 — DeepSeek V4 发布报道 ithome.com/0/942/955.htm

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录