← 返回资讯
芯片 @nvidia 2026-04-15

NVIDIA:Blackwell 以业界最低单 Token 成本定义推理 TCO

NVIDIA 强调决定推理 TCO 的关键指标是单 Token 成本而非算力或每美元 FLOPS。Blackwell 通过 CoreWeave、NebiusAI、Nscale、Together 等合作方提供业界最低单 Token 成本。

查看原文
TL;DR · 事件解读

NVIDIA官方首次将「单Token成本」确立为推理TCO的核心指标,Blackwell通过其合作伙伴生态(CoreWeave/NebiusAI/Nscale/Together)证明最低单Token成本,这是在H200/H100市场被开源模型挑战后的一次战略性话语权争夺。

深度解读

事件维度:NVIDIA重新定义推理竞争维度

NVIDIA于4月15日通过X平台官方账号发布内容,首次将「单Token成本」作为推理TCO的判断标准,而非传统GPU的算力指标(FLOPS)或每美元FLOPS。这一表述背后有明确的市场背景:2025-2026年开源模型(如DeepSeek系列、Qwen、LLaMA变体)在推理效率上的持续优化,使得仅靠硬件算力已无法说服云厂商和开发者选择。

通过强调「业界最低单Token成本」,NVIDIA将竞争焦点从硬件性能拉回到成本效益,这与其在H200/H100阶段面对AMD MI300X和中国国产芯片(如华为昇腾、壁仞)竞争时的策略一脉相承——用TCO说服买家,而不是单纯比规格参数。

行业影响:云厂商合作的生态验证

官方列举的合作伙伴(CoreWeave、NebiusAI、Nscale、Together)均为专注AI基础设施的云厂商,核心卖点是GPU裸机/即服务。NVIDIA选择这些合作伙伴背书,传递了两个信号:

参考来源
  1. NVIDIA官方推文 · 2026-04-15
  2. DeepSeek-V3推理效率分析 · 2026-03-20
  3. CoreWeave Blackwell基础设施公告 · 2026-03-01
本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。