NVIDIA:Blackwell 以业界最低单 Token 成本定义推理 TCO
NVIDIA 强调决定推理 TCO 的关键指标是单 Token 成本而非算力或每美元 FLOPS。Blackwell 通过 CoreWeave、NebiusAI、Nscale、Together 等合作方提供业界最低单 Token 成本。
查看原文NVIDIA官方首次将「单Token成本」确立为推理TCO的核心指标,Blackwell通过其合作伙伴生态(CoreWeave/NebiusAI/Nscale/Together)证明最低单Token成本,这是在H200/H100市场被开源模型挑战后的一次战略性话语权争夺。
事件维度:NVIDIA重新定义推理竞争维度
NVIDIA于4月15日通过X平台官方账号发布内容,首次将「单Token成本」作为推理TCO的判断标准,而非传统GPU的算力指标(FLOPS)或每美元FLOPS。这一表述背后有明确的市场背景:2025-2026年开源模型(如DeepSeek系列、Qwen、LLaMA变体)在推理效率上的持续优化,使得仅靠硬件算力已无法说服云厂商和开发者选择。
通过强调「业界最低单Token成本」,NVIDIA将竞争焦点从硬件性能拉回到成本效益,这与其在H200/H100阶段面对AMD MI300X和中国国产芯片(如华为昇腾、壁仞)竞争时的策略一脉相承——用TCO说服买家,而不是单纯比规格参数。
行业影响:云厂商合作的生态验证
官方列举的合作伙伴(CoreWeave、NebiusAI、Nscale、Together)均为专注AI基础设施的云厂商,核心卖点是GPU裸机/即服务。NVIDIA选择这些合作伙伴背书,传递了两个信号:
- 大规模部署验证:这些厂商在2025年Q4-Q1累计部署了数万片Blackwell GPU,足够支撑成本模型验证;
- 针对开源推理框架优化:Together是
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- NVIDIA官方推文 · 2026-04-15
- DeepSeek-V3推理效率分析 · 2026-03-20
- CoreWeave Blackwell基础设施公告 · 2026-03-01