多个 Grok 模型在 Colossus 2 并行训练中
马斯克透露 xAI 正在 Colossus 2 超算集群中同时训练多个 Grok 模型,并称 Grok Built 工具调用框架进展顺利。
查看原文xAI在Colossus 2超算上并行训练多个Grok模型,标志其正加速追赶OpenAI/Gemini的步伐。Grok Built工具调用框架的进展意味着xAI正在补齐Agent能力短板,有望在企业市场形成差异化竞争。
产品具体是什么?
这是马斯克在X平台上透露的xAI技术进展。Grok是xAI自研的大语言模型系列,于2023年11月首次发布,定位为"有观点的AI助手"。Colossus 2是xAI在孟菲斯建设的超级计算集群,2025年初全面上线,官方宣称拥有超过10万颗NVIDIA H100 GPU,是目前规模最大的AI训练集群之一。
并行训练多个模型意味着什么?
传统模型训练是串行流水线——先训练基础模型,再微调特定版本。xAI选择"并行训练多个Grok模型"意味着其基础设施已经足够强大,可以在同一批GPU资源上同时支撑多条训练任务。这大幅缩短了产品迭代周期:比如同时训练Grok-2.5基础版、Grok-2.5-mini、以及针对数学/代码的垂直版本。
这与OpenAI的策略类似——ChatGPT团队通常同时训练多个模型变体,根据RLHF评估结果选择最优版本发布。但xAI的规模更大、迭代更快,这得益于其从零构建的算力基础设施而非依赖Azure云服务。
Grok Built工具调用框架是什么?
这是本次披露的另一关键信息。"Grok Built"命名参考了"Built with Grok"的概念——让开发者基于Grok
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- 马斯克X推文原文 · 2026-05-07
- xAI官网 - Grok API文档 · 2026-05-07
- The Verge - xAI Colossus supercomputer报道 · 2025-01-14