← 返回资讯
产品发布 @dotey 2026-04-07

Claude Mythos Preview 跑分断崖式领先,SWE-bench 93.9%、USAMO 97.6%

Anthropic 发布 Claude Mythos Preview 并宣布 Project Glasswing。对比 Opus 4.6,SWE-bench 从 80.8% 升至 93.9%,USAMO 从 42.3% 飙至 97.6%,在几乎所有基准上以两位数优势领先 GPT-5.4 和 Gemini 3.1 Pro。

查看原文
TL;DR · 产品解读

Claude Mythos Preview 发布,SWE-bench 93.9%(+13.1pp)、USAMo 97.6%(+55.3pp),断崖式领先 GPT-5.4 和 Gemini 3.1 Pro。Anthropic 同时预告 Project Glasswing,标志着 Claude 在编程与数学推理上全面突破。

深度解读

产品是什么

Claude Mythos Preview 是 Anthropic 最新发布的旗舰推理模型系列,重点强化了代码生成(Software Engineering)和数学推理(USAMO)两大高价值场景。相比前代 Opus 4.6,在几乎所有主流基准上实现了两位数百分点的提升。

核心提升数字

对比同类竞品

参考来源
  1. dotey 发布推文 · 2026-04-07
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。