Scale AI:GPT-5.3-Codex 创 SWE-Bench Pro 最高分
Scale AI 祝贺 OpenAI,57% 是 SWE-Bench Pro 有史以来的最高分。SWE-Bench Pro 仍是评估真实软件工程能力的领先基准
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Scale AI 祝贺 OpenAI,57% 是 SWE-Bench Pro 有史以来的最高分。SWE-Bench Pro 仍是评估真实软件工程能力的领先基准
查看原文