Claude Opus 4.6 在 MRCR 基准测试中大幅领先
Anthropic 发布 Claude Opus 4.6 在 MRCR(多轮检索与推理)基准测试中的最新成绩:128K 上下文下准确率达 72%,远超 GPT-4.5(52%)和 Gemini 2.5 Pro(36%),展示了其在超长上下文理解方面的强大能力。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Anthropic 发布 Claude Opus 4.6 在 MRCR(多轮检索与推理)基准测试中的最新成绩:128K 上下文下准确率达 72%,远超 GPT-4.5(52%)和 Gemini 2.5 Pro(36%),展示了其在超长上下文理解方面的强大能力。
查看原文