产品发布 @togethercompute 2026-04-12

Together AI：MiniMax M2.7 上线，自主 RL 训练刷新开源纪录

MiniMax M2.7 已上线 Together AI 平台。该模型通过自主运行强化学习循环进行训练，在 MLE Bench Lite 上取得开源模型最高分。

TL;DR · 产品解读

MiniMax M2.7 通过自主 RL 训练在开源代码模型中取得最高分，刷新 MLE Bench Lite 纪录，适合需要强代码能力的开发者。

深度解读

产品是什么

MiniMax M2.7 是 MiniMax 公司发布的最新代码模型，现已在 Together AI 平台上线。该模型的核心技术亮点是采用自主运行强化学习（Autonomous RL）循环进行训练，而非传统的人类微调或纯监督学习方式。这意味着模型在训练过程中能够自主探索并强化解决问题的策略。

模型参数名为 M2.7，具体规模未完全公开，但命名暗示这是中等规模的模型。值得注意的是，它在 MLE Bench Lite 评测中取得开源模型最高分——该基准测试主要衡量模型在真实代码任务（benchmarking）上的执行通过率。

解决什么问题

开源代码模型长期以来在「自主完成任务」能力上弱于闭源模型。MiniMax M2.7 通过自主 RL 训练，试图让模型真正学会「解决多步骤编程问题」而非仅仅「补全代码片段」。MLE Bench Lite 侧重于独立解决代码挑战的能力，与日常开发者面对的真实场景更接近。

定价与获取方式

通过 Together AI API 调用。Together AI 的定价通常比 OpenAI、Anthropic 低约 30-50%，具体看 token 量级。支持开源模型直接部署调用，无需微调。

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

Together AI 官推发布 · 2026-04-12
MLE Bench Lite 评测说明 · 2026-04-01

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。