← 返回资讯
产品发布 @togethercompute 2026-04-12

Together AI:MiniMax M2.7 上线,自主 RL 训练刷新开源纪录

MiniMax M2.7 已上线 Together AI 平台。该模型通过自主运行强化学习循环进行训练,在 MLE Bench Lite 上取得开源模型最高分。

查看原文
TL;DR · 产品解读

MiniMax M2.7 通过自主 RL 训练在开源代码模型中取得最高分,刷新 MLE Bench Lite 纪录,适合需要强代码能力的开发者。

深度解读

产品是什么

MiniMax M2.7 是 MiniMax 公司发布的最新代码模型,现已在 Together AI 平台上线。该模型的核心技术亮点是采用自主运行强化学习(Autonomous RL)循环进行训练,而非传统的人类微调或纯监督学习方式。这意味着模型在训练过程中能够自主探索并强化解决问题的策略。

模型参数名为 M2.7,具体规模未完全公开,但命名暗示这是中等规模的模型。值得注意的是,它在 MLE Bench Lite 评测中取得开源模型最高分——该基准测试主要衡量模型在真实代码任务(benchmarking)上的执行通过率。

解决什么问题

开源代码模型长期以来在「自主完成任务」能力上弱于闭源模型。MiniMax M2.7 通过自主 RL 训练,试图让模型真正学会「解决多步骤编程问题」而非仅仅「补全代码片段」。MLE Bench Lite 侧重于独立解决代码挑战的能力,与日常开发者面对的真实场景更接近。

定价与获取方式

通过 Together AI API 调用。Together AI 的定价通常比 OpenAI、Anthropic 低约 30-50%,具体看 token 量级。支持开源模型直接部署调用,无需微调。

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Together AI 官推发布 · 2026-04-12
  2. MLE Bench Lite 评测说明 · 2026-04-01
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。