Together AI:MiniMax M2.7 上线,自主 RL 训练刷新开源纪录
MiniMax M2.7 已上线 Together AI 平台。该模型通过自主运行强化学习循环进行训练,在 MLE Bench Lite 上取得开源模型最高分。
查看原文MiniMax M2.7 通过自主 RL 训练在开源代码模型中取得最高分,刷新 MLE Bench Lite 纪录,适合需要强代码能力的开发者。
产品是什么
MiniMax M2.7 是 MiniMax 公司发布的最新代码模型,现已在 Together AI 平台上线。该模型的核心技术亮点是采用自主运行强化学习(Autonomous RL)循环进行训练,而非传统的人类微调或纯监督学习方式。这意味着模型在训练过程中能够自主探索并强化解决问题的策略。
模型参数名为 M2.7,具体规模未完全公开,但命名暗示这是中等规模的模型。值得注意的是,它在 MLE Bench Lite 评测中取得开源模型最高分——该基准测试主要衡量模型在真实代码任务(benchmarking)上的执行通过率。
解决什么问题
开源代码模型长期以来在「自主完成任务」能力上弱于闭源模型。MiniMax M2.7 通过自主 RL 训练,试图让模型真正学会「解决多步骤编程问题」而非仅仅「补全代码片段」。MLE Bench Lite 侧重于独立解决代码挑战的能力,与日常开发者面对的真实场景更接近。
定价与获取方式
通过 Together AI API 调用。Together AI 的定价通常比 OpenAI、Anthropic 低约 30-50%,具体看 token 量级。支持开源模型直接部署调用,无需微调。
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- Together AI 官推发布 · 2026-04-12
- MLE Bench Lite 评测说明 · 2026-04-01