研究 @_akhaliq 2026-03-04

新研究 Beyond Length Scaling：协同广度与深度提升生成式奖励模型

新论文提出 Beyond Length Scaling 方法，通过协同广度（多样本）和深度（长推理）两个维度来提升生成式奖励模型的性能。

本解读由 AI 自动生成 · 模板：事件解读 · 仅供参考，请以原文为准。