林俊旸离职后首文:从推理思维到智能体思维,大模型的下一个阶段
前阿里 Qwen 技术负责人林俊旸发布长文:大模型的下一阶段不是让模型想得更久,而是让模型为了行动而思考。回顾 o1/R1 的教训:RL 不再是轻量附加步骤,而是系统工程问题。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
前阿里 Qwen 技术负责人林俊旸发布长文:大模型的下一阶段不是让模型想得更久,而是让模型为了行动而思考。回顾 o1/R1 的教训:RL 不再是轻量附加步骤,而是系统工程问题。
查看原文