将记忆操作作为工具引入 RL 训练,当前记忆实现只是早期尝试
Karpathy 认为在当前范式下,可以通过将各种记忆操作作为工具引入强化学习来取得重大进展。目前的压缩和记忆实现只是早期粗糙版本,都可以泛化并纳入优化流程。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Karpathy 认为在当前范式下,可以通过将各种记忆操作作为工具引入强化学习来取得重大进展。目前的压缩和记忆实现只是早期粗糙版本,都可以泛化并纳入优化流程。
查看原文