大模型 @karpathy 2026-03-25

LLM 记忆过拟合可能源于训练偏差

Karpathy 进一步解释，所有 LLM 都存在此问题，可能因为训练数据中上下文信息通常与任务高度相关，模型因此形成了利用所有给定信息的偏差，在推理时对通过记忆功能 RAG 检索到的内容过度拟合。

本解读由 AI 自动生成 · 模板：事件解读 · 仅供参考，请以原文为准。