LLM 记忆过拟合可能源于训练偏差
Karpathy 进一步解释,所有 LLM 都存在此问题,可能因为训练数据中上下文信息通常与任务高度相关,模型因此形成了利用所有给定信息的偏差,在推理时对通过记忆功能 RAG 检索到的内容过度拟合。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
Karpathy 进一步解释,所有 LLM 都存在此问题,可能因为训练数据中上下文信息通常与任务高度相关,模型因此形成了利用所有给定信息的偏差,在推理时对通过记忆功能 RAG 检索到的内容过度拟合。
查看原文