行业 @OpenAI 2026-04-30

OpenAI借助Codex破解地精谜团：Nerdy人格已下线

OpenAI宣布在Codex协助下找到GPT-5.1出现goblin异常的元凶——Nerdy人格设定，并已将其移除。

TL;DR · 观点解读

OpenAI用Codexdebug找bug的故事本质上是科技圈对「人格设定导致行为异常」这一技术哲学问题的戏谑表达——它提醒我们：大模型的RLHF调优中，任何人格标签都可能成为双刃剑。

深度解读

说话人的立场与上下文

这条推文来自@OpenAI官方账号，但语气明显带有自嘲和幽默感——用「Nerdy人格设定下线」来解释GPT-5.1的goblin异常（行为不可预测、输出风格偏离）。这不是一份严肃的bug修复公告，更像是一次品牌人格的玩梗行为。它延续了OpenAI近期在社交媒体上更轻松、更有「人味」的运营风格，与Sam Altman本人近年频繁用meme式语言与社区互动的策略一脉相承。

Nerdy人格的历史观点与利益关联

RLHF（基于人类反馈的强化学习）调优中，「人格设定」一直是OpenAI内部的敏感议题。早期GPT-3/ChatGPT刻意压制任何显性人格特征，以避免「像人一样」带来的期望落差。但从GPT-4开始，OpenAI逐步引入更明确的行为边界（如「helpful, harmless, honest」），某种意义上也是一种隐性人格注入。「Nerdy」作为一种假设的调优标签，可能代表过度强调「准确、不开玩笑」的约束——这与OpenAI面临的核心张力一致：用户想要它聪明，但也要有趣、要有温度。Nerdy的下线暗示OpenAI正在测试「过于理工直男」风格的风险。

反共识push back

Valid反驳1：这整个叙事可能是内部人员或社区的玩笑，但GPT-5.1作为旗

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

OpenAI官方推文原文 · 2026-04-30
Goblin Mode 牛津年度词汇背景（了解goblin文化梗） · 2022-12
OpenAI关于RLHF与行为控制的早期研究（了解HHH原则背景） · 2022-05

本解读由 AI 自动生成 · 模板：观点解读 · 仅供参考，请以原文为准。