← 返回资讯
观点 @sama 2026-02-05

新模型体验超出基准分数

Sam Altman 表示使用新模型的体验比基准分数显示的进步更大。新模型支持「务实」和「友好」两种人格风格选择

查看原文
TL;DR · 观点解读

Altman 暗示新模型真实体验远超基准分数,同时引入「务实/友好」人格选择,标志 OpenAI 从「统一 helpful assistant」转向可定制 AI personality,可能开启 2026 年 AI 产品分化的元年。

深度解读

Sam Altman 这次的表态看似轻描淡写,实则透露了 OpenAI 下一阶段产品策略的核心转向。

说话人历史立场与利益关联

Altman 执掌 OpenAI 六年,其公开表态高度一致地围绕三个主题:AI 进步不可阻挡、benchmark 低估真实能力、产品化是下一战场。他在 2023-2024 年多次强调「AI 比你想象的更对齐」和「scaling 仍在有效」,这次「体验超基准」的说法是一贯叙事的延续:基准测试永远滞后于实际使用感受,给用户预期管理留足空间。

利益层面,Altman 的表态与 OpenAI 当前商业压力直接相关。ChatGPT 增长趋缓、Claude/Gemini 竞争加剧、新模型需要差异化的营销叙事。把「体验超基准」包装成一种 「相信我,你用了就知道」 的信心传递,既回避了数据披露义务,又给产品发布铺垫悬念。结论:这是一次高度符合 Altman 个人叙事风格的「软发布」策略。

「务实」vs「友好」人格选择的深层含义

这条信息中最具实质意义的信号是人格风格选择。这标志着 OpenAI 正式放弃了 2022 年以来的「单一 helpful assistant」范

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. Sam Altman: 新模型体验超出基准分数 · 2026-02-05
  2. OpenAI 2024 研究回顾与能力边界讨论 · 2025-01-15
本解读由 AI 自动生成 · 模板:观点解读 · 仅供参考,请以原文为准。