GPT-5.4 支持 100 万 token 上下文和原生计算机操控
Sam Altman 介绍 GPT-5.4 在知识工作和网页搜索方面大幅提升,具备原生计算机操控能力,支持百万 token 上下文,并可在生成过程中实时调整方向。
查看原文OpenAI 发布 GPT-5.4,将上下文窗口推至百万级 Token,并首次实现原生计算机操控能力,标志着 AI 从「对话生成」向「任务执行」的范式跃迁。
产品是什么
GPT-5.4 是 OpenAI 最新旗舰模型,核心突破两点:一是100 万 Token 上下文窗口(约 75 万英文单词或完整代码库),意味着可一次性理解整本书、全部项目代码或长篇对话历史;二是原生计算机操控能力(Computer Use),模型可直接操作浏览器、桌面应用、文件系统,而非依赖第三方 API 桥接。
此外,Sam Altman 提到模型支持「生成过程中实时调整方向」,暗示具备某种程度的动态规划或自我修正机制,能在长任务执行中自适应修正路径,而非一条路走到底。
解决什么问题
现有模型的上下文限制导致长文档分析、代码库级理解、多轮复杂推理必须依赖分块 + 记忆系统,效果折损明显。100 万 Token 让「全量理解」成为可能——比如直接丢进 200 页 PDF 要求综合分析,或让模型在不改写 prompt 的情况下「记住」半年前的对话上下文。
计算机操控能力则解决「AI 最后一公里」问题:此前 AI 能生成代码/指令,但无法自己执行。GPT-5.4 可以打开浏览器、点击按钮、填写表单、读写文件,形成完整的「感知→决策→执行」闭环。
相比前代与竞品
- GPT-5.3 →
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- Sam Altman 推文原文 · 2026-03-05
- Anthropic Claude 3.5 产品页面 · 2026-01-15
- Google Gemini 2.0 发布公告 · 2025-12-10