← 返回资讯
产品发布 @sama 2026-03-05

GPT-5.4 支持 100 万 token 上下文和原生计算机操控

Sam Altman 介绍 GPT-5.4 在知识工作和网页搜索方面大幅提升,具备原生计算机操控能力,支持百万 token 上下文,并可在生成过程中实时调整方向。

查看原文
TL;DR · 产品解读

OpenAI 发布 GPT-5.4,将上下文窗口推至百万级 Token,并首次实现原生计算机操控能力,标志着 AI 从「对话生成」向「任务执行」的范式跃迁。

深度解读

产品是什么

GPT-5.4 是 OpenAI 最新旗舰模型,核心突破两点:一是100 万 Token 上下文窗口(约 75 万英文单词或完整代码库),意味着可一次性理解整本书、全部项目代码或长篇对话历史;二是原生计算机操控能力(Computer Use),模型可直接操作浏览器、桌面应用、文件系统,而非依赖第三方 API 桥接。

此外,Sam Altman 提到模型支持「生成过程中实时调整方向」,暗示具备某种程度的动态规划或自我修正机制,能在长任务执行中自适应修正路径,而非一条路走到底。

解决什么问题

现有模型的上下文限制导致长文档分析、代码库级理解、多轮复杂推理必须依赖分块 + 记忆系统,效果折损明显。100 万 Token 让「全量理解」成为可能——比如直接丢进 200 页 PDF 要求综合分析,或让模型在不改写 prompt 的情况下「记住」半年前的对话上下文。

计算机操控能力则解决「AI 最后一公里」问题:此前 AI 能生成代码/指令,但无法自己执行。GPT-5.4 可以打开浏览器、点击按钮、填写表单、读写文件,形成完整的「感知→决策→执行」闭环。

相比前代与竞品

参考来源
  1. Sam Altman 推文原文 · 2026-03-05
  2. Anthropic Claude 3.5 产品页面 · 2026-01-15
  3. Google Gemini 2.0 发布公告 · 2025-12-10
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。