OpenAI:Codex 在 macOS 上具备通用电脑使用能力
通过 macOS computer use,Codex 可自行看、点击、输入以操作任意应用,后台运行不占用户桌面,适用于前端迭代、应用测试等无 API 场景。
查看原文OpenAI 发布 Codex macOS 版,让 AI 直接操控电脑操作系统任意应用,后台运行不占桌面,适合前端测试和传统软件自动化场景。这是 Agent 从 API 调用走向操作系统级控制的关键一步。
产品具体是什么
Codex 通过 macOS computer use 功能,让 AI 模型能够像人一样"看"屏幕、理解界面元素,然后执行点击、输入等操作来控制任意应用。它在后台静默运行,不占用用户桌面空间,也不干扰正常操作。这意味着 AI Agent 首次能够绕过 API 直接操控那些没有开放接口的传统桌面软件。
解决什么问题
大量真实工作场景依赖没有 API 的工具——传统 ERP 的操作界面、老旧桌面软件的交互、某些不支持自动化的 Web 应用。开发者过去只能用 Selenium 等工具编写复杂的爬虫脚本,或者干脆靠人工点击来完成任务。Codex 把这个过程自动化了:给定一个任务描述,它就能自动规划步骤、执行操作、验证结果。这对前端迭代和自动化测试尤为有价值——无需为每个应用单独写 API 适配器,AI 直接模拟人类操作流程。
从 API 到 OS 级的跨越
这次发布代表了 AI Agent 能力的重要跃迁:从"调用 API"到"操作系统级控制"。Codex 基于 GPT-4.5 的多模态理解能力,不仅能看懂屏幕内容,还能将 UI 状态转化为可执行的行动计划。这种能力在 Claude Computer Use(Anthropic,2025年10月发布)上已有先例,OpenAI 此番跟进并将能力落地到
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- OpenAI 官方推文 · 2026-04-16
- Anthropic Claude Computer Use 发布公告 · 2025-10-22