← 返回资讯
产品发布 @OpenAI 2026-04-16

OpenAI:Codex 在 macOS 上具备通用电脑使用能力

通过 macOS computer use,Codex 可自行看、点击、输入以操作任意应用,后台运行不占用户桌面,适用于前端迭代、应用测试等无 API 场景。

查看原文
TL;DR · 产品解读

OpenAI 发布 Codex macOS 版,让 AI 直接操控电脑操作系统任意应用,后台运行不占桌面,适合前端测试和传统软件自动化场景。这是 Agent 从 API 调用走向操作系统级控制的关键一步。

深度解读

产品具体是什么

Codex 通过 macOS computer use 功能,让 AI 模型能够像人一样"看"屏幕、理解界面元素,然后执行点击、输入等操作来控制任意应用。它在后台静默运行,不占用用户桌面空间,也不干扰正常操作。这意味着 AI Agent 首次能够绕过 API 直接操控那些没有开放接口的传统桌面软件。

解决什么问题

大量真实工作场景依赖没有 API 的工具——传统 ERP 的操作界面、老旧桌面软件的交互、某些不支持自动化的 Web 应用。开发者过去只能用 Selenium 等工具编写复杂的爬虫脚本,或者干脆靠人工点击来完成任务。Codex 把这个过程自动化了:给定一个任务描述,它就能自动规划步骤、执行操作、验证结果。这对前端迭代和自动化测试尤为有价值——无需为每个应用单独写 API 适配器,AI 直接模拟人类操作流程。

从 API 到 OS 级的跨越

这次发布代表了 AI Agent 能力的重要跃迁:从"调用 API"到"操作系统级控制"。Codex 基于 GPT-4.5 的多模态理解能力,不仅能看懂屏幕内容,还能将 UI 状态转化为可执行的行动计划。这种能力在 Claude Computer Use(Anthropic,2025年10月发布)上已有先例,OpenAI 此番跟进并将能力落地到

未登录访客
SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示?联系反馈

参考来源
  1. OpenAI 官方推文 · 2026-04-16
  2. Anthropic Claude Computer Use 发布公告 · 2025-10-22
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。