上周 AI News 观察：模型公司开始争夺工作流，而不是只争参数

本周判断

一句话结论：2026 年 5 月 18 日到 5 月 24 日这一周，AI 行业的主线不是 Google I/O 的发布密度，而是模型公司开始把能力落到 开发者工作流、企业算力承诺、Agent 安全边界、内容溯源、机器人与物理世界执行 这些更难替代的位置。

如果只看新闻标题，这一周会显得非常分散：Google 发 I/O，OpenAI 谈数学突破和 YC token 投资，Anthropic 收购 Stainless 并更新 Managed Agents，Cursor 发 Composer 2.5 和 SDK，xAI 推 Grok / OpenCode，Figure、Unitree、Boston Dynamics 连续展示机器人进展。

但把这些线索放在一起看，真正的变化是：

AI 公司不再满足于“模型被调用”，而是在争夺用户每天工作的控制面。

过去一年，模型竞争的关键问题是“谁更聪明”。上周更像一个拐点：关键问题变成“谁能进入真实流程，长期拿到上下文、权限、预算和反馈”。

这篇周报不做发布会流水账，而按 A站更关心的四条线拆解：

Coding Agent 从 IDE 辅助变成工程执行层；
企业 AI 从 API 调用变成算力和预算承诺；
Agent 基础设施从 demo 变成安全、SDK、MCP、沙箱；
内容溯源和机器人进展开始进入“可运营”的现实世界。

关键结论

Coding Agent 是上周最明确的主线。 Cursor Composer 2.5、Cursor SDK、Codex /goal、Claude Code /side、Grok 接入 OpenCode、Replit + Squidler AI QA，指向同一件事：代码工具正在从“帮你补全”升级为“承接任务、运行测试、修复反馈”的执行系统。^{[1][2][3][4][5][6]}
模型公司正在争夺企业预算的确定性。 OpenAI 推 Guaranteed Capacity，Sam Altman 公开谈 1-3 年承诺折扣 token，OpenAI 又以 token / credits 方式进入 YC 公司融资结构。算力、token、股权和客户锁定开始混在一起。^[7][8][9]
Agent infra 的竞争点从“接工具”变成“谁控制安全边界”。 Anthropic 收购 Stainless，增强 SDK 与 MCP server tooling；Claude Managed Agents 推自托管沙箱与 MCP tunnels；Perplexity 开源 Bumblebee 扫描开发机供应链与 AI 配置风险。Agent 要进企业，就必须回答凭证、网络、审计、隔离和供应链问题。^[10][11][12]
Google I/O 有信息量，但不适合作为 A站主流量抓手。 Gemini、SynthID、Project Genie、Gemini for Science 都重要，但同质化报道太多。A站更适合写“实际公布 vs 开发者真实可用性”“哪些能力进入 Agent 工作流”“哪些只是发布会 demo”。^[13][14][15]
机器人与物理世界不是噪音，而是长期线索。 Figure 连续多日直播自主分拣，Unitree 展示语音驱动动作生成，Boston Dynamics 展示 Atlas 搬运重物。它们还不是短期流量中心，但会持续影响“Agent 从软件执行到物理执行”的判断。^[16][17][18]

§ 1 Coding Agent：本周真正的高密度战场