Latent Space 2026.04.07

给 1M 行代码 + 0% 人类 review
OpenAI 内部"黑工厂"首次公开

Ryan Lopopolo（OpenAI Frontier 团队、Symphony 项目负责人）与 Latent Space 主播 swyx、Alessio Fanelli 对谈：5 个月、100 万行代码、0 行人类写、0 个 human-reviewed merge，OpenAI 的"Dark Factory"如何重新定义 AI 工程的边界

OpenAI 内部实验：一套完全由 agent 驱动的开发流水线在 5 个月内写出超过 100 万行代码，其中 0 行由人类直接编写，0 个 merge 经人类 review。内部代号"Dark Factory"——对标制造业"熄灯工厂"的 24×7 无人运行哲学。这不是产品发布，而是一次关于"agent 量产化能走多远"的极限压力测试。

关键数字

章节索引

00:00开场：OpenAI Dark Factory 是什么

04:30为什么 OpenAI 要做这个实验

11:20Symphony orchestrator 架构

19:50Codex 作为主力执行者

27:10Observability 三层：事件 / 指标 / 状态

34:40Skills & Specs DSL 设计

42:30质量评估：如何确保 1M 行代码不是垃圾

50:00失败案例与 edge case

58:20人类在 loop 的新位置

66:00给外部构建 agent harness 的 5 条建议

六大核心观点

Dark Factory：24×7 的 agent 生产线

名字来自制造业"熄灯工厂"——机器在黑暗中不停运转，人类只负责设定目标和处理异常。OpenAI 的目标不是"辅助工程师"，而是跑到极限：agent 自举能力的天花板究竟在哪里。

Symphony：任务调度 + 多 agent 协作

Symphony 是 Dark Factory 的编排大脑，负责任务拆分、agent 分配、依赖管理和结果聚合。它不是简单的任务队列，而是一个能感知 agent 状态、动态调整执行路径的 orchestrator 层。

Observability：0% review 的前提是 100% telemetry

人类不 review 代码，但必须能看到一切。三层可观测性：细粒度事件流、聚合指标仪表盘、全局状态快照。没有这套体系，"0% review"就等于"0% 信任"。

Skills & Specs：人类说明书压缩成机器 DSL

把原本写给人类工程师的操作手册——代码规范、架构决策、接口约定——重新编码为 agent 可直接消费的结构化描述语言（DSL）。这是 Dark Factory 规模化的真正基础设施。

0% 人类写代码 ≠ 0% 人类参与

人类从"写代码"转移到"设定边界、检查聚合指标、干预极端 case"。就像工厂质检员不生产产品，但负责定义合格标准和拦截异常批次。角色变了，责任没变。

1M LOC 的真正意义

体量本身不重要。重要的是"没有任何一个人类知道每一行在做什么"这件事变得可接受了。这是认知范式的迁移：从"理解每行代码"到"信任系统级行为"。

给 1M 行代码 + 0% 人类 reviewOpenAI 内部"黑工厂"首次公开