Latent Space 2026.04.07

给 1M 行代码 + 0% 人类 review
OpenAI 内部"黑工厂"首次公开

Ryan Lopopolo(OpenAI Frontier 团队、Symphony 项目负责人)与 Latent Space 主播 swyx、Alessio Fanelli 对谈:5 个月、100 万行代码、0 行人类写、0 个 human-reviewed merge,OpenAI 的"Dark Factory"如何重新定义 AI 工程的边界

🎙️ 在 Latent Space 收听本期播客 latent.space/p/harness-eng  ·  1h 12m 点击跳转 →
嘉宾
Ryan Lopopolo
主持
swyx · Alessio Fanelli
时长
1h 12m
频道
Latent Space

OpenAI 内部实验:一套完全由 agent 驱动的开发流水线在 5 个月内写出超过 100 万行代码,其中 0 行由人类直接编写,0 个 merge 经人类 review。内部代号"Dark Factory"——对标制造业"熄灯工厂"的 24×7 无人运行哲学。这不是产品发布,而是一次关于"agent 量产化能走多远"的极限压力测试。

关键数字

1M+
行总代码量
全部 agent 生成
0%
人类写代码
人类 review
5 个月
从 0 到
beta 上线
1B tokens
agent 每日
消耗量

章节索引

00:00开场:OpenAI Dark Factory 是什么
04:30为什么 OpenAI 要做这个实验
11:20Symphony orchestrator 架构
19:50Codex 作为主力执行者
27:10Observability 三层:事件 / 指标 / 状态
34:40Skills & Specs DSL 设计
42:30质量评估:如何确保 1M 行代码不是垃圾
50:00失败案例与 edge case
58:20人类在 loop 的新位置
66:00给外部构建 agent harness 的 5 条建议

六大核心观点

1

Dark Factory:24×7 的 agent 生产线

名字来自制造业"熄灯工厂"——机器在黑暗中不停运转,人类只负责设定目标和处理异常。OpenAI 的目标不是"辅助工程师",而是跑到极限:agent 自举能力的天花板究竟在哪里。

2

Symphony:任务调度 + 多 agent 协作

Symphony 是 Dark Factory 的编排大脑,负责任务拆分、agent 分配、依赖管理和结果聚合。它不是简单的任务队列,而是一个能感知 agent 状态、动态调整执行路径的 orchestrator 层。

3

Observability:0% review 的前提是 100% telemetry

人类不 review 代码,但必须能看到一切。三层可观测性:细粒度事件流、聚合指标仪表盘、全局状态快照。没有这套体系,"0% review"就等于"0% 信任"。

4

Skills & Specs:人类说明书压缩成机器 DSL

把原本写给人类工程师的操作手册——代码规范、架构决策、接口约定——重新编码为 agent 可直接消费的结构化描述语言(DSL)。这是 Dark Factory 规模化的真正基础设施。

5

0% 人类写代码 ≠ 0% 人类参与

人类从"写代码"转移到"设定边界、检查聚合指标、干预极端 case"。就像工厂质检员不生产产品,但负责定义合格标准和拦截异常批次。角色变了,责任没变。

6

1M LOC 的真正意义

体量本身不重要。重要的是"没有任何一个人类知道每一行在做什么"这件事变得可接受了。这是认知范式的迁移:从"理解每行代码"到"信任系统级行为"。