OpenAI工程师揭秘零人类编码实践：严禁手写代码，一天烧不完10亿Token就是失职

2026/06/13 13:38阅读量 4

OpenAI工程师Ryan Lopopolo的团队连续数月禁止手写代码，通过“Harness Engineering”让AI Agent自主完成软件开发全流程，实现人均PR吞吐量从每周3.5个飙升至70个。实践包括零人类代码审查、SPEC驱动开发和高Token消耗理念，推动软件工程师角色从编码转向系统思维。

事件概述

OpenAI工程师Ryan Lopopolo在《AI Native Dev》播客中详细介绍了团队实施的“Harness Engineering”实践，即通过让AI Agent自主完成从需求到PR的全流程，实现零人类手写代码和零人工代码审查。该实践自2025年6月启动，早于GPT-5正式发布，随着模型迭代，团队人均PR吞吐量从每周3.5个飙升至70个。

核心信息

Harness Engineering的概念

Harness Engineering是Prompt Engineering与Context Engineering的结合，核心是将生成高质量代码所需的所有微决策和非功能性需求写入代码库，通过工具调用管理Agent上下文，形成闭环验证确保代码符合质量要求。信息组织方式面向Agent而非人类，需压缩且语义丰富。

零人类手写代码的落地

Ryan在2025年6月提前启动零手写代码实践，初期通过消除重复人工操作逐步建立对Agent的信心。团队扩张时新成员直接适配该模式，无需花费1-3个月吸收团队最佳实践，因为最佳实践已预留在代码库中。随着GPT-5从5.2迭代到5.5，团队人均PR吞吐量从每周3.5个飙升至70个。

零人类代码审查的模式

团队仅保留前置高层设计审查（针对复杂计划、里程碑等任务描述），不再做预合并逐行代码审查。采用合并后异步审计机制：每周五进行“垃圾代码回收”，将人工反馈注入Agent循环，让Agent自主学习避免重复错误。允许错误进入主分支供Agent学习，遵循最小成本修正原则（优先修改提示词，再逐步左移添加规则、审查机制和测试）。

SPEC驱动开发的新形态

传统流程从需求文档到实现，现在转变为先快速生成代码原型，再从中提炼精炼的SPEC。通过三轮Agent循环生成高精度SPEC：先由原始实现生成SPEC，再让新Agent依据SPEC复现系统，最后由裁判Agent对比修正。最终产出可可靠复现系统且保留适配灵活性的SPEC，持久留存的核心从代码变成SPEC。

Codex的能力跃升

Codex的增长来自模型迭代和Agent能力的飞轮效应：GPT-5每一次小版本更新（如5.2到5.3、5.4、5.5）都带来工具调用、通用智能、计算机使用等功能的提升，持续降低落地成本。Ryan对Codex的信任与对人类团队成员一致：交付任务后仅做偶尔检查，相信其可自主交付合格PR。

代码可读性的新分工

代码可读性重心转向面向人类的高层文档（参考文档、接口定义、系统架构图），多数实现细节无需人类关注。仅在“高模糊+高复杂度”场景（如从零构建新系统、大型重构）时，人类才深入介入代码定义结构与接口，具体实现完全交给Agent。

高Token消耗的激进主张

Ryan提出“一天烧不完10亿Token就是失职”，认为模型输出智能量与Token消耗大致线性相关，目标在于推动Agent并行化、规模化应用的有效模式。

工程师角色转型

未来软件工程师的核心技能不再是手写代码，而是系统思维：为团队成功创造条件、预判问题、提升交付速度。Ryan个人时间分配已从50%-70%写代码，转变为仅30%投入高复杂度工作，其余用于产品构思、需求对接和工作排期。编码成本降低后，工程师需更关注用户真实需求，主动决策“不构建什么”。

阅读原文详情