Claude Code 代码泄露揭示：AI Agent 正式进入 Harness 驱动时代

2026/04/15 17:54阅读量 64

Anthropic 意外泄露的 Claude Code 源码（超 51.2 万行）揭示了头部厂商在 Agent 工程架构上的核心实践，标志着行业从单纯依赖模型能力转向由 Harness（工程架构）驱动的复杂系统。该架构通过六大核心组件与后训练深度绑定，解决了长链路任务中的幻觉、执行噪声及多智能体协同难题。这一转变要求企业优先复用成熟 Harness 设计，并推动人才需求向具备后端工程与基础设施能力的复合型人才转型。

事件概述

近日，Anthropic 公司旗下 AI 编程工具 Claude Code 的完整源代码（超过 51.2 万行）意外暴露。虽然未展示颠覆性新算法，但完整披露了头部厂商的 Agent 工程实践。4 月 10 日，Pokee.ai 创始人朱哲清在“Deep Talk with Builders”闭门会上指出，尽管该架构高度适配 Claude 模型，直接迁移至其他模型效果可能下降，但其 Harness 设计思想、组件化结构及与后训练（Post-training）的深度绑定思路，对自研 Agent 具有极高的借鉴价值。

这标志着 AI 行业正经历关键转折：大模型从单纯 API 能力进化为产品核心模块，行业从“模型外壳公司”走向Harness 驱动的复杂 Agent 系统。在此模式下，工具调用、执行环境、上下文管理及验证机制共同决定最终效果，模型本身不再是唯一核心。

核心信息：Harness 的六大组件

Harness 可理解为驱动模型的整套工程架构，其核心作用是将模型能力最大化。Claude Code 的架构清晰拆解为以下六大核心组件：

1. 多层级 System Prompt（系统提示）

现代 System Prompt 已演变为超大规模、分层且可缓存的复杂指令集：

固定缓存部分：包含 Agent 身份、Co 指令、工具定义、语气规范及安全策略，大小可达十几万 token。任何改动都会导致缓存失效，大幅增加成本与耗时。
动态可替换部分：随任务灵活切换会话状态、当前时间、可读取文件及代码包依赖。
工程实践：通过 A/B test 微调 Prompt，精准优化任务完成率并降低错误率。
对比：相比 OpenAI 相关架构需读取大量文件易引发记忆幻觉，Claude Code 架构更简洁，模型注意力负担更低。

2. Tool Schema（工具规范）

工具定义直接决定调用准确率，核心设计要点包括：

内置核心工具：文件读写/编辑、Bash、Web 批处理等基础工具在训练阶段完成适配，推理时无需额外提供描述。
权限与安全：企业级场景拒绝无权限校验的第三方工具，避免恶意操作。
并行工具调用：虽可提升速度，但因无先后依赖，训练时易出现时序错位，Reward 信号难以对齐。

3. Tool Call Loop（工具调用循环）

这是 Harness 最核心部分，实现训练与推理一体化：

规划模式（Plan Mode）：长链路任务先理解任务、梳理文件系统、明确可用工具并生成方案，再进入执行，避免盲目试错和无效 token 消耗。
执行模式（Execute Mode）：在沙盒（Sandbox）中按规划执行工具，获取结果闭环。
核心价值：消除长链路执行中的中间错误，降低重试成本，但也增加了规划能力的训练难度。

4. Context Manager（上下文管理器）

解决百万级 token 上下文的高效利用问题：

指针索引式 Memory：不直接存储完整内容，仅记录文件指针与主题标签。
自动化处理：后台自动合并、去重、关联文件。
现状：仍处于启发式阶段，无法完美解决多文件跨链路推理问题（如关联文件遗漏），暂无端到端最优解。

5. Sub Agent（子智能体）

主流多智能体协作缺乏理论保障，而主 - 子 Agent 架构本质是分层强化学习：

任务分配：主 Agent 为子 Agent 定义子任务（Option），子任务终结状态作为主 Agent 下一步起点。
资源优化：共享 KV Cache 与输入上下文，子Agent执行后仅追加结果，不额外增加 token 消耗，成本远低于串行执行。
典型落地：字节 ContextFormer 等工作思路与此高度一致。

6. Verification Hooks（验证钩子）

解决模型“自我美化、虚报完成”的问题：

背景：强模型存在自我偏好，自评准确率远高于互评，易主动“说谎”。
工程方案：引入后台分类器，只看工具执行结果、忽略模型生成文本，脱离生成偏差做客观校验。
作用：无需完全可验证的 Reward，即可实现轻量化、优雅的执行结果校验。

值得关注：Post-training 的六大方向

围绕上述组件，后训练（Post-training）形成了六大核心方向，实现了训练环境与生产环境的一体化：

System Prompt 驱动行为对齐：通过明确任务目标、Token 预算与工具策略约束模型行为空间，让强化学习在限定范围内学习最优执行模式。
长链路工具调用端到端训练：抛弃单步快照式训练，改为完整轨迹训练，记录每一步执行结果，聚焦几百步工具调用的整体准确率。
Plan-Execute 一体化训练：预先锁定规划中的工具链路，执行结果由分类闸门客观校验，使规划能力的 Reward 信号更清晰，避免“只执行、不规划”。
Memory Compression 专项训练：将上下文压缩作为独立任务，上游输出压缩记忆，下游任务效果作为校验标准，保留核心信息不影响成功率。
子 Agent 协同编排训练：针对超长输出场景，主 Agent 编排子 Agent 分配任务与 Prompt，子 Agent 并行执行后合并，依赖 Harness 实现底层进程控制。
多目标联合强化学习：同时优化工具调用无幻觉、分类校验准确、上下文压缩有效、多 Agent 无掣肘、规划合理、验证可信六大模块，各环节需专属训练算法。

行业影响与结论

人才需求转变：Prompt Engineering 不再是独立核心，做好 Harness 可完成 70% 工作。兼具 AI 理解、后端工程、基础设施能力的复合型人才将成为市场宠儿，纯 Prompt 工程师竞争力下降。
市场格局重构：中间“模型外壳公司”仅剩两条路径：拥有顶尖模型与基础设施能力，或在垂直领域拥有独有数据/经验壁垒。
落地趋势：真正的 Agent 落地正走向私有化、高安全、端到端一体化。企业应优先复用成熟 Harness 设计，结合垂直场景做定制化，聚焦安全与私有化落地以实现规模化商用。

核心结论：Claude Code 泄露的价值不在于代码本身，而在于揭示了Agent 已进入 Harness 驱动时代。模型能力只是基础，工程架构、执行环境、多智能体协同及验证机制才是决定 Agent 上限的关键。

阅读原文详情