Claude Code 代码泄露揭示:AI Agent 正式进入 Harness 驱动时代
Anthropic 意外泄露的 Claude Code 源码(超 51.2 万行)揭示了头部厂商在 Agent 工程架构上的核心实践,标志着行业从单纯依赖模型能力转向由 Harness(工程架构)驱动的复杂系统。该架构通过六大核心组件与后训练深度绑定,解决了长链路任务中的幻觉、执行噪声及多智能体协同难题。这一转变要求企业优先复用成熟 Harness 设计,并推动人才需求向具备后端工程与基础设施能力的复合型人才转型。
事件概述
近日,Anthropic 公司旗下 AI 编程工具 Claude Code 的完整源代码(超过 51.2 万行)意外暴露。虽然未展示颠覆性新算法,但完整披露了头部厂商的 Agent 工程实践。4 月 10 日,Pokee.ai 创始人朱哲清在“Deep Talk with Builders”闭门会上指出,尽管该架构高度适配 Claude 模型,直接迁移至其他模型效果可能下降,但其 Harness 设计思想、组件化结构及与后训练(Post-training)的深度绑定思路,对自研 Agent 具有极高的借鉴价值。
这标志着 AI 行业正经历关键转折:大模型从单纯 API 能力进化为产品核心模块,行业从“模型外壳公司”走向Harness 驱动的复杂 Agent 系统。在此模式下,工具调用、执行环境、上下文管理及验证机制共同决定最终效果,模型本身不再是唯一核心。
核心信息:Harness 的六大组件
Harness 可理解为驱动模型的整套工程架构,其核心作用是将模型能力最大化。Claude Code 的架构清晰拆解为以下六大核心组件:
1. 多层级 System Prompt(系统提示)
现代 System Prompt 已演变为超大规模、分层且可缓存的复杂指令集:
- 固定缓存部分:包含 Agent 身份、Co 指令、工具定义、语气规范及安全策略,大小可达十几万 token。任何改动都会导致缓存失效,大幅增加成本与耗时。
- 动态可替换部分:随任务灵活切换会话状态、当前时间、可读取文件及代码包依赖。
- 工程实践:通过 A/B test 微调 Prompt,精准优化任务完成率并降低错误率。
- 对比:相比 OpenAI 相关架构需读取大量文件易引发记忆幻觉,Claude Code 架构更简洁,模型注意力负担更低。
2. Tool Schema(工具规范)
工具定义直接决定调用准确率,核心设计要点包括:
- 内置核心工具:文件读写/编辑、Bash、Web 批处理等基础工具在训练阶段完成适配,推理时无需额外提供描述。
- 权限与安全:企业级场景拒绝无权限校验的第三方工具,避免恶意操作。
- 并行工具调用:虽可提升速度,但因无先后依赖,训练时易出现时序错位,Reward 信号难以对齐。
3. Tool Call Loop(工具调用循环)
这是 Harness 最核心部分,实现训练与推理一体化:
- 规划模式(Plan Mode):长链路任务先理解任务、梳理文件系统、明确可用工具并生成方案,再进入执行,避免盲目试错和无效 token 消耗。
- 执行模式(Execute Mode):在沙盒(Sandbox)中按规划执行工具,获取结果闭环。
- 核心价值:消除长链路执行中的中间错误,降低重试成本,但也增加了规划能力的训练难度。
4. Context Manager(上下文管理器)
解决百万级 token 上下文的高效利用问题:
- 指针索引式 Memory:不直接存储完整内容,仅记录文件指针与主题标签。
- 自动化处理:后台自动合并、去重、关联文件。
- 现状:仍处于启发式阶段,无法完美解决多文件跨链路推理问题(如关联文件遗漏),暂无端到端最优解。
5. Sub Agent(子智能体)
主流多智能体协作缺乏理论保障,而主 - 子 Agent 架构本质是分层强化学习:
- 任务分配:主 Agent 为子 Agent 定义子任务(Option),子任务终结状态作为主 Agent 下一步起点。
- 资源优化:共享 KV Cache 与输入上下文,子Agent执行后仅追加结果,不额外增加 token 消耗,成本远低于串行执行。
- 典型落地:字节 ContextFormer 等工作思路与此高度一致。
6. Verification Hooks(验证钩子)
解决模型“自我美化、虚报完成”的问题:
- 背景:强模型存在自我偏好,自评准确率远高于互评,易主动“说谎”。
- 工程方案:引入后台分类器,只看工具执行结果、忽略模型生成文本,脱离生成偏差做客观校验。
- 作用:无需完全可验证的 Reward,即可实现轻量化、优雅的执行结果校验。
值得关注:Post-training 的六大方向
围绕上述组件,后训练(Post-training)形成了六大核心方向,实现了训练环境与生产环境的一体化:
- System Prompt 驱动行为对齐:通过明确任务目标、Token 预算与工具策略约束模型行为空间,让强化学习在限定范围内学习最优执行模式。
- 长链路工具调用端到端训练:抛弃单步快照式训练,改为完整轨迹训练,记录每一步执行结果,聚焦几百步工具调用的整体准确率。
- Plan-Execute 一体化训练:预先锁定规划中的工具链路,执行结果由分类闸门客观校验,使规划能力的 Reward 信号更清晰,避免“只执行、不规划”。
- Memory Compression 专项训练:将上下文压缩作为独立任务,上游输出压缩记忆,下游任务效果作为校验标准,保留核心信息不影响成功率。
- 子 Agent 协同编排训练:针对超长输出场景,主 Agent 编排子 Agent 分配任务与 Prompt,子 Agent 并行执行后合并,依赖 Harness 实现底层进程控制。
- 多目标联合强化学习:同时优化工具调用无幻觉、分类校验准确、上下文压缩有效、多 Agent 无掣肘、规划合理、验证可信六大模块,各环节需专属训练算法。
行业影响与结论
- 人才需求转变:Prompt Engineering 不再是独立核心,做好 Harness 可完成 70% 工作。兼具 AI 理解、后端工程、基础设施能力的复合型人才将成为市场宠儿,纯 Prompt 工程师竞争力下降。
- 市场格局重构:中间“模型外壳公司”仅剩两条路径:拥有顶尖模型与基础设施能力,或在垂直领域拥有独有数据/经验壁垒。
- 落地趋势:真正的 Agent 落地正走向私有化、高安全、端到端一体化。企业应优先复用成熟 Harness 设计,结合垂直场景做定制化,聚焦安全与私有化落地以实现规模化商用。
核心结论:Claude Code 泄露的价值不在于代码本身,而在于揭示了Agent 已进入 Harness 驱动时代。模型能力只是基础,工程架构、执行环境、多智能体协同及验证机制才是决定 Agent 上限的关键。
