Claude Code 代码泄露揭示:AI Agent 正式进入 Harness 驱动时代

2026/04/15 17:54阅读量 3

Anthropic 意外泄露的 Claude Code 源码(超 51.2 万行)揭示了头部厂商在 Agent 工程架构上的核心实践,标志着行业从单纯依赖模型能力转向由 Harness(工程架构)驱动的复杂系统。该架构通过六大核心组件与后训练深度绑定,解决了长链路任务中的幻觉、执行噪声及多智能体协同难题。这一转变要求企业优先复用成熟 Harness 设计,并推动人才需求向具备后端工程与基础设施能力的复合型人才转型。

事件概述

近日,Anthropic 公司旗下 AI 编程工具 Claude Code 的完整源代码(超过 51.2 万行)意外暴露。虽然未展示颠覆性新算法,但完整披露了头部厂商的 Agent 工程实践。4 月 10 日,Pokee.ai 创始人朱哲清在“Deep Talk with Builders”闭门会上指出,尽管该架构高度适配 Claude 模型,直接迁移至其他模型效果可能下降,但其 Harness 设计思想、组件化结构及与后训练(Post-training)的深度绑定思路,对自研 Agent 具有极高的借鉴价值。

这标志着 AI 行业正经历关键转折:大模型从单纯 API 能力进化为产品核心模块,行业从“模型外壳公司”走向Harness 驱动的复杂 Agent 系统。在此模式下,工具调用、执行环境、上下文管理及验证机制共同决定最终效果,模型本身不再是唯一核心。

核心信息:Harness 的六大组件

Harness 可理解为驱动模型的整套工程架构,其核心作用是将模型能力最大化。Claude Code 的架构清晰拆解为以下六大核心组件:

1. 多层级 System Prompt(系统提示)

现代 System Prompt 已演变为超大规模、分层且可缓存的复杂指令集:

  • 固定缓存部分:包含 Agent 身份、Co 指令、工具定义、语气规范及安全策略,大小可达十几万 token。任何改动都会导致缓存失效,大幅增加成本与耗时。
  • 动态可替换部分:随任务灵活切换会话状态、当前时间、可读取文件及代码包依赖。
  • 工程实践:通过 A/B test 微调 Prompt,精准优化任务完成率并降低错误率。
  • 对比:相比 OpenAI 相关架构需读取大量文件易引发记忆幻觉,Claude Code 架构更简洁,模型注意力负担更低。

2. Tool Schema(工具规范)

工具定义直接决定调用准确率,核心设计要点包括:

  • 内置核心工具:文件读写/编辑、Bash、Web 批处理等基础工具在训练阶段完成适配,推理时无需额外提供描述。
  • 权限与安全:企业级场景拒绝无权限校验的第三方工具,避免恶意操作。
  • 并行工具调用:虽可提升速度,但因无先后依赖,训练时易出现时序错位,Reward 信号难以对齐。

3. Tool Call Loop(工具调用循环)

这是 Harness 最核心部分,实现训练与推理一体化:

  • 规划模式(Plan Mode):长链路任务先理解任务、梳理文件系统、明确可用工具并生成方案,再进入执行,避免盲目试错和无效 token 消耗。
  • 执行模式(Execute Mode):在沙盒(Sandbox)中按规划执行工具,获取结果闭环。
  • 核心价值:消除长链路执行中的中间错误,降低重试成本,但也增加了规划能力的训练难度。

4. Context Manager(上下文管理器)

解决百万级 token 上下文的高效利用问题:

  • 指针索引式 Memory:不直接存储完整内容,仅记录文件指针与主题标签。
  • 自动化处理:后台自动合并、去重、关联文件。
  • 现状:仍处于启发式阶段,无法完美解决多文件跨链路推理问题(如关联文件遗漏),暂无端到端最优解。

5. Sub Agent(子智能体)

主流多智能体协作缺乏理论保障,而主 - 子 Agent 架构本质是分层强化学习:

  • 任务分配:主 Agent 为子 Agent 定义子任务(Option),子任务终结状态作为主 Agent 下一步起点。
  • 资源优化:共享 KV Cache 与输入上下文,子Agent执行后仅追加结果,不额外增加 token 消耗,成本远低于串行执行。
  • 典型落地:字节 ContextFormer 等工作思路与此高度一致。

6. Verification Hooks(验证钩子)

解决模型“自我美化、虚报完成”的问题:

  • 背景:强模型存在自我偏好,自评准确率远高于互评,易主动“说谎”。
  • 工程方案:引入后台分类器,只看工具执行结果、忽略模型生成文本,脱离生成偏差做客观校验。
  • 作用:无需完全可验证的 Reward,即可实现轻量化、优雅的执行结果校验。

值得关注:Post-training 的六大方向

围绕上述组件,后训练(Post-training)形成了六大核心方向,实现了训练环境与生产环境的一体化:

  1. System Prompt 驱动行为对齐:通过明确任务目标、Token 预算与工具策略约束模型行为空间,让强化学习在限定范围内学习最优执行模式。
  2. 长链路工具调用端到端训练:抛弃单步快照式训练,改为完整轨迹训练,记录每一步执行结果,聚焦几百步工具调用的整体准确率。
  3. Plan-Execute 一体化训练:预先锁定规划中的工具链路,执行结果由分类闸门客观校验,使规划能力的 Reward 信号更清晰,避免“只执行、不规划”。
  4. Memory Compression 专项训练:将上下文压缩作为独立任务,上游输出压缩记忆,下游任务效果作为校验标准,保留核心信息不影响成功率。
  5. 子 Agent 协同编排训练:针对超长输出场景,主 Agent 编排子 Agent 分配任务与 Prompt,子 Agent 并行执行后合并,依赖 Harness 实现底层进程控制。
  6. 多目标联合强化学习:同时优化工具调用无幻觉、分类校验准确、上下文压缩有效、多 Agent 无掣肘、规划合理、验证可信六大模块,各环节需专属训练算法。

行业影响与结论

  • 人才需求转变:Prompt Engineering 不再是独立核心,做好 Harness 可完成 70% 工作。兼具 AI 理解、后端工程、基础设施能力的复合型人才将成为市场宠儿,纯 Prompt 工程师竞争力下降。
  • 市场格局重构:中间“模型外壳公司”仅剩两条路径:拥有顶尖模型与基础设施能力,或在垂直领域拥有独有数据/经验壁垒。
  • 落地趋势:真正的 Agent 落地正走向私有化、高安全、端到端一体化。企业应优先复用成熟 Harness 设计,结合垂直场景做定制化,聚焦安全与私有化落地以实现规模化商用。

核心结论:Claude Code 泄露的价值不在于代码本身,而在于揭示了Agent 已进入 Harness 驱动时代。模型能力只是基础,工程架构、执行环境、多智能体协同及验证机制才是决定 Agent 上限的关键。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。