B端AI落地真正需要的,不是更聪明的Agent
Claude Code发布的动态工作流(Dynamic Workflows)展示出Agent能力大幅提升,但B端企业真正关心的不是模型有多聪明,而是系统的稳定性、容错边界和可追溯性。实际案例表明,同一Agent在搜索、筛选环节容错率高,而涉及报价、付款等高风险动作时错误不可逆。企业更愿意为可控制、可回滚、可审责的系统付费,而非单纯追求“去人化”。应将业务流程拆分为确定性规则(代码/工作流)、模糊判断(Agent)和高风险动作(审批/日志/回滚)三层,用不同机制约束。
事件概述
Anthropic 旗下 Claude Code 发布了动态工作流(Dynamic Workflows),打破了传统“Agent vs Workflow”的对立。Bun 创始人 Jarred Sumner 利用该功能将约 75 万行代码从 Zig 迁移到 Rust,从第一次提交到合并仅用 11 天,测试通过率达 99.8%。这一案例重新点燃了业界对工作流的热情,但也引发了对 B 端落地核心问题的反思。
核心信息
真正的问题:可控性与容错率
企业愿意为系统付费,不是因为它能“省几个人”,而是因为它能让错误更少、流程可复制、出问题时有迹可循。靠模型变聪明无法解决容错边界问题,工作流的价值在于让每一层的容错边界变得清晰:任务走到哪、哪一步出错、谁批准了最终动作、能否撤回。
三条层的业务拆解
将生产级 AI 流程拆为三层:
- 确定性规则(代码/工作流):数据库查询、字段校验、金额计算、权限判断等应当用明确条件写死,不交由模型猜测。
- 模糊判断(Agent):客户意图理解、非结构化文档读取、信息搜索与方案生成 —— 这些路径难以提前固定,才是 Agent 的用武之地。
- 高风险动作(审批、日志、回滚):发送、付款、退款、删除、修改线上配置等操作,执行前要有卡点,执行后要有记录,错误要有恢复路径。
Dynamic Workflows 把 Agent 的上限抬高了,同时也放大了风险 —— 数百个 Agent 并行工作带来更高 Token 消耗、更多工具调用和更大的错误扩散范围。Anthropic 在产品中保留了执行前确认和管理员禁用能力,说明能力越强越不能绕开权限和责任。
工具选择的核心逻辑
- 简单定时任务(拉数据、分类、写入表格)直接用 Python/TypeScript 即可,无需搭建 Agent 平台。
- 流程清晰、需连接多个 SaaS、运营人员参与调整时,使用 n8n、Dify、Coze、Zapier、Make 等可视化工具;但流程图过长时应警惕维护成本。
- 任务需运行数小时甚至数天,有复杂分支、并行和人工介入时,考虑 LangGraph 或定制状态机,关键在于断点恢复、测试、版本管理和失败处理。
- 仅在目标明确但路径无法提前写死时,Claude Code 和 Dynamic Workflows 这类交互式 Agent 才显出优势,适合研发、安全审计和大规模迁移,但不会因能并行调度数百个 Agent 就自动获得生产系统的信任。
选择工具前应回答四个问题:这件事能否提前写清楚?模型犯错会造成多少损失?结果能否用规则或测试验证?出问题能否停下并改回?答不上来,选哪个框架都只是提前购买安心。
值得关注
B 端 AI 落地的终局不是模型最聪明,而是系统出问题后能找到原因、能停止、能恢复。Agent 可以继续处理不确定性,但企业必须把这种不确定的智能放进确定的责任边界里。
