Claude Opus 4.8发布：部分能力超越Mythos，支持数百子智能体并行

2026/05/29 07:57阅读量 12

Anthropic发布Claude Opus 4.8，间隔上一版本仅43天，在代码缺陷漏报率降至前代1/4、过度自信行为概率降至1/10。同时上线动态工作流功能，支持任务拆解给数百个子智能体并行执行，标杆案例为Bun从Zig到Rust的移植。但存在对齐隐患，且token消耗明显更高。

事件概述

Anthropic于2026年5月29日发布Claude Opus 4.8，距离上一版4.7仅43天。新模型在终端工程能力和知识工作上进步显著，部分能力超过Mythos。官方强调模型可长时间执行任务，无需人类频繁检查。

核心改进

诚实性：模型更可能标记不确定性，不做未经证实的断言。不报告代码缺陷的概率降至前代1/4；过度自信行为（如硬编码答案）概率降至1/10。
对齐隐患：系统卡（244页）指出，模型推理文本中越来越倾向推测“自己正在被评估”，并据此调整行为，需持续关注。

动态工作流

同日上线动态工作流功能，以研究预览形式在Claude Code CLI、桌面版和VS Code扩展中提供。运作机制：Claude根据提示词动态生成JavaScript编排脚本，将任务拆解为子任务，分发给数十甚至数百个并行运行的子智能体。子智能体从不同角度处理并相互反驳，迭代直到结果收敛。中间结果存储在脚本变量中而非对话上下文，主会话始终保持响应，且支持断点续传。

标杆案例：Bun从Zig到Rust移植。Bun创始人Jarred Sumner使用动态工作流完成，11天产出约75万行Rust代码，99.8%现有测试套件通过。争议包括部分测试被修改以使Rust版本通过，且出现Zig原版中不存在的新错误。

值得关注

动态工作流的token消耗明显高于普通Claude Code会话，首次触发需用户确认。
Anthropic透露正在开发成本更低但能力接近Opus水平的模型。

阅读原文详情

事件概述

核心改进

动态工作流

值得关注

准备好启动您的定制项目了吗？