Anthropic发布Claude Fable 5与Mythos 5:满血版仅限受信用户,安全机制转向模型路由
2026/06/10 06:52阅读量 23
Anthropic推出最强旗舰模型Claude Fable 5(公开版)和Claude Mythos 5(受限版)。Fable 5在SWE-bench Pro等基准上大幅领先,能一天完成5000万行代码迁移、自主打通关《宝可梦》游戏。模型采用分级安全机制:高风险请求自动降级到Opus 4.8而非直接拒绝。API定价降低一半以上,但要求所有流量保留30天。
事件概述
Anthropic正式发布Claude Fable 5和Claude Mythos 5,这是其史上最强旗舰模型。Fable 5面向所有用户但附带安全护栏,Mythos 5为满血版本仅供受信任用户。两者底层模型相同,基础技术指标一致。API定价为每百万输入Token 10美元、输出50美元,相比预览版砍半。
核心能力表现
- 软件工程:SWE-bench Pro得分80.3%(GPT-5.5为58.6%)。在Stripe 5000万行Ruby代码库中,一天完成全库迁移(原需两个多月的工程团队工时)。Frontier Code评测在中等推理强度下得分最高。ViBench端到端前端基准几乎饱和。
- 原生视觉:无需外部脚手架,仅凭原始游戏截图自主打通关《宝可梦·火红版》;在GDPpdf视觉推理基准得分29.8%(Opus 4.8为22.5%,GPT-5.5为24.9%)。
- 长上下文与记忆:在百万级Token长任务中保持专注,接入持久化文件记忆后,在《杀戮尖塔》中的表现提升幅度是Opus 4.8的3倍。Token效率是重点优化方向。
- 金融与逻辑:Hebbia金融基准首次突破90%大关,在量化交易公司IMC和Optiver的测试中几乎拿满权重且输出稳定。
- 前沿科研:Fable 5只用1/3推理Token、36小时产出逼近GPT-5.5四天成果。Mythos 5在生物医药中独立执行完整工作流,设计14个蛋白质靶向复合物,9个进入真实管线;在基因组学中自主设计训练出比Science论文模型小100倍但表现更好的模型。
安全机制:分级模型路由
Fable 5背后挂载独立分类器,检测网络安全攻击、生物化学风险、模型蒸馏三类高风险请求。触发后不直接拒绝,而是自动降级到Claude Opus 4.8回答。超过95%会话不触发降级。Anthropic承认当前护栏偏保守,后续将降低误伤。所有Mythos级模型流量保留30天用于安全监控。
内测体验:人类从“巫师”变为“甲方”
沃顿教授Ethan Mollick测试Fable 5:提交15页复杂项目文档后,模型自主运行9小时,调度多个Agent完成调研、设计、编码、校对,直接交付成品。他比喻此前使用AI像“巫师”需精细操控,现在更像委托“工作室”,人类只需验收。
其他信息
- 窗口期:即日起至6月22日,Pro/Max/Team/企业用户可免费使用Fable 5;6月23日起需购买usage credits。API和按量付费客户不受影响。
