Claude Fable 5 实测:能力登顶但计费模式巨变,普通用户需谨慎

2026/06/10 14:31阅读量 18

Anthropic 发布 Claude Fable 5 和 Mythos 5,前者能力创纪录,在软件工程、知识工作等测试中大幅领先,但仅免费至 6 月 22 日,之后将转为按 token 计费。高强度长任务虽强,但 token 成本高昂,可能重新拉开普通用户与先进 AI 的距离。

事件概述

Anthropic 推出 Claude Fable 5(面向公众)和 Claude Mythos 5(面向网络安全防御等机构)。Fable 5 能力在多项基准测试中创下新高,但采用新的定价和安全策略,免费窗口期结束后转为消耗 usage credits 计费。

核心能力与性能

  • 软件工程:Stripe 早期测试中,Fable 5 在一天内完成 5000 万行 Ruby 代码库的迁移任务,原计划需两个多月。Cognition FrontierCode 测试在复杂生产级代码任务中领先。
  • 知识工作:在 Hebbia 金融基准测试中获最高分,IMC 交易分析评测在事实检索、推理等方面表现强。
  • 视觉能力:能从复杂科学图表提取精确数字,根据网页截图重建应用源码。无需额外工具完成《宝可梦火红》游戏。
  • 长上下文与记忆:在《杀戮尖塔》测试中,持久化文件记忆使表现提升幅度达 Opus 4.8 的三倍。
  • 生命科学:Mythos 5 将部分药物设计流程加速约 10 倍;14 个蛋白靶点中 9 个产生值得研究的候选方案。

定价与计费模式变化

  • Fable 5 和 Mythos 5 价格相同:每百万输入 token 10 美元,每百万输出 token 50 美元,低于 Mythos Preview 一半。
  • 免费包含期:即日起至 6 月 22 日,Pro、Max、Team、Enterprise 计划含 Fable 5。6 月 23 日移出,继续使用需消耗 usage credits。
  • 高强度长任务虽强,但 token 消耗极高,实际成本可能成为最大挑战。

安全限制

  • Fable 5 配备新安全分类器,涉及网络安全、生物、化学、模型蒸馏等高风险的请求自动回退到 Opus 4.8 响应。早期数据显示超 95% 会话不触发。
  • 针对前沿大模型开发加入隐藏保护(通过提示词修改、steering vectors 等降低性能),不提示用户。

实测亮点与局限

  • 成功识别 6 根手指,完成高考作文、复杂可视化(小行星轨道、健身度假村规划)、游戏(宝可梦火红)等任务。
  • 沃顿商学院教授 Ethan Mollick 测试:Fable 5 能自主构建等时线地图、开发研究工具 Concord(连续工作 9.5 小时),但仍存在错误和遗漏,需人工检查。
  • 成本问题:Pro 用户简单跑几个任务即用完额度。

趋势点评

前沿模型越强,训练和推理成本越高。订阅制模糊真实成本,而 token 计费将 AI 变成按量消耗的生产资料。普通用户与先进生产力之间的信息差可能因昂贵的 token 而重新拉开。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。