Claude Mythos模型疑似采用字节Seed循环架构,图搜索能力呈异常尖峰

2026/04/13 13:41阅读量 3

Anthropic发布的Mythos模型在广度优先图搜索(GraphWalks BFS)测试中表现远超GPT-5.4等竞品,引发业界对其是否采用字节Seed团队提出的LoopLM循环语言模型架构的猜测。该模型在网络安全漏洞挖掘等依赖图遍历的任务上优势显著,且推理速度虽慢但Token消耗极低,符合循环模型“潜空间迭代”的特征。尽管Anthropic未公开架构细节,但数据异常指向了非Scaling Law驱动的架构创新。

事件概述

社区近期热议Anthropic推出的Mythos模型,其部分性能表现被质疑可能采用了源自字节Seed团队与多所高校合作论文中的**LoopLM(循环语言模型)**架构。该理论框架由Yoshua Bengio参与提出,核心在于通过模型内部潜空间的多次迭代而非单纯增加参数来提升推理能力。

核心证据:异常的性能尖峰

Mythos在多项基准测试中展现出与传统Transformer架构不符的特性,主要集中在以下三个维度:

  1. 图搜索任务碾压级优势

    • GraphWalks BFS(广度优先图搜索)测试中,Mythos得分高达80%,而对比模型GPT-5.4仅为21.4%,差距接近4倍。
    • 在其他通用任务上,Mythos并未出现如此巨大的分差。这种特定领域的“异常尖峰”表明其进步并非来自通用的Scaling Law(规模定律),而是源于针对图算法的架构归纳偏置。
  2. Token消耗与速度的矛盾

    • Anthropic数据显示,Mythos完成每个任务所需的Token数量仅为Opus 4.6的1/5,但其生成速度反而更慢,且价格贵出5倍。
    • 在标准Transformer框架下,Token减少通常意味着步骤减少和速度提升。这一反常现象可用循环模型解释:计算过程发生在不可见的潜空间迭代中,而非显式的Token生成层面。
  3. 网络安全与图遍历能力

    • 在CyberGym测试中,Mythos得分83.1%,领先Opus 4.6近17个百分点。
    • 该模型成功发现上千个零日漏洞,覆盖主流操作系统和浏览器。漏洞挖掘本质上是控制流图的可达性问题(即图遍历),这正是循环架构的天然强项。

技术背景:LoopLM循环语言模型

字节Seed团队提出的LoopLM架构具有以下关键特征,与Mythos的表现高度吻合:

  • 潜空间迭代:不通过输出长文本进行思考,而是在模型内部对同一组信息进行多轮反复计算。
  • 自适应深度:简单问题少迭代,复杂问题自动增加迭代步数。
  • 知识操作 vs 知识存储:循环模型并未增加知识库容量(约每参数2bits),但极大提升了“知识操作”能力(如多跳推理、程序执行、图搜索)。实验显示,1.4B参数的Ouro系列循环模型性能可对标4B传统模型,2.8B版本相当于8B–12B传统模型。

结论与展望

尽管Anthropic尚未公开Mythos的具体架构细节,且未来可能也不会披露,但现有测试数据强烈暗示其采用了类似循环语言的架构创新。正如行业观察所言:“Scaling Law带来均匀改善,而架构创新则在匹配其归纳偏置的任务上创造异常尖峰。”Mythos在图遍历任务上的爆发式增长,恰好印证了这一理论。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。