Anthropic新模型Mythos因配置失误泄露:性能超越Opus但存在安全隐忧
Anthropic因第三方CMS配置错误导致近3000份内部文件公开,意外泄露了代号为Mythos的新一代大模型信息。该模型被描述为比现有旗舰Opus 4.6更强大,在编程、推理及网络安全测试中表现显著,但同时也具备远超当前防御水平的网络攻击能力。出于安全考量,Anthropic已关闭访问权限并推迟公众发布,优先向安全机构开放内测以修补潜在漏洞。
事件概述
Anthropic近期因内容管理系统(CMS)配置失误,导致约3000份未发布的内部资产(含草稿博客文章、员工休假信息及会议详情)被公开置于可搜索的数据缓存中。尽管官方随后迅速关闭了访问权限,但泄露内容中关于其下一代最强模型的详细信息已被外界获取。
核心信息:Mythos模型特性
- 定位与层级:新模型被命名为Mythos(内部代号可能为Capybara),定位为Anthropic产品线中位于Haiku、Sonnet、Opus之后的第四层级,是迄今为止该公司开发的最强大AI模型。
- 性能突破:相比当前的旗舰模型Opus 4.6,Mythos在软件编程、学术推理和网络安全测试中的得分均有显著提高,被官方称为“AI性能的跃迁”。
- 成本与访问:该模型运行成本和订阅价格更高,目前仅向少数早期客户开放内测,尚未正式对公众推出。
安全隐忧与发布策略
- 攻击能力风险:泄露文档指出,Mythos在网络攻防领域的能力远超其他AI模型,甚至可能以防御者无法应对的方式利用漏洞。若被恶意黑客获取,可能引发规模空前的自动化网络攻击。
- 防御滞后担忧:鉴于同期Opus 4.6已能发现生产代码库中的未知漏洞,Anthropic担心Mythos的攻击能力将彻底跑赢防御水平。
- 谨慎发布计划:为评估风险并提前修补漏洞,Anthropic决定推迟公众发布,转而优先向网络安全机构开放早期访问权限,使其能利用该模型加固自身系统,防止未来被大规模滥用。
事故原因分析
此次泄露源于使用的第三方CMS工具默认设置将上传文件公开,需手动修改为私密状态。由于人为疏忽,包括新模型草稿在内的敏感文件未被及时保护,最终被《财富》杂志等媒体发现并报道。
