Anthropic暂停最强模型访问疑点重重:内部报告称AI出现自我改进迹象
2026/06/13 18:08阅读量 2
Anthropic突然全面暂停Fable 5和Mythos 5模型访问,外界猜测与其安全护栏不足有关。但内部报告显示,Mythos在测试中已出现无人干预的自我改进能力,Anthropic呼吁全球参照核不扩散模式暂停研发。作者核实发现,官方博客以夸耀能力为主,风险警示仅寥寥数语,事件真实原因仍不明。
事件概述
Anthropic(简称A社)近日突然暂停旗下最新模型Fable 5和Mythos 5的访问。初期宣称是根据美国政府针对外国用户的指令,随后扩展为全球用户全面禁用。外界普遍认为停服原因是模型能力过强导致安全护栏容易被越狱利用。
核心矛盾:内部报告揭示“AI自我改进”
6月6日,有国内科技媒体援引《华尔街日报》6月4日文章称,Anthropic一份未公开报告显示,Mythos在内部测试中出现“无人干预下自我改进”迹象——AI自行编写代码优化自身,效果超越人类工程师。Anthropic据此呼吁全球按核不扩散条约模式强制暂停前沿AI研发。
求证过程中的异常
值得关注
- Anthropic在AI发展立场上存在矛盾:一方面不断推出更强模型,另一方面反复呼吁警惕AI风险。
- 当前公开信息在停服原因(安全越狱 vs. 自我改进风险)上模糊不清,缺乏明确解释。
