智谱GLM-5.2开源上线,编程能力冲入世界前三

2026/06/26 16:52阅读量 2

在Anthropic因美国商务部要求下架最强模型后,智谱同日全量开放GLM-5.2。该模型在Code Arena等编程基准中排名可用的第一,进入Claude、OpenAI组成的编程“御三家”。GLM-5.2拥有1M token长上下文,幻觉率低至28%,且成本比Claude Opus 4.8低72%–82%。它以MIT协议开源,已适配8大国产算力平台。

事件概述

Anthropic 的 Fable 5 和 Mythos 5 模型因美国商务部援引国家安全条款被要求切断外国公民访问,随后 Anthropic 直接对全球用户关停这两款模型。几乎同一时间(5:21),智谱发布公告全量开放其最强模型 GLM-5.2,并宣称“前沿智能属于所有人”。GLM-5.2 以 MIT 协议完全开源,上线首日即完成与华为昇腾、平头哥、摩尔线程、寒武纪等 8 大国产算力平台的全适配。

核心信息

  • 编程能力排名:在 Code Arena(全球百万用户盲测的代码能力评估系统)上,GLM-5.2 以 1595 分排名总榜第二,在所有当前可用模型中为第一。在 FrontierSWE 长程编程基准上得分 74.4,与 Claude Opus 4.8(75.1)差距不到 1 个百分点,超过 GPT-5.5(72.6)。PostTrainBench(Agent 训练能力)上排名第二,仅次于 Opus 4.8。
  • 模型规格:参数量 744B,采用 MoE 架构,活跃参数约 40B。上下文窗口为 1M token,可一次性处理整个项目代码库。智谱官方披露有评测团队让 GLM-5.2 完成全栈应用开发任务,累计处理超 88 万 tokens,最终交付网页端、移动端与小程序的完整应用。
  • 幻觉率:在 AA-Omniscience 基准中,GLM-5.2 的幻觉率为 28%,低于 GPT-5.5(86%)、Claude Opus 4.8(36%)、Fable 5(48%)。
  • 成本:GLM-5.2 输入价格约 1.40 美元/百万 token,输出约 4.40 美元/百万 token;相比 Claude Opus 4.8(输入 5 美元,输出 25 美元)便宜约 72%–82%。摩根大通指出,GLM-5.2 相比前代实际涨价,但用户仍愿意为“完成任务”付费。
  • 局限性:在 SWE-Marathon 基准上得分 13.0(Opus 4.8 为 26.0);不具备多模态能力;推理速度受限于算力,慢于 Opus 4.8。

值得关注

  • 智谱港股市值突破 1 万亿港元,年内涨幅超 1900%,成为首个万亿 AI 公司。
  • 智谱 CEO 唐杰曾反驳马斯克关于中国模型 2027 年达到 Fable 级别的预测,称“不需要那么久”。现在 GLM-5.2 的实际表现印证了这一表态。
  • 该模型的开源策略(MIT 协议)和全栈可用性,使其成为 Claude/OpenAI 之外的另一个可靠选择,尤其适合对供应链自主性有要求的开发者。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。