AI 2.0 时代:智谱、Kimi、MiniMax 如何从“ICU”突围成为行业新三强

2026/04/09 19:11阅读量 2

在 Anthropic 收紧 API 访问及 OpenClaw 推动 Agent 爆发式 Token 消耗的背景下,智谱、月之暗面(Kimi)和 MiniMax 凭借模型能力突破与体系化创新实现商业化逆转。这三家公司通过架构优化、多模态 Scaling 及数据闭环构建了“制药厂”式的研发模式,成功将成本优势转化为市场主导权。相比之下,DeepSeek 等早期领先者因缺乏持续商业化闭环及组织级创新机制,面临 2.0 时代的结构性挑战。

事件概述:OpenClaw 热潮下的格局重塑

美国时间 4 月 4 日,Anthropic 宣布调整 Claude 订阅策略,不再覆盖 OpenClaw 等第三方平台,强制用户转向按量计费或 API 密钥模式。此举旨在解决因 OpenClaw 7×24 小时自动运行导致的算力成本倒挂问题,并防止自身沦为被多模型切换策略边缘化的“供应商”。

这一政策变动直接引爆了全球开发者对高性价比模型的搜索需求。作为开源 AI Agent 框架,OpenClaw 执行任务需数十轮 API 调用,导致 Token 消耗呈指数级增长。在此背景下,智谱、Kimi(月之暗面)和 MiniMax 凭借显著的成本优势和稳定的推理性能,迅速填补市场空白,实现了从融资困境到商业爆发的逆转。

核心信息:三强的崛起路径

1. 商业化数据的惊人反转

  • 智谱 (Zhipu):2025 年全年营收达 7.24 亿元,同比增长 132%;MaaS 平台年度经常性收入(ARR)达 17 亿元,12 个月暴涨 60 倍。尽管 API 价格上调 83%,调用量仍逆势增长 400%。
  • 月之暗面 (Kimi):2026 年 1 月发布 Kimi K2.5 后,ARR 在一个月内突破 1 亿美元;估值从 43 亿美元飙升至 180 亿美元。海外 API 收入增长 4 倍,反超国内收入。
  • MiniMax:2025 年全年收入 7904 万美元,同比增长 159%。2026 年前两个月 M2 系列 API 调用量达到去年 12 月的六倍,其中来自 OpenClaw 编程场景的 Token 消耗增长超 10 倍。

2. 技术路线:“第三条路”的架构创新

面对 Ilya Sutskever 提出的“预训练终结”论断,三强未选择单纯堆叠数据或彻底推翻架构,而是通过精准创新撬动新的 Scaling 效率:

  • Kimi:在优化器、注意力机制和残差连接三大底层模块同时突破。其 MuonClip 优化器引入二阶梯度信息,解决 Logits 爆炸问题;Attention Residuals 论文实现“选择性回忆”,使 48B 模型达到 60B 效果。
  • MiniMax:验证多模态独立 Scaling 规律。语言侧将线性注意力推进至工业级,大幅降低长文本算力消耗;视觉侧发现 Visual Tokenizer 的 Scaling Law。M2.5 模型采用 MoE 架构,230B 总参数仅激活 10B 推理,SWE-Bench 得分 80.2%,价格为 Claude Opus 4.6 的十分之一。
  • 智谱:构建“多角形飞轮”。GLM-5 在编程、长文本及多模态领域表现突出;完成与华为昇腾、摩尔线程等七大国产芯片的算子级优化,部署成本降低 50%;建立基于真实任务轨迹的数据闭环,形成难以复制的竞争壁垒。

3. 市场表现与生态地位

  • 成本优势:在 OpenRouter 平台上,智谱和 MiniMax 的收费仅为 Claude Opus 的 1/16(输入 100 万 Token 约 0.3 vs 5),吸引大量海外开发者迁移。
  • 调用量超越:自 2026 年 2 月起,中国模型在 OpenRouter 上的调用量三周大涨 127%,首次超越美国模型。Q1 期间,智谱 API 调用量增长 400%,MiniMax M2.5 曾连续两周蝉联全球调用量榜首。

对比分析:为何 DeepSeek 面临挑战?

同为“AI 六小龙”成员,DeepSeek 在 1.0 时代凭借极致工程思维(如 MLA 架构)取得巨大成功,但在 2.0 时代面临两大结构性瓶颈:

  1. 商业化缺失导致数据闭环断裂:DeepSeek 采取开源及免费/超低价策略,大量权重被企业私有化部署或经由云厂商调用,导致母体无法获取真实的推理数据和反馈。这种“用户越多亏损越大”的模式,使其无法像三强那样在实战中持续迭代模型。
  2. 组织创新能力的代际差异:DeepSeek 团队规模小(<140 人)、平均年龄低(28 岁),依赖天才型创始人的个人洞见。而 2.0 时代需要“制药厂”式的体系化创新,要求知识密度、多样性及可复制的研发流程。相比之下,Kimi 等公司建立了从论文到产品不到 3 天的快速迭代机制,并将创新沉淀为组织能力。

关键结论

大模型行业已从 1.0 时代的“炼丹师”模式(依赖个人英雄主义和单点突破)转向 2.0 时代的“制药厂”模式(依赖体系化创新和稳定产出)。在 OpenClaw 引发的 Token 消耗爆炸背景下,唯有具备极致性价比、高稳定性及持续数据闭环能力的企业,才能掌握定价权并实现规模化盈利。智谱、Kimi 和 MiniMax 正是通过构建这种体系化能力,成功走出了早期的生存危机。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。