算力荒加速蔓延,中国AI公司遭遇限购涨价与泡沫考验

2026/06/22 23:51阅读量 2

中国多家头部AI大模型公司(智谱、Kimi、MiniMax等)近期纷纷限制Token购买或大幅涨价,根源在于芯片、存储、数据中心全链产能紧缺。运营成本居高不下,智谱三年半亏62亿、MiniMax亏约92亿,且绑定金主也难获优先算力。业界认为,若无法通过效率优化和国产芯片突破建起自主产能体系,AI泡沫或将破裂。

事件概述

2026年6月,中国AI大模型公司集中遭遇算力荒:智谱开源GLM-5.2后套餐限购并三次涨价;Kimi、MiniMax接口过载,开发者排队等Token;腾讯云、阿里云、百度云亦在3月跟进涨价,高端算力产品供不应求。AI教父杨立昆在CNBC访谈中指出,Token成本下降过慢,导致多数公司用投资人钱补贴用户,泡沫“随时可能爆”。

核心信息

  • 算力紧缺的真实原因:AI编程与智能体任务消耗Token量是聊天的几十上百倍,MiniMax M3演示一单任务需独立运行近12小时。MiniMax已将包月计费改为按Token计费,重度用户成本涨一两倍。美国开发者计算使用Claude/ChatGPT 200美元套餐的实际成本达2048美元。
  • 股东金主难以依赖:智谱背后有腾讯、阿里、蚂蚁等投资,Kimi最大股东为阿里,但金主自身也缺算力。腾讯云给混元涨价后,阿里云、百度云数小时内跟进。腾讯云还公开放话:紧缺算力优先自家的高价值业务,被投创业公司往后排。智谱七成研发投入买算力,三年半亏62亿;MiniMax同样七成买算力,三年半亏约92亿。
  • 两条突围路径
    1. 拥抱国产产能:智谱将GLM-5训练集群交给华为昇腾,DeepSeek V4在华为昇腾首发并重写底层代码。但国产旗舰芯片单颗性能仍只有英伟达旗舰的四到六倍,集群靠堆叠功耗接近四倍才追平。
    2. 极致效率优化:Kimi用Mooncake架构将KV缓存池化复用;智谱用TileRT引擎把旗舰模型吐字提到每秒400 Token,并与清华合作推出ZCube网络架构提升吞吐一成半、降低三成网络设备成本。
  • 美国公司路径差异:OpenAI和Anthropic分别通过联盟或多云长约获取算力,但前提是美国底层芯片、云平台、电力等大多落在本土或盟友体系内,天花板远高于中国。

值得关注

IDC预测到2030年全球年度Token消耗比2025年涨超三亿倍,但产能供给侧(芯片、显存、互联、电力、调度)严重滞后。若成本无法在钱烧光前降下来,限购涨价只是先行信号,泡沫破裂将导致整个循环崩塌。中国公司比美国更早、更痛地撞上产能墙,能否建起自主、充沛、持续降价的产能体系,是决定AI产业命运的关键。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。