算力荒加速蔓延，中国AI公司遭遇限购涨价与泡沫考验

2026/06/22 23:51阅读量 2

中国多家头部AI大模型公司（智谱、Kimi、MiniMax等）近期纷纷限制Token购买或大幅涨价，根源在于芯片、存储、数据中心全链产能紧缺。运营成本居高不下，智谱三年半亏62亿、MiniMax亏约92亿，且绑定金主也难获优先算力。业界认为，若无法通过效率优化和国产芯片突破建起自主产能体系，AI泡沫或将破裂。

事件概述

2026年6月，中国AI大模型公司集中遭遇算力荒：智谱开源GLM-5.2后套餐限购并三次涨价；Kimi、MiniMax接口过载，开发者排队等Token；腾讯云、阿里云、百度云亦在3月跟进涨价，高端算力产品供不应求。AI教父杨立昆在CNBC访谈中指出，Token成本下降过慢，导致多数公司用投资人钱补贴用户，泡沫“随时可能爆”。

核心信息

算力紧缺的真实原因：AI编程与智能体任务消耗Token量是聊天的几十上百倍，MiniMax M3演示一单任务需独立运行近12小时。MiniMax已将包月计费改为按Token计费，重度用户成本涨一两倍。美国开发者计算使用Claude/ChatGPT 200美元套餐的实际成本达2048美元。
股东金主难以依赖：智谱背后有腾讯、阿里、蚂蚁等投资，Kimi最大股东为阿里，但金主自身也缺算力。腾讯云给混元涨价后，阿里云、百度云数小时内跟进。腾讯云还公开放话：紧缺算力优先自家的高价值业务，被投创业公司往后排。智谱七成研发投入买算力，三年半亏62亿；MiniMax同样七成买算力，三年半亏约92亿。
两条突围路径：
1. 拥抱国产产能：智谱将GLM-5训练集群交给华为昇腾，DeepSeek V4在华为昇腾首发并重写底层代码。但国产旗舰芯片单颗性能仍只有英伟达旗舰的四到六倍，集群靠堆叠功耗接近四倍才追平。
2. 极致效率优化：Kimi用Mooncake架构将KV缓存池化复用；智谱用TileRT引擎把旗舰模型吐字提到每秒400 Token，并与清华合作推出ZCube网络架构提升吞吐一成半、降低三成网络设备成本。
美国公司路径差异：OpenAI和Anthropic分别通过联盟或多云长约获取算力，但前提是美国底层芯片、云平台、电力等大多落在本土或盟友体系内，天花板远高于中国。

值得关注

IDC预测到2030年全球年度Token消耗比2025年涨超三亿倍，但产能供给侧（芯片、显存、互联、电力、调度）严重滞后。若成本无法在钱烧光前降下来，限购涨价只是先行信号，泡沫破裂将导致整个循环崩塌。中国公司比美国更早、更痛地撞上产能墙，能否建起自主、充沛、持续降价的产能体系，是决定AI产业命运的关键。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？