AI 全面涨价潮:智谱逼近 Claude,阿里云取消低价套餐,H100 产能告急
2026/04/13 19:15阅读量 3
全球 AI 市场因 Agent(智能体)爆发导致 Token 消耗激增,引发从模型 API 到算力硬件的全面涨价。智谱海外版价格直逼国际巨头,阿里云等国内云厂商取消基础套餐并最高上调 34% 涨幅。上游供应链面临严重“产能荒”,英伟达 H100 租赁价格飙升近 40%,国产服务器报价普遍上涨三成以上。
事件概述
全球 AI 行业正经历由需求激增驱动的全面涨价潮。随着 AI 应用从“会做题”向“会办事”的 Agent(智能体)范式转变,Token 消耗量呈抛物线式增长,重塑了产业链供需关系,推动价格从模型层向上游算力层传导。
核心信息
1. 模型服务商:价格频繁上调,性价比优势减弱
- 智谱连续提价:智谱在发布 GLM-5.1 模型后,今年已进行第三次调价。其海外版 Coding Plan 月付价格几乎翻倍,API 价格再度上调 10%。在 Agent 场景的缓存命中价格上,GLM-5.1(0.475 美元/百万 Token)已与 Claude Opus 4.5(0.5 美元/百万 Token)处于同一区间。
- 国内云厂商跟进:
- 腾讯云:宣布 5 月 9 日起 AI 算力等产品上调 5%。
- 阿里云:取消百炼平台的基础套餐(Coding Plan Lite),不再提供最低版服务;确认 AI 算力、存储等产品最高涨价 34%。
2. 需求剧变:Agent 引爆 Token 消耗
- 消耗量激增:以 Claude Code 和 OpenClaw(龙虾)为代表的多智能体系统,使单任务 Token 消耗量从几千跃升至 8 万至 15 万个。中国日均 Token 调用量已突破 140 万亿。
- 商业逻辑重构:Anthropic 年化收入突破 300 亿美元,证明企业愿意为能“持续工作 8 小时”的 AI 付费。国内厂商涨价的核心目的被分析为“筛选客户而非单纯转嫁成本”,意在淘汰低质量用户、锁定高价值付费客户。
3. 算力上游:供应链全面紧张,价格攀升
- 国产服务器涨价:华为昇腾服务器启动第二轮调价,部分版本单台上涨 16 万至 48 万元。国产智算服务器年后报价普遍涨三成以上,且报价“不含内存价”。
- 国际 GPU 租赁飙升:英伟达 H100 一年期 GPU 租赁价格从 2025 年 10 月的 1.70 美元/小时/GPU 涨至 2026 年 3 月的 2.35 美元/小时/GPU,涨幅近 40%。新增产能已被预订一空,甚至四年前的老卡 H100 也出现原价续约情况。
- 产能争夺白热化:从晶圆厂、先进封装到数据中心电力供应,整个 AI 产业链面临“产能荒”。Anthropic 与博通、谷歌签署的长期算力协议总金额估计高达 2000 亿美元量级。
值得关注
- B 端需求释放预期:分析指出,随着企业对国产 Agent 熟悉度提升,约 6~9 个月后 B 端需求将真正释放,算力市场可能面临新一轮冲击。
- 投资回报率支撑:若 AI 工具的投资回报率达 5~10 倍,GPU 租赁等价格在供应紧张背景下仍有上涨空间,全年算力需求预计还有 30%~50% 的增长。
