AI付费潮驱动算力租赁爆发:从卖硬件到卖Token,商业模式代际跃迁
2026/05/12 08:01阅读量 5
全球AI大模型Token调用量指数级增长,推动算力租赁需求暴增,H100租金半年涨近40%,交付周期延至2027年。字节豆包推行付费订阅,Anthropic与SpaceX、谷歌等签下数千亿美元算力租赁大单。商业模式从按小时出租GPU转向按Token计费,算力租赁正成为AI产业核心基础设施。但技术迭代、国产生态短板、产业协同三大挑战并存。
事件概述
AI应用付费潮从C端向B端基础设施层层传导,算力租赁市场迎来爆发。全球AI大模型词元(Token)总调用量已达27万亿,环比增长18.9%,中国连续五周超越美国。高价值GPU租赁价格飙升,H100一年期合同从2025年10月的每卡每小时1.70美元涨至2026年3月的2.35美元,涨幅近40%;H200月租涨至6万至6.6万元(涨幅25%至30%),H100月租涨至5.5万至6万元(涨幅15%至20%)。交付周期大幅延至2027年第二季度(H200)和第一季度(H100)。
核心信息
- 字节豆包付费模式:2026年5月4日豆包推出三档付费(标准版68元/月、加强版200元/月、专业版500元/月),聚焦PPT生成、数据分析等场景。豆包日均Token消耗已达120万亿(一年增长1000倍),字节2026年约1600亿元资本开支中一半投向AI芯片,推理算力需求已达训练阶段的10至15倍。
- Anthropic巨额租约:2026年5月6日,Anthropic租下SpaceX旗下Colossus 1数据中心全部算力(超22万块英伟达GPU,涵盖H100、H200及GB200,总功耗300兆瓦),使其总算力从不足10万张H100当量一举追平OpenAI、Google DeepMind。此前Anthropic已与亚马逊、谷歌/博通签订总计约5吉瓦算力供应协议(谷歌协议5年内投资近2000亿美元),加上与微软Azure的300亿美元合同,其算力承诺总规模已达数千亿美元。
- 国内企业业绩兑现:协创数据2026年Q1归母净利润7.5亿元(同比+343%);利通电子Q1归母净利润2.7亿元(同比+821%);东阳光2026年5月5日公告,控股子公司签署算力服务采购框架合同金额160亿至190亿元。
- 海外云商加码:CoreWeave资本开支计划从103亿美元跳升至300至350亿美元,在手订单逼近960亿美元;甲骨文与OpenAI达成4.5GW算力租赁协议,其2026年资本开支上调至500亿美元以上。
- 商业模式转型:算力租赁从“卖算力”(按GPU小时计价)转向“卖Token”(按API调用量或模型服务计费,包括Token分成模式),用户不再关心GPU使用时长,只关心模型输出Token量和任务完成度。
值得关注
- 技术代际风险:英伟达产品路线图加速——Vera Rubin平台2026年下半年出货(性能功耗比提升10倍),Rubin Ultra预计2027年、Feynman计划2028年推出。旧代服务器账面价值快速缩水,但租赁模式通过规模效应将迭代成本分散到大量客户,反而凸显韧性。
- 国产化瓶颈:英伟达GPU机柜出租率超90%,国产GPU服务器出租率偏低,核心瓶颈在于CUDA生态的软件优势。华泰证券判断2026年为“国产超节点元年”,试图通过系统级重构弥补差距。工信部已部署“算力银行”“算力超市”等普惠政策,但底层仍依赖海外高端芯片。
- 产业协同方向:当前算力需求主要由互联网大模型企业驱动,真正的增量来自智能制造、医疗、自动驾驶等实体行业。算力租赁企业需从“军火商”模式转向与行业深度合作,让算力成为公共基础设施。未来竞争将向头部集中,中小玩家面临供应链劣势。
