AI付费潮驱动算力租赁爆发：从卖硬件到卖Token，商业模式代际跃迁

2026/05/12 08:01阅读量 5

全球AI大模型Token调用量指数级增长，推动算力租赁需求暴增，H100租金半年涨近40%，交付周期延至2027年。字节豆包推行付费订阅，Anthropic与SpaceX、谷歌等签下数千亿美元算力租赁大单。商业模式从按小时出租GPU转向按Token计费，算力租赁正成为AI产业核心基础设施。但技术迭代、国产生态短板、产业协同三大挑战并存。

事件概述

AI应用付费潮从C端向B端基础设施层层传导，算力租赁市场迎来爆发。全球AI大模型词元（Token）总调用量已达27万亿，环比增长18.9%，中国连续五周超越美国。高价值GPU租赁价格飙升，H100一年期合同从2025年10月的每卡每小时1.70美元涨至2026年3月的2.35美元，涨幅近40%；H200月租涨至6万至6.6万元（涨幅25%至30%），H100月租涨至5.5万至6万元（涨幅15%至20%）。交付周期大幅延至2027年第二季度（H200）和第一季度（H100）。

核心信息

字节豆包付费模式：2026年5月4日豆包推出三档付费（标准版68元/月、加强版200元/月、专业版500元/月），聚焦PPT生成、数据分析等场景。豆包日均Token消耗已达120万亿（一年增长1000倍），字节2026年约1600亿元资本开支中一半投向AI芯片，推理算力需求已达训练阶段的10至15倍。
Anthropic巨额租约：2026年5月6日，Anthropic租下SpaceX旗下Colossus 1数据中心全部算力（超22万块英伟达GPU，涵盖H100、H200及GB200，总功耗300兆瓦），使其总算力从不足10万张H100当量一举追平OpenAI、Google DeepMind。此前Anthropic已与亚马逊、谷歌/博通签订总计约5吉瓦算力供应协议（谷歌协议5年内投资近2000亿美元），加上与微软Azure的300亿美元合同，其算力承诺总规模已达数千亿美元。
国内企业业绩兑现：协创数据2026年Q1归母净利润7.5亿元（同比+343%）；利通电子Q1归母净利润2.7亿元（同比+821%）；东阳光2026年5月5日公告，控股子公司签署算力服务采购框架合同金额160亿至190亿元。
海外云商加码：CoreWeave资本开支计划从103亿美元跳升至300至350亿美元，在手订单逼近960亿美元；甲骨文与OpenAI达成4.5GW算力租赁协议，其2026年资本开支上调至500亿美元以上。
商业模式转型：算力租赁从“卖算力”（按GPU小时计价）转向“卖Token”（按API调用量或模型服务计费，包括Token分成模式），用户不再关心GPU使用时长，只关心模型输出Token量和任务完成度。

值得关注

技术代际风险：英伟达产品路线图加速——Vera Rubin平台2026年下半年出货（性能功耗比提升10倍），Rubin Ultra预计2027年、Feynman计划2028年推出。旧代服务器账面价值快速缩水，但租赁模式通过规模效应将迭代成本分散到大量客户，反而凸显韧性。
国产化瓶颈：英伟达GPU机柜出租率超90%，国产GPU服务器出租率偏低，核心瓶颈在于CUDA生态的软件优势。华泰证券判断2026年为“国产超节点元年”，试图通过系统级重构弥补差距。工信部已部署“算力银行”“算力超市”等普惠政策，但底层仍依赖海外高端芯片。
产业协同方向：当前算力需求主要由互联网大模型企业驱动，真正的增量来自智能制造、医疗、自动驾驶等实体行业。算力租赁企业需从“军火商”模式转向与行业深度合作，让算力成为公共基础设施。未来竞争将向头部集中，中小玩家面临供应链劣势。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？