AI算力服务转向卖Token:谁能在新分工中赚到钱?
2026/05/18 14:06阅读量 13
AI算力服务正从传统GPU租赁转向按Token消耗收费的新模式,催生出Token工厂和Token运营平台两类新角色。Token工厂重资产、靠工程优化降低成本,但动态护城河和定价权存疑;Token运营平台轻资产、聚合模型服务,但易被云厂商功能吸收。最终可能仍是上游基础设施供应商赚得最稳。
事件概述
AI算力服务正从GPU租赁转向按Token消耗收费的新模式,产生了Token工厂(推理产能代工厂)和Token运营平台(模型流通统一入口)两类新角色。传统算力租赁因利润空间压缩、难以分享AI应用增长红利而面临局限,新的分工模式试图解决这一问题。
核心信息
传统算力租赁的局限
- 固定租金模式,收入弹性有限,无法分享下游应用爆发的增长红利。
- 同质化竞争严重,易陷入价格战,利润空间持续压缩。
- 大模型公司和互联网大厂自研全栈推理体系资本开支重、运营复杂度高,有外包需求。
Token工厂模式
- 拥有重资产底座(机房、服务器等),直接承接推理任务生产Token,按Token消耗收费或与模型方分成。
- 核心能力在于模型压缩量化、推理引擎优化、并行调度等工程能力,而非GPU储量。
- 优势:收入与调用量正相关,部分公司毛利率显著高于传统算力租赁。
- 风险:推理优化领先是动态的,容易被通用方案追平;头部客户(大厂)自身技术强,长期外采需求不确定;高毛利率不等于高资本回报,需关注产能利用率、折旧周期和定价权。
Token运营平台模式
- 轻资产,整合多模型资源,提供统一调用入口,收入来自上游价格的服务溢价。
- 核心价值:降低接入门槛、保障稳定性、通过智能路由平衡效果与成本。
- 风险:B端客户多已绑定云厂商,优先选择云厂商MaaS平台;独立平台提供不了增量价值则易被功能吸收,护城河尚未验证。
值得关注
产业深层转变
- 从“卖资源”转向“卖结果”,竞争核心从资源占有转向效率与交付能力。
- 从“大厂全包”转向专业化分工,提升产业效率。
- 从“概念驱动”转向商业闭环驱动,看重可持续收入与利润。
值得跟踪的方向
- 深度嵌入客户核心流程、绑定非自研模型的Token工厂。
- 拥有应用入口与客户基础、能形成场景闭环的垂直领域公司。
- 在特定芯片、模型、场景做到极致的推理优化技术公司。
- 能提供云厂商之外增量价值、形成统一调度能力的平台型Token运营商。
投资提醒
- 赛道受核心算力供给紧张、产业成熟后价格竞争、技术领先易被开源生态追平等多重约束。
- 需警惕概念先行:有算力不等于能做好Token工厂,聚合接口不等于能做成运营平台。
- 关注长期ROIC、自由现金流和定价权,缺乏定价权的玩家很难持续获利。
- 最终可能仍是卖HBM、光模块等上游关键基础设施厂商赚得最稳。
