火山引擎告别Token崇拜:从按量计费走向Agent平台化

2026/05/22 12:24阅读量 3

火山引擎以49.5%的调用量份额位居2025年中国公有云MaaS市场第一,但其战略重心正从卖Token转向Agent平台化——发布Agent Plan,将自研与竞品模型打包,采用按任务计费(AFP),试图通过平台绑定深化客户粘性。这一转变背后是模型能力趋同、Token单价压缩的行业现实,规模优势需转化为基础设施价值才能延续竞争力。

事件概述

2026年5月,火山引擎发布国内首个Agent Plan,将自研Seed系列模型与GLM-5.1、Kimi-K2.6等第三方模型打包,统一采用AFP(Agent Flow Pricing)计费,月费40元起。这标志着火山引擎从单纯的模型API提供商,向Agent基础设施平台转型。IDC数据显示,2025年中国公有云大模型调用量同比增长16倍,火山引擎以49.5%的调用量份额位列第一,营收份额超过40%。

核心信息

  • 战略转向:火山引擎不再主打“最强模型”,而是通过Agent Plan将计费单位从Token消耗量迁移到“完成任务数”。平台内置Harness工具(联网搜索等),将推理变为可约束、可追踪的工作流,提高用户迁移成本。
  • 规模优势来源:低价策略(2025年5月豆包大模型进入“厘时代”,综合成本降低63%)和工程优化(PD分离、KV Cache)需要大规模调用才能发挥效益。火山引擎凭借字节系场景(AI视频生成Seedance占市场超80%算力份额、AI智能体高频调用)先跑出规模,进而支撑持续降价。
  • 组织整合:2025年字节AI研发团队三次整合,AI Lab并入Seed团队,视觉生成与豆包技术部统一纳入Seed体系,为平台提供稳定模型迭代节奏。
  • 竞争格局:Omdia数据显示2025年阿里云以38.1%收入份额居AI云市场第一,但IDC数据显示火山引擎在MaaS调用量上领先。两份报告反映不同维度——阿里云守住收入体量,火山引擎在调用规模建立坐标。

值得关注

火山引擎平台化转型能否成功取决于企业客户是否将真实Agent工作流部署在平台上。关键信号是第三方模型在Agent Plan总调用量中的占比变化:若用户向Seed系列集中迁移,则平台绑定成立;若比例稳定或上升,则更像能力补位。行业面临Token单价持续压缩(IDC预测2026年MaaS Token消耗量达40000万亿,营收约186亿元,量增21倍但价降),算力成本下降速度必须跑赢单价降速,规模不足的竞争者将面临更大压力。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。