大模型厂商告别Token价格战:成本失控与效率转型的必然

2026/04/11 12:42阅读量 6

Anthropic因第三方工具导致算力成本激增而切断访问权限,暴露了Agent时代订阅制模式的不可持续性。小米MiMo负责人罗福莉指出低价开放Token是陷阱,强调行业正从单纯的价格竞争转向对工程效率和模型能力的博弈。智谱等厂商虽营收高增但亏损扩大,迫使行业探索分层定价及软硬结合的新商业模式以应对高昂的算力支出。

事件概述

近期,大模型行业出现显著风向转变。Anthropic宣布自4月4日起切断OpenClaw等第三方工具对Claude Pro和Max订阅的访问权限,引发行业震动。与此同时,小米集团MiMo负责人罗福莉公开警示,盲目参与Token价格战并低价向第三方开放API是一个“陷阱”。这两起事件标志着大模型厂商开始反思在Agent(智能体)时代下,单纯依靠消耗Token换取市场份额的商业模式是否可持续。

核心事实与数据

1. Anthropic的成本困境与策略调整

  • 封杀原因:Anthropic在用户信中明确表示,第三方工具给系统造成过大压力,必须优先保障核心用户体验。实际上,这源于无法承受的成本压力。
  • 成本估算:外媒分析指出,每月200美元的Claude Code订阅可能消耗高达2000美元的计算资源;另有分析师认为实际算力成本可能高达5000美元/月。
  • 背景冲突:OpenClaw曾因名称相似被Anthropic发函要求改名,且Anthropic随后推出自家产品Claude Cowork,双方存在商业竞争关系。

2. Agent时代的Token消耗爆发

  • 用量剧增:传统对话模式下,单轮对话消耗约1000-3000个Token;而在Agent场景下,一个用户背后可能同时运行10至100个Agent,7×24小时执行任务。
  • 对比数据:普通ChatGPT用户月消耗量约为百万级;重度“养虾”(指部署多个Agent)用户日均消耗Token可达3000万至1亿之间。
  • 成本结构失衡:虽然GPT-3.5级别模型的推理成本在过去两年下降了1/280,硬件成本年降30%,但训练成本依然高昂,且全球算力紧缺推高了整体运营成本。
  • 行业亏损预测:OpenAI预计2028年算力支出将达1210亿美元,亏损可能达850亿美元;Anthropic训练成本约为OpenAI的40%,但也处于巨额烧钱状态。

3. 国内厂商的现状与挑战

  • 价格内卷:民银证券研报显示,2025年国内大模型API平均价格约为3.88元/百万Tokens,仅为海外模型(20.46元)的五分之一。尽管价格低廉,但并未带来相应利润增长。
  • 典型案例:智谱2025年总收入7.24亿元(同比增131.9%),但全年亏损47.18亿元(同比扩大59.5%)。其研发开支达31.8亿元,且需向第三方支付高额算力采购费(2025年上半年达11.45亿元)。
  • 市场表现:OpenRouter数据显示,中国大模型单周调用量已连续一个月超过海外模型,小米、阶跃星辰、Minimax等国产模型位居前列。

行业趋势与未来方向

1. 商业模式重构

  • 从规模到效率:罗福莉提出,Agent时代的赢家不属于烧算力最多的人,而是用算力最聪明的人。行业竞争将从“算力规模”转向“工程效率”。
  • 软硬结合:单纯卖API的企业面临天花板,需将模型层与智能硬件、应用产品深度结合,构建生态壁垒。

2. 计费模式创新

  • 分层定价:除了传统的订阅制和按量计费,未来可能出现更精细化的付费体系,如按推理能力、任务数量等维度收费。
  • 模式探索:DeepSeek上线“快速模式”和“专家模式”入口;火山引擎计划孵化垂直领域智能体,尝试按回答数量收费。

3. 长期展望

  • 告别狂欢:随着Token消耗量远超供给,收紧免费额度和补贴是大势所趋。大模型企业若想长久经营,必须学会算账,平衡效率与价值,而非陷入无休止的价格战。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。