Token经济学:AI掀起的新一代‘军备竞赛’与成本困局
2026/05/17 08:00阅读量 2
硅谷大厂掀起Token-maxxing风潮,Meta内部排行榜显示员工Token消耗量巨大,引发关于AI使用效率与成本的激烈辩论。与此同时,中国开源模型凭借高性价比在OpenRouter上崛起,Token定价与效率成为AI行业新焦点。
事件概述
硅谷科技公司正在推行一种新的“炫富”方式——每日Token消耗量。Meta内部名为“Claudeonomics”的排行榜显示,超过85000名员工在一个月内消耗了超过60万亿Token,按Anthropic Opus 4.6的定价(约每百万Token 15美元)估算,价值约9亿美元。排名第一的员工烧掉的Token价值高达数百万美元。Uber后端系统中,11%的新代码更新已由Agent完成,三个月前这一比例还不到1%。Uber CTO表示,其愿景是将软件工程转型为Agent软件工程。
核心信息
- Token-maxxing辩论:一方(如Writer CEO May Habib)认为必须全力拥抱AI,否则被淘汰;另一方(如HubSpot CEO Yamini Rangan)则强调“结果最大化”比“Token最大化”更重要。中间派共识是:不充分利用AI的公司将落后于竞争对手。
- Token成本结构变化:传统SaaS产品的边际成本趋向零,而AI产品每个用户操作都产生Token账单,成本随用量线性增长。硅谷投资人Chamath Palihapitiya称其投资的一家软件公司AI运营成本在几个月内翻了三倍多,年化支出达千万美元级别。
- Token定价机制:模型收费分为输入Token、缓存输入Token和输出Token三类,价格比例约1:0.1:6(以GPT-5为例,输入每百万Token 1.25美元,缓存0.125美元,输出10美元)。越贵的模型在复杂任务上可能总成本更低,因为一次正确执行减少了重试和人工介入。
- 中国模型崛起:OpenClaw爆发后,Agent任务对开源模型需求飙升。MiniMax M2.5在SWE-Bench Verified测试中得分为80.2%,Claude Opus 4.6为80.8%,但价格仅为后者的十七分之一(输入每百万Token 0.3美元 vs 5美元)。2026年3月,中国主要模型厂商(阿里云、百度、智谱、腾讯等)集体涨价5%至400%。
- Token效率新赛道:业内人士批评企业级AI应用中近一半Token未产生实际价值。黄仁勋在GTC 2026上提出Token五级定价框架,价格从免费层到超高速层(每百万Token 150美元),强调Token应根据速度和场景差异化定价。
- OpenRouter模式:创始人Alex Atallah曾是OpenSea联合创始人。OpenRouter作为统一模型API入口,抽取约5%费用。2025年a16z领投4000万美元,估值约5亿美元;最新融资估值接近13亿美元。平台受益于OpenClaw爆发,成为全球开发者切换模型的中间层。
