Token经济学：AI掀起的新一代‘军备竞赛’与成本困局

2026/05/17 08:00阅读量 2

硅谷大厂掀起Token-maxxing风潮，Meta内部排行榜显示员工Token消耗量巨大，引发关于AI使用效率与成本的激烈辩论。与此同时，中国开源模型凭借高性价比在OpenRouter上崛起，Token定价与效率成为AI行业新焦点。

事件概述

硅谷科技公司正在推行一种新的“炫富”方式——每日Token消耗量。Meta内部名为“Claudeonomics”的排行榜显示，超过85000名员工在一个月内消耗了超过60万亿Token，按Anthropic Opus 4.6的定价（约每百万Token 15美元）估算，价值约9亿美元。排名第一的员工烧掉的Token价值高达数百万美元。Uber后端系统中，11%的新代码更新已由Agent完成，三个月前这一比例还不到1%。Uber CTO表示，其愿景是将软件工程转型为Agent软件工程。

核心信息

Token-maxxing辩论：一方（如Writer CEO May Habib）认为必须全力拥抱AI，否则被淘汰；另一方（如HubSpot CEO Yamini Rangan）则强调“结果最大化”比“Token最大化”更重要。中间派共识是：不充分利用AI的公司将落后于竞争对手。
Token成本结构变化：传统SaaS产品的边际成本趋向零，而AI产品每个用户操作都产生Token账单，成本随用量线性增长。硅谷投资人Chamath Palihapitiya称其投资的一家软件公司AI运营成本在几个月内翻了三倍多，年化支出达千万美元级别。
Token定价机制：模型收费分为输入Token、缓存输入Token和输出Token三类，价格比例约1:0.1:6（以GPT-5为例，输入每百万Token 1.25美元，缓存0.125美元，输出10美元）。越贵的模型在复杂任务上可能总成本更低，因为一次正确执行减少了重试和人工介入。
中国模型崛起：OpenClaw爆发后，Agent任务对开源模型需求飙升。MiniMax M2.5在SWE-Bench Verified测试中得分为80.2%，Claude Opus 4.6为80.8%，但价格仅为后者的十七分之一（输入每百万Token 0.3美元 vs 5美元）。2026年3月，中国主要模型厂商（阿里云、百度、智谱、腾讯等）集体涨价5%至400%。
Token效率新赛道：业内人士批评企业级AI应用中近一半Token未产生实际价值。黄仁勋在GTC 2026上提出Token五级定价框架，价格从免费层到超高速层（每百万Token 150美元），强调Token应根据速度和场景差异化定价。
OpenRouter模式：创始人Alex Atallah曾是OpenSea联合创始人。OpenRouter作为统一模型API入口，抽取约5%费用。2025年a16z领投4000万美元，估值约5亿美元；最新融资估值接近13亿美元。平台受益于OpenClaw爆发，成为全球开发者切换模型的中间层。

阅读原文详情

事件概述

核心信息

准备好启动您的定制项目了吗？