Token 变新“KPI”:大厂 AI 内卷催生无效消耗,微软踩刹车 Meta 踩油门
2026/05/25 11:39阅读量 2
企业AI应用中Token消耗量正在成为新的考核指标,微软、Uber因成本失控开始收紧Token使用,而Meta则推出Token排行榜反而导致消耗暴涨12倍。李彦宏提出Token不等于实际产出,业界呼吁建立以效率为核心的价值度量体系。
事件概述
Token 消耗量正成为企业考核员工 AI 使用效率的“硬指标”,但这一导向引发了严重的无效浪费。微软、Uber 为了控制成本开始收紧 Token 授权,而 Meta 则通过 Token 排行榜和末位淘汰机制刺激用量,导致内部 Token 消耗在 30 天内从 6 万亿飙升至 73.7 万亿,增幅超 12 倍。李彦宏指出,Token 好统计,但不等于实际产出。
核心信息
- 成本失控案例:微软 Experiences + Devices 团队将于 6 月底关停大部分第三方 Claude Code 授权,全面转向自家 GitHub Copilot CLI,以缓解 AI 成本压力。Uber 2026 年全年 AI 预算仅四个月就基本透支,其 CTO 公开承认 95% 工程师使用 AI 编码工具,单人月均 AI 调用成本达 500-2000 美元。
- 国内大厂现状:阿里、腾讯、字节、百度等将 Token 使用量纳入转正和晋升参考,同时普遍发放 Token 补贴(如腾讯年度 22.8 万元 Token 套餐、字节不限量使用、百度文心无限量+最高 800 美元/年外部补贴、360 全员充 1 亿 Token)。然而仅有 9% 的企业实现显著业务价值突破(埃森哲 2025 数据)。
- 无效浪费普遍:员工为刷 Token 让 AI 批量读取上万行代码、堆砌文献,近半数企业级 AI Token 消耗属于无效浪费(公开数据)。Agent 的 Token 消耗是传统聊天机器人的 5-30 倍(Gartner)。
值得关注
- 从“用量崇拜”转向“效率度量”:李彦宏提出用“每日活跃 Agent(DAA)”替代 Token 量作为衡量标准,但具体计算方式仍需完善。核心方向应是考核 AI 代码合并通过率、缺陷率、问题一次解决率等实际产出指标。
- 企业 FinOps 体系亟需升级:传统 SaaS 按席位计费,Token 账单随使用动态增长,财务、IT、业务部门缺乏协同的成本归因机制。
- 行业预判提前:Cognizant 2026 年报告显示美国 93% 的岗位将受 AI 冲击,Token 消耗将从研发部门扩散到更多岗位,如何判断 Token 花得值不值是核心挑战。
