AI行业从烧钱转向精打细算,效率优先成为新共识

2026/07/02 10:47阅读量 2

AI行业正从追求用户规模转向效率优先。豆包、DeepSeek等开始调整定价策略,OpenAI也尝试广告变现。算力成本刚性叠加供给瓶颈,使企业重新思考商业化路径。MoE架构、KV缓存复用、峰谷定价等手段被广泛采用,前沿AI与日常AI出现分化。目标是降低单次推理成本,推动AI走向人人可用的基础设施。

事件概述

AI行业正经历从“烧钱拉用户”到“精打细算”的转折。多家公司调整收费策略:豆包推出专业版订阅,最高套餐年费5088元;DeepSeek实行峰谷定价,高峰时段调用成本翻倍;ChatGPT开始向免费用户展示广告并加大招商力度。这些动作标志着“白嫖AI”时代即将结束。

核心信息

  • 商业化困局:AI公司陷入两头堵的境地。一方面用户规模增长直接推高算力成本(刚性成本),OpenAI去年净亏损385亿美元,每收入1美元赔1.22美元;豆包日均token调用量180万亿,日收入不足100万元。另一方面,算力供给受限于电力、芯片代工产能(台积电先进封装被英伟达消耗六成以上),成本降不下来。而ToC场景用户付费意愿极低,涨价就会流失用户,5月豆包试水订阅时被吐槽“笨还收费”冲上热搜。
  • 效率优先策略:为解决成本难题,行业从多个层面提升效率:
    • 硬件层:英伟达推出LPU芯片,专门优化AI推理场景,替代大规模GPU用于日常推理。
    • 模型架构:MoE(混合专家架构)成为主流,如DeepSeek V4 Pro总参数1.6万亿,每次只激活490亿(3%),编码能力逼近顶级闭源模型,输出价格仅GPT-5.5的八分之一;腾讯开源hy3 preview(295B参数激活21B),灰度内测的AI助手“小微”采用WeLM模型(800亿参数激活30亿,激活率3.75%),比DeepSeek-V4-Flash的4.6%还低。
    • 工程优化:KV缓存复用技术避免重复计算;DeepSeek峰谷定价用价格杠杆引导负载到夜间低谷,提高GPU利用率。
    • Agent阶段:谷歌A2A协议和Anthropic MCP协议解决Agent协作中的无效率推理,减少重复搬运和空转。
  • 用户需求分化:LLM Token支出指数持续走低,用户从昂贵的前沿模型转向轻量级、高性价比的MoE模型。Citadel Securities报告指出“前沿AI”与“日常AI”正在分化:前沿追求智能上限,日常追求极致效率,不能用同一标准衡量。大多数场景可主动降级到便宜模型,类似公司不会让首席分析师接前台电话。
  • 企业自身也在控制token消耗:微软取消内部Claude Code许可,要求员工用更便宜的Copilot CLI;亚马逊要求员工减少不必要的AI调用;Meta撤下内部token消耗排行榜。节约使用成为工程师必备技能,但普通用户难以自行优化,应当在机制层面自动分配模型(系统判断任务复杂程度,选择合适模型),实现技术平权。

值得关注

效率优先不仅是商业命题,更是技术平权的关键。AI普及不取决于最强模型的能力,而取决于大规模运行的成本能降多低。只有当AI像电力、互联网一样成为人人可用的基础设施,技术才能真正惠及大众。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。