AI行业从烧钱转向精打细算，效率优先成为新共识

2026/07/02 10:47阅读量 2

AI行业正从追求用户规模转向效率优先。豆包、DeepSeek等开始调整定价策略，OpenAI也尝试广告变现。算力成本刚性叠加供给瓶颈，使企业重新思考商业化路径。MoE架构、KV缓存复用、峰谷定价等手段被广泛采用，前沿AI与日常AI出现分化。目标是降低单次推理成本，推动AI走向人人可用的基础设施。

事件概述

AI行业正经历从“烧钱拉用户”到“精打细算”的转折。多家公司调整收费策略：豆包推出专业版订阅，最高套餐年费5088元；DeepSeek实行峰谷定价，高峰时段调用成本翻倍；ChatGPT开始向免费用户展示广告并加大招商力度。这些动作标志着“白嫖AI”时代即将结束。

核心信息

商业化困局：AI公司陷入两头堵的境地。一方面用户规模增长直接推高算力成本（刚性成本），OpenAI去年净亏损385亿美元，每收入1美元赔1.22美元；豆包日均token调用量180万亿，日收入不足100万元。另一方面，算力供给受限于电力、芯片代工产能（台积电先进封装被英伟达消耗六成以上），成本降不下来。而ToC场景用户付费意愿极低，涨价就会流失用户，5月豆包试水订阅时被吐槽“笨还收费”冲上热搜。
效率优先策略：为解决成本难题，行业从多个层面提升效率：
- 硬件层：英伟达推出LPU芯片，专门优化AI推理场景，替代大规模GPU用于日常推理。
- 模型架构：MoE（混合专家架构）成为主流，如DeepSeek V4 Pro总参数1.6万亿，每次只激活490亿（3%），编码能力逼近顶级闭源模型，输出价格仅GPT-5.5的八分之一；腾讯开源hy3 preview（295B参数激活21B），灰度内测的AI助手“小微”采用WeLM模型（800亿参数激活30亿，激活率3.75%），比DeepSeek-V4-Flash的4.6%还低。
- 工程优化：KV缓存复用技术避免重复计算；DeepSeek峰谷定价用价格杠杆引导负载到夜间低谷，提高GPU利用率。
- Agent阶段：谷歌A2A协议和Anthropic MCP协议解决Agent协作中的无效率推理，减少重复搬运和空转。
用户需求分化：LLM Token支出指数持续走低，用户从昂贵的前沿模型转向轻量级、高性价比的MoE模型。Citadel Securities报告指出“前沿AI”与“日常AI”正在分化：前沿追求智能上限，日常追求极致效率，不能用同一标准衡量。大多数场景可主动降级到便宜模型，类似公司不会让首席分析师接前台电话。
企业自身也在控制token消耗：微软取消内部Claude Code许可，要求员工用更便宜的Copilot CLI；亚马逊要求员工减少不必要的AI调用；Meta撤下内部token消耗排行榜。节约使用成为工程师必备技能，但普通用户难以自行优化，应当在机制层面自动分配模型（系统判断任务复杂程度，选择合适模型），实现技术平权。

值得关注

效率优先不仅是商业命题，更是技术平权的关键。AI普及不取决于最强模型的能力，而取决于大规模运行的成本能降多低。只有当AI像电力、互联网一样成为人人可用的基础设施，技术才能真正惠及大众。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？