DeepSeek年内18次服务异常:大模型免费模式的算力困局与商业化出路
2026/05/29 11:54阅读量 7
DeepSeek于5月28日再次出现服务中断,年内已发生18次异常,本月达5次。频繁故障根源在于高推理成本与免费模式的矛盾:用户越活跃,算力成本越刚性。业界提出分层收费和B端反哺C端两种可持续路径。DeepSeek已宣布永久降低API价格至原定价1/4,试图通过技术降本和规模扩张抢占API市场。
事件概述
5月28日上午10时21分,DeepSeek网页对话及API服务中断,29分钟后恢复。这是2026年以来第18次部分性能异常,也是5月的第5次。业内认为直接原因是算力供需失衡、系统弹性不足,深层矛盾在于传统互联网“免费获客—后期变现”逻辑不适用于推理成本高昂的大模型C端市场。
核心信息
- 成本结构差异:互联网免费产品边际成本趋近于零,但大模型每次对话都消耗刚性算力,用户越活跃成本越高,无法随规模摊薄。
- 需求激增放大矛盾:据OpenRouter监测,上周(5月18—24日)全球大模型总调用量达28.9万亿Token;中国周调用量9.22万亿Token,连续四周超过美国;DeepSeek-V4-Flash单周调用3.43万亿Token,环比暴涨66%登顶全球。
- 两种商业化路径:中央民族大学副教授向安玲指出,可行方案一是分层收费(基础免费,增强功能按量或阈值计费),二是B端反哺C端(B端私有化部署、API销售获取收入,补贴C端免费服务,同时将C端脱敏数据产品化卖给B端)。
值得关注
- DeepSeek永久降价抢API市场:5月22日DeepSeek宣布,V4-Pro模型API价格永久调整为原定价的1/4。技术优化使单位推理成本降至上代27%,并兼容华为昇腾等国产芯片,降低硬件采购成本。
- 行业背景:HBM价格半年涨超500%,高端GPU供不应求,亚马逊、微软及国内云厂商纷纷上调API定价。DeepSeek与小米(MiMo-V2.5 API最高降99%)成为降价异类,试图以低价扩大付费群体,若成功可能通过B端规模化收入支撑C端免费服务。
