DeepSeek 将缓存输入价格降至全球最低,重构大模型定价逻辑
2026/04/28 13:54阅读量 4
DeepSeek 于4月25日至26日连续两次降价,最终将V4-Pro等模型的输入缓存命中价格降至0.025元/百万tokens,创下全球大模型价格新低。此次永久降价主要针对长文本、知识库检索(RAG)等高缓存命中率场景,旨在通过规模效应降低行业成本门槛。同时,DeepSeek加速适配华为昇腾等国产芯片集群,试图在推理侧构建基于国产算力的成本优势与生态闭环。
事件概述:价格“骨折”式下调
4月25日至26日,DeepSeek 在短时间内连续两次调整 API 价格策略,彻底改变了当前大模型市场的定价预期。
- 第一阶段(4月25日):DeepSeek-V4-Pro 开启限时2.5折优惠,输入价格(缓存命中)降至 0.25 元/百万 tokens。
- 第二阶段(4月26日晚):全系 API 输入缓存命中价格直接降至首发价的 1/10。叠加限时折扣后,具体价格如下:
- DeepSeek-V4-Pro:低至 0.025 元/百万 tokens。
- DeepSeek-V4-Flash:低至 0.02 元/百万 tokens。
直观对比:上海译文出版的《挪威的森林》全书约20万字,若整本书命中缓存后喂给 DeepSeek-V4-Pro,总成本不足 1 分钱。这一价格不仅打破了 token 单价的底线,更将“长文本、长代码、长知识库”等原本高成本的 AI 应用场景推向了价格谷底。
核心事实与商业逻辑
1. 永久性降价与场景聚焦
DeepSeek 研究员陈德里确认,此次输入缓存降价为永久性策略。该策略主要利好 RAG(检索增强生成)、智能客服、文档分析等缓存命中率超过 60% 的应用场景,相关成本可直接下降 90% 以上。
2. 市场影响与竞争格局
- 大厂态度:阿里云、腾讯、字节等拥有完整云服务生态的大厂对此反应相对平静。其商业模式本质是“卖服务”,大模型 API 仅作为引流入口,真正的利润来源是背后的计算、存储及数据库等云服务。即便客户使用 DeepSeek,仍依赖其底层算力设施。
- 中间层压力:智谱 AI、MiniMax、月之暗面等独立模型厂商面临较大挑战。智谱 AI 此前因算力瓶颈已连续三次涨价(累计涨幅83%),而 DeepSeek 的低价策略直接冲击了其定价体系。月之暗面和 MiniMax 虽在性能上可能保持领先,但在价格敏感型市场上将受到挤压。
- 估值驱动:DeepSeek 估值已从传闻的100亿美元拉升至200亿美元(阿里、腾讯入局)。梁文锋需要通过大规模的市场收入和用户增长来支撑高估值,因此采取“赔本赚吆喝”的策略以抢占市场份额和重构行业定价锚点。
3. 国产算力替代路径
此次降价不仅是价格战,更是 DeepSeek 推动国产 AI 芯片规模化应用的战略举措。
- 硬件适配:DeepSeek 已全面适配华为昇腾生态。官方透露,随着下半年昇腾 950 超节点批量上市,Pro 版本价格还有进一步下调空间。
- 成本优势测算:
- 单卡成本:华为昇腾 950PR 定价约 7 万元人民币,英伟达 H200 约合 25 万元;按 FP4 精度计算,昇腾 950PR 性价比约为 4.49 万元/PFLOPS,与英伟达 B200(4.44 万元/PFLOPS)持平甚至更具优势。
- 集群部署:在 100 卡集群方案中,昇腾 950PR 方案总价约 1000 万出头,低于英伟达 H20 方案的近 1500 万。尽管昇腾单卡功耗较高,但单位算力功耗低 65%,且 1 张昇腾 950PR 的推理吞吐量约等于 2.2-2.8 张 H20,整体可节省 60%-70% 的成本。
- 产业链联动:DeepSeek 的采用激活了国产芯片板块,华为昇腾、寒武纪、海光信息、摩尔线程等 8 家国产 AI 芯片品牌在 DeepSeek-V4 发布当天即完成适配,带动相关股价上涨。
值得关注:未来商业化方向
DeepSeek 的低价策略并非终点,而是构建商业护城河的起点。
- 重塑定价锚点:通过确立“DeepSeek 级别模型仅需此价”的市场认知,迫使竞争对手重新审视定价策略,要么跟进压缩利润,要么必须证明更高的差异化价值。
- 从 API 到生态:API 收入仅是第一层。DeepSeek 的目标是成为国内开发者的“默认底座”。未来的商业化重心将转向企业私有化部署、调优、运维、安全权限管理及应用层产品(如 Agent、CLI)。
- 基础设施化:AI 正走向“规模经济 + 薄利多销”的云计算模式。谁能以更优的成本结构、更快的技术迭代和更早实现规模效应,谁就能在长期竞争中胜出。
DeepSeek 的路径并非一夜之间全面替代英伟达,而是先在推理侧、缓存场景和长文本应用中释放国产算力的性价比优势,逐步打通软件生态,最终实现从模型层到应用层的价值闭环。
