DeepSeek V4 永久降价:缓存命中再享9折,编程实测成本骤降83%
2026/04/27 12:35阅读量 8
DeepSeek宣布V4系列模型永久降价,在原有输入输出2.5折基础上,对命中缓存的输入部分额外提供1折优惠。实测数据显示,在Agent编程场景下,由于高缓存命中率(V4-Pro约96%),整体推理成本较原价降低约83%,仅需原价的17%。此举被视为通过底层架构创新持续压低推理成本并转化为市场竞争力的策略延续。
事件概述
DeepSeek官方确认其V4系列模型实施永久性价格调整策略。在原有的基础折扣(输入输出均为原价的2.5折)之上,针对命中缓存的输入Token再次提供1折优惠。该政策无时间限制,旨在彻底改变AI记忆处理模式,推动“百万上下文普惠时代”落地。
核心数据与实测表现
- 缓存命中率:
- V4-Pro:约96%
- V4-Flash:约91%
- 成本对比测试:
- 原方案:消耗约3500万token,实际花费31.73元。
- 新方案:同等任务量下,按新价格计算仅需5.34元。
- 降幅:整体节省约83%,即仅用原价的17%即可获得相同产出。
- 实际验证:使用1300万token进行实测,花费2.36元,与理论计算结果基本一致。
- 技术背景:V4-Pro每百万token仅比V4-Flash贵0.5分钱,且输入比例远高于输出,使得缓存优化带来的成本优势被显著放大。
行业影响与趋势
- 价格战升级:继2024年8月V3降价引发第一轮Token价格战后,R1发布曾通过夜间时段打折进一步升温,此次V4的永久降价策略对海外用户心理冲击更大。
- 商业逻辑:该策略与DeepSeek的技术理念高度一致,即通过底层架构和算法创新降低推理成本,并将成本优势迅速转化为市场竞争力。
- 受益群体:学生、AI初学者及小型企业将因成本大幅降低而显著受益。
- 未来预期:业界关注下半年DeepSeek大规模部署华为算力后可能带来的进一步价格惊喜。
