小米MiMo降价99%对齐DeepSeek,国产大模型API定价进入成本约束阶段
2026/05/27 19:37阅读量 4
5月27日,小米MiMo-V2.5系列API永久降价,最高降幅99%,取消上下文窗口分档计价,Pro档核心定价与DeepSeek V4-Pro完全一致。这标志着国产大模型API定价从“能力溢价”转向“成本约束”,价格战延伸至推理框架和缓存系统竞争,将降低长上下文和Agent任务落地门槛。
事件概述
- 小米MiMo跟进DeepSeek完成价格对齐:5月27日,小米MiMo-V2.5系列API永久降价,最高降幅99%,同时取消上下文窗口分档计价。Pro档核心定价:输入缓存命中0.025元/百万tokens、输入缓存未命中3元/百万tokens、输出6元/百万tokens,与DeepSeek于5月22日宣布永久生效的V4-Pro价格完全一致。Token Plan计费体系同步调整,同等价格下用量提升至原来的5至8倍,有效期内的用户额度统一重置。
- 定价逻辑切换:过去大模型API按模型能力溢价定价,此次降价标志着新逻辑成型——模型服务定价开始受单次推理成本约束。竞争从模型参数与榜单能力,延伸至推理框架、缓存系统和集群调度能力。小米披露通过多级缓存工程优化,将KV Cache数据搬运量降至优化前的近七分之一,可缓存token数量提升近5倍,这是维持低价的基础。
核心信息
- 价格战降低长上下文任务门槛:缓存命中价仅0.025元/百万tokens,直接降低了代码助手、企业知识库、Agent工作流等多轮重复调用场景的持续运行成本。取消上下文窗口分档计价,使长上下文任务使用门槛显著降低。
- 对全球定价体系形成压力:对比OpenAI GPT-5.5 Pro(输入30美元/百万tokens、输出180美元/百万tokens),调价后的国产Pro档模型价格已低出不止一个数量级。
- 产业分工与基础设施化趋势:企业采购将从选单个最强模型,转向按任务风险层级路由模型,高频重复低风险任务更多使用低价模型。模型竞争变为单位任务成本、稳定性、吞吐、延迟等综合能力竞争。但低价并不等于真实总成本低,缓存命中率、服务稳定性等因素会影响实际成本。
值得关注
- DeepSeek的长期生态策略:据彭博社报道,DeepSeek正推进约700亿元融资(投前估值约450亿美元),V4-Pro永久降价更像是长期生态策略而非阶段性促销。
- 将压力传导至更多厂商:同等能力区间的模型已将缓存命中输入压至0.025元/百万tokens,更高价模型需解释其价格合理性。国产大模型正通过低成本、高频迭代和开放调用,将模型能力压进真实应用场景,逐步将推理服务做成普惠基础设施。当前阶段的核心是“谁能以真实成本支撑低价”。
