火猫 AI

核心服务定制优势系统升级 AI 智能体 Skills 定制开发

AI 工具扣子智能体

精选案例资讯中心

安全保障关于我们联系我们

每日 AI 资讯

小米MiMo降价99%对齐DeepSeek，国产大模型API定价进入成本约束阶段

2026/05/27 19:37阅读量 4

5月27日，小米MiMo-V2.5系列API永久降价，最高降幅99%，取消上下文窗口分档计价，Pro档核心定价与DeepSeek V4-Pro完全一致。这标志着国产大模型API定价从“能力溢价”转向“成本约束”，价格战延伸至推理框架和缓存系统竞争，将降低长上下文和Agent任务落地门槛。

事件概述

小米MiMo跟进DeepSeek完成价格对齐：5月27日，小米MiMo-V2.5系列API永久降价，最高降幅99%，同时取消上下文窗口分档计价。Pro档核心定价：输入缓存命中0.025元/百万tokens、输入缓存未命中3元/百万tokens、输出6元/百万tokens，与DeepSeek于5月22日宣布永久生效的V4-Pro价格完全一致。Token Plan计费体系同步调整，同等价格下用量提升至原来的5至8倍，有效期内的用户额度统一重置。
定价逻辑切换：过去大模型API按模型能力溢价定价，此次降价标志着新逻辑成型——模型服务定价开始受单次推理成本约束。竞争从模型参数与榜单能力，延伸至推理框架、缓存系统和集群调度能力。小米披露通过多级缓存工程优化，将KV Cache数据搬运量降至优化前的近七分之一，可缓存token数量提升近5倍，这是维持低价的基础。

核心信息

价格战降低长上下文任务门槛：缓存命中价仅0.025元/百万tokens，直接降低了代码助手、企业知识库、Agent工作流等多轮重复调用场景的持续运行成本。取消上下文窗口分档计价，使长上下文任务使用门槛显著降低。
对全球定价体系形成压力：对比OpenAI GPT-5.5 Pro（输入30美元/百万tokens、输出180美元/百万tokens），调价后的国产Pro档模型价格已低出不止一个数量级。
产业分工与基础设施化趋势：企业采购将从选单个最强模型，转向按任务风险层级路由模型，高频重复低风险任务更多使用低价模型。模型竞争变为单位任务成本、稳定性、吞吐、延迟等综合能力竞争。但低价并不等于真实总成本低，缓存命中率、服务稳定性等因素会影响实际成本。

值得关注

DeepSeek的长期生态策略：据彭博社报道，DeepSeek正推进约700亿元融资（投前估值约450亿美元），V4-Pro永久降价更像是长期生态策略而非阶段性促销。
将压力传导至更多厂商：同等能力区间的模型已将缓存命中输入压至0.025元/百万tokens，更高价模型需解释其价格合理性。国产大模型正通过低成本、高频迭代和开放调用，将模型能力压进真实应用场景，逐步将推理服务做成普惠基础设施。当前阶段的核心是“谁能以真实成本支撑低价”。

阅读原文详情

准备好启动您的定制项目了吗？

现在咨询，即可获得免费的业务梳理与技术架构建议方案。

联系我们查看案例