小米MiMo大模型API永久降价最高99%，与DeepSeek共推Token价格新低

2026/05/27 17:54阅读量 2

小米宣布旗下MiMo-V2.5系列API永久降价，最高降幅99%，但依赖缓存命中实现超低价；Token Plan Credits提升至5-8倍。继DeepSeek之后，国产模型缓存命中输入价被焊死在0.025元/百万Tokens水平。小米靠SGLang等工程优化支撑降价，旨在抢占Agent和长上下文应用生态，对中小模型公司形成压力。

事件概述

5月22日DeepSeek V4-Pro永久降价后，5月27日小米跟进，宣布MiMo-V2.5系列API永久降价，最高降幅达99%，不区分输入长度。同时Token Plan计费体系优化，定价不变但Credits提升至原来的5-8倍。

核心信息

降价关键条件：超低价（如MiMo-V2.5-Pro输入0.025元/百万Tokens）仅当请求命中缓存时生效；未命中缓存时输入3元/百万Tokens，输出6元/百万Tokens。
Token Plan新额度：Lite/Standard/Pro/Max月费不变（39/99/329/659元），Credits分别提升至41亿、110亿、380亿、820亿。
工程支撑：基于SGLang HiCache完整支持Sliding Window Attention，将KV Cache多级存储数据搬运量降至近七分之一，可缓存token数提升近五倍；同时优化专家并行和输入长度分桶策略。
战略意图：通过低价吸引开发者和高频应用（Agent、代码助手、长上下文应用），累积真实调用数据以迭代模型，争夺Agent生态入口。小米此前百万亿Token激励计划提前发放完毕，显示需求旺盛。

值得关注

小米大模型负责人罗福莉此前反对无成本支撑的Token价格战，但本次降价基于工程优化，实现可持续低价，体现“工程暴力”而非单纯补贴。
继DeepSeek之后，国产模型缓存命中输入价已统一至0.025元水平，价格战考验推理工程能力和后方业务厚度（小米有手机、汽车、IoT等主业输血）。
中小模型公司难以长期跟进，市场将向具备工程能力、算力调度和生态入口的厂商集中，下一阶段竞争焦点转向模型质量、Agent适配和开发者工具。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？