小米MiMo大模型API永久降价最高99%,与DeepSeek共推Token价格新低

2026/05/27 17:54阅读量 2

小米宣布旗下MiMo-V2.5系列API永久降价,最高降幅99%,但依赖缓存命中实现超低价;Token Plan Credits提升至5-8倍。继DeepSeek之后,国产模型缓存命中输入价被焊死在0.025元/百万Tokens水平。小米靠SGLang等工程优化支撑降价,旨在抢占Agent和长上下文应用生态,对中小模型公司形成压力。

事件概述

5月22日DeepSeek V4-Pro永久降价后,5月27日小米跟进,宣布MiMo-V2.5系列API永久降价,最高降幅达99%,不区分输入长度。同时Token Plan计费体系优化,定价不变但Credits提升至原来的5-8倍。

核心信息

  • 降价关键条件:超低价(如MiMo-V2.5-Pro输入0.025元/百万Tokens)仅当请求命中缓存时生效;未命中缓存时输入3元/百万Tokens,输出6元/百万Tokens。
  • Token Plan新额度:Lite/Standard/Pro/Max月费不变(39/99/329/659元),Credits分别提升至41亿、110亿、380亿、820亿。
  • 工程支撑:基于SGLang HiCache完整支持Sliding Window Attention,将KV Cache多级存储数据搬运量降至近七分之一,可缓存token数提升近五倍;同时优化专家并行和输入长度分桶策略。
  • 战略意图:通过低价吸引开发者和高频应用(Agent、代码助手、长上下文应用),累积真实调用数据以迭代模型,争夺Agent生态入口。小米此前百万亿Token激励计划提前发放完毕,显示需求旺盛。

值得关注

  • 小米大模型负责人罗福莉此前反对无成本支撑的Token价格战,但本次降价基于工程优化,实现可持续低价,体现“工程暴力”而非单纯补贴。
  • 继DeepSeek之后,国产模型缓存命中输入价已统一至0.025元水平,价格战考验推理工程能力和后方业务厚度(小米有手机、汽车、IoT等主业输血)。
  • 中小模型公司难以长期跟进,市场将向具备工程能力、算力调度和生态入口的厂商集中,下一阶段竞争焦点转向模型质量、Agent适配和开发者工具。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。