小米发布 MiMo V2 系列模型:代号 Hunter Alpha 被误认为 DeepSeek,主打 Agent 全栈能力
小米官方确认此前在 OpenRouter 平台匿名上线并引发全网猜测的「Hunter Alpha」和「Healer Alpha」实为小米 MiMo 大模型的早期内测版本。此次发布的 MiMo-V2 系列包含文本基座、全模态 Agent 及语音合成三款模型,旨在推动 AI 从对话向自主完成任务的 Agent 范式转变。该系列模型在推理效率、多模态理解及情感化语音表达上取得突破,并将作为核心智能中枢接入小米“人车家”全生态。
事件概述
上周,两个未署名的匿名模型「Hunter Alpha」和「Healer Alpha」悄然上架知名 API 聚合平台 OpenRouter,凭借不寻常的调用量攀升速度(累计突破 1T tokens)引发社区热议,主流猜测指向 DeepSeek V4 的内测版。近日,小米官方正式揭晓谜底:这两个代号均为MiMo 大模型的早期内测版本。小米 MiMo 大模型负责人罗福莉(前 DeepSeek 研究员)公开认领,标志着小米在 AI 领域从“会对话”向“能完成任务”的 Agent 范式转型正式落地。
核心信息:MiMo-V2 系列三大模型详解
小米此次一口气发布三款侧重点不同但协同工作的模型,共同构建全栈 AI 能力:
1. MiMo-V2-Pro:旗舰文本基座,主打推理与规划
- 定位:专为高强度 Agent 工作场景设计,负责推理、规划与工具调用。
- 架构与性能:
- 总参数量突破 1T,激活参数 42B(较前代扩大约 3 倍)。
- 采用创新的混合注意力架构(Hybrid Attention),混合比例提升至 7:1,引入轻量 MTP 层加速生成。
- 支持高达 1M 的超长上下文窗口。
- 在 Artificial Analysis 全球榜单位列第 8,国内第 2;代码工程能力接近 Claude Opus 4.6。
- 定价策略:极具竞争力的价格,API 成本约为同级别竞品的 1/5。
- 256K 上下文内:输入 $1/百万 tokens,输出 $3/百万 tokens。
- 1M 上下文内:输入 $2/百万 tokens,输出 $6/百万 tokens。
- 生态合作:联合 OpenClaw、OpenCode 等五大 Agent 框架团队提供限时免费接口,目前已开放 API 服务。
2. MiMo-V2-Omni:全模态 Agent 基座,打通感知与执行
- 定位:首个在基座层面统一感知与行动的模型,融合文本、视觉与音频,实现端到端任务完成。
- 核心能力:
- 音频理解:支持超过 10 小时连续长音频处理,表现超越 Gemini 3 Pro。
- 视觉推理:在多学科视觉推理与复杂图表分析上逼近顶尖闭源模型水平。
- 视频理解:原生支持音视频联合输入,而非分离处理。
- Agent 实操:可像真人一样操控浏览器进行跨平台比价、联系客服、下单等操作;能自动修复渲染错误并完成视频制作发布全流程。
- 办公应用:已接入金山办公 WPS 灵犀,原生支持 Word、Excel、PPT、PDF 四大格式,覆盖超 95% 日常文档类型。
- 定价:输入 $0.4/百万 tokens,输出 $2/百万 tokens。
3. MiMo-V2-TTS:情感化语音合成大模型
- 定位:为 Agent 赋予有温度、有情感的声音表达能力,补齐全栈最后一环。
- 技术亮点:
- 基于自研 Audio Tokenizer 和多码本语音文本联合建模架构,经过上亿小时语音数据预训练。
- 支持从整体基调到句内局部情绪的多粒度控制,能自然处理语气转折与情感递变。
- 涵盖东北话、四川话、粤语等多种方言,具备角色扮演与高质量歌声合成能力。
- 未来规划:将与 MiMo-V2-Omni 深度融合,实现“看懂世界”到“讲述世界”的闭环。
战略意义:AI 驱动“人车家”全生态
此次发布不仅是模型能力的展示,更是小米“人车家全生态”战略的关键拼图:
- 范式转变:罗福莉透露,团队早在数月前便布局 1T 基础模型,并在体验复杂 Agent 框架后迅速调整方向,强制要求团队转向 Agent 研发,以应对行业快速变化。
- 生态中枢:MiMo-V2 系列将作为智能中枢,通过澎湃 OS 连接手机、汽车(SU7 系列)与智能家居。
- MiMo-V2-Pro 负责跨设备意图理解与任务规划。
- MiMo-V2-Omni 负责多模态感知与执行。
- MiMo-V2-TTS 负责交互表达。
- 落地形态:miclaw(小米手机端 AI 智能体)已率先接入 MiMo 大模型,具备系统级执行能力;WPS 灵犀、小米浏览器等应用也已相继接入,标志着 MiMo 正从单一产品向基础能力层渗透。
目前,MiMo-V2-Pro 和 MiMo-V2-Omni 已开放 API 服务,开发者可通过 https://platform.xiaomimimo.com 接入体验。
