小米揭晓OpenRouter榜首模型Hunter Alpha:MiMo-V2-Pro万亿参数,代码能力超越Claude

小米正式官宣其神秘模型Hunter Alpha即为MiMo-V2-Pro,该模型以万亿参数规模、百万级上下文窗口及卓越的代码与智能体规划能力,在OpenRouter平台长期霸榜。评测显示,MiMo-V2-Pro在Artificial Analysis全球指数中位列第八,代码能力超越Claude 4.6 Sonnet,并凭借自研资源管理系统大幅降低算力成本。此外,小米同步发布了全模态模型MiMo-V2-Omni与情感语音模型MiMo-V2-TTS,构建了完整的智能体工作流生态。

事件概述

占据OpenRouter调用量榜单第一的神秘模型Hunter Alpha已正式揭晓身份,其为小米发布的旗舰大模型MiMo-V2-Pro。该模型此前因匿名测试表现优异,引发包括“龙虾之父”Peter Steinberger在内的全球关注,甚至被误认为是GPT或DeepSeek系列。小米团队于3月19日官宣了MiMo-V2家族三款新模型:Pro(即Hunter Alpha)、OmniTTS

核心信息:MiMo-V2-Pro技术规格与性能

  • 架构与规模

    • 总参数量突破1T(万亿),激活参数达42B
    • 上下文窗口支持1M Token,约为前代MiMo-V2-Flash的三倍。
    • 采用混合注意力机制,混合比例从5:1提升至7:1,兼顾超大规模与推理效率。
    • 搭配轻量级MTP多Token预测层,确保长文本生成速度。
  • 性能评测数据

    • 综合排名:在Artificial Analysis全球智能指数中位列全球第8国内第2
    • 智能体能力:PinchBench得分84.0,ClawEval得分61.5,整体表现超越Gemini 3 Pro,逼近Claude Opus 4.6。
    • 代码能力:SWE-bench Verified测试得分86.7,直接超越Claude 4.6 Sonnet。实测可仅凭提示词生成包含动态背景和升级路线的3D塔防游戏代码,以及具有复古风格的网页。
    • 生产环境验证:在OpenClaw框架下贡献了675B Token的使用量,Kilo Code和Roo Code分别达到50.1B和38.6B Token。
  • 底层系统优化

    • 联合北京大学研发统一资源管理系统ARL-Tangram,采用动作级公式和弹性调度算法。
    • 将平均动作完成时间提升4.3倍,训练步骤持续时间缩短至多1.5倍
    • 算力成本与外部资源消耗大幅降低71.2%

值得关注:MiMo-V2家族其他成员

  • MiMo-V2-Omni(全模态模型):

    • 将图像、视频和音频编码器融合进单一主干网络,实现“看、听、读”一体化感知。
    • 具备自主行动能力,可充当自动驾驶视觉大脑预测危险,或作为智能体基模在浏览器内自主完成跨平台比价、购物及工具调用。
  • MiMo-V2-TTS(语音合成模型):

    • 专为智能体赋予情感,支持通过自然语言精确控制音色和情绪走向。
    • 能根据上下文自动判断语气,并自然加入咳嗽、叹气、笑声等细节。

背景回顾

Hunter Alpha与Healer Alpha于3月11日亮相OpenRouter,随后连续多日霸榜,总使用量迅速突破1T Token。其真实身份曾引发广泛猜测,直至小米发布会才正式确认。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。