MiniMax发布M3模型:1M超长上下文+稀疏注意力架构,竞争聚焦Agent能力
2026/06/01 17:38阅读量 2
6月1日,MiniMax发布新一代M3模型,采用自研稀疏注意力架构MSA,支持100万token上下文,推理成本降至上一代1/20。M3在编程和Agent基准测试中超越GPT-5.5、Gemini 3.1 Pro等闭源模型,并推出低价订阅方案,以开源+全能定位争夺企业级市场。
事件概述
6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MiniMax Sparse Attention(MSA),在编程及智能体能力、超长上下文及原生多模态等多个方向实现代际突破。MiniMax称M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。
核心架构与性能
- 稀疏注意力架构MSA:相较传统全注意力机制,显著降低长上下文下的计算成本,上下文窗口提升至100万token。在100万上下文规模下,单token计算量仅为上一代模型的约1/20,推理效率大幅提升。MiniMax还优化了底层推理算子,通过重新设计数据读取与计算路径,相关性能较主流开源方案提升4倍以上。
- 编程与Agent能力:在SWE-Bench Pro上,M3超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7;在SVG-Bench上超过Opus 4.7;在OmniDocBench上得分超过Gemini 3.1 Pro;在面向自主Agent的端到端评测框架Claw-Eval上获得最高分。
- 训练创新:M3在编程与Agent训练中引入交互式用户模拟器框架,模拟真实开发者在协作过程中的行为模式,使模型在训练和评测阶段接触更接近生产环境的交互场景。训练起点采用文本、图片、视频等多模态混合训练,模型支持图像与视频理解,并具备桌面操作能力(Computer Use)。
商业化与生态
- MiniMax Code同步更新:专为M3设计的Agent产品,可将大型任务拆解为多阶段、可并发、可动态调整的工作流,由Agent集群协作推进。
- 订阅方案:MiniMax推出Token Plan订阅方案,大幅降低使用成本。Plus版每月49元(6亿token),Max版每月119元(18亿token),Ultra版每月469元(55亿token)。
- 定位:以“开源+全能”差异化定位,瞄准对数据隐私敏感且对智能体性能要求高的企业级核心客群。
