MiniMax发布M3模型：1M超长上下文+稀疏注意力架构，竞争聚焦Agent能力

2026/06/01 17:38阅读量 2

6月1日，MiniMax发布新一代M3模型，采用自研稀疏注意力架构MSA，支持100万token上下文，推理成本降至上一代1/20。M3在编程和Agent基准测试中超越GPT-5.5、Gemini 3.1 Pro等闭源模型，并推出低价订阅方案，以开源+全能定位争夺企业级市场。

事件概述

6月1日，国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MiniMax Sparse Attention（MSA），在编程及智能体能力、超长上下文及原生多模态等多个方向实现代际突破。MiniMax称M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型，也是目前全球唯一具备完整能力组合的开源选项。

核心架构与性能

稀疏注意力架构MSA：相较传统全注意力机制，显著降低长上下文下的计算成本，上下文窗口提升至100万token。在100万上下文规模下，单token计算量仅为上一代模型的约1/20，推理效率大幅提升。MiniMax还优化了底层推理算子，通过重新设计数据读取与计算路径，相关性能较主流开源方案提升4倍以上。
编程与Agent能力：在SWE-Bench Pro上，M3超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7；在SVG-Bench上超过Opus 4.7；在OmniDocBench上得分超过Gemini 3.1 Pro；在面向自主Agent的端到端评测框架Claw-Eval上获得最高分。
训练创新：M3在编程与Agent训练中引入交互式用户模拟器框架，模拟真实开发者在协作过程中的行为模式，使模型在训练和评测阶段接触更接近生产环境的交互场景。训练起点采用文本、图片、视频等多模态混合训练，模型支持图像与视频理解，并具备桌面操作能力（Computer Use）。

商业化与生态

MiniMax Code同步更新：专为M3设计的Agent产品，可将大型任务拆解为多阶段、可并发、可动态调整的工作流，由Agent集群协作推进。
订阅方案：MiniMax推出Token Plan订阅方案，大幅降低使用成本。Plus版每月49元（6亿token），Max版每月119元（18亿token），Ultra版每月469元（55亿token）。
定位：以“开源+全能”差异化定位，瞄准对数据隐私敏感且对智能体性能要求高的企业级核心客群。

阅读原文详情

事件概述

核心架构与性能

商业化与生态

准备好启动您的定制项目了吗？