MiniMax 推出 Mavis:以对抗式多 Agent 架构破解 AI Agent 的“上下文焦虑”
2026/05/13 21:13阅读量 2
MiniMax 发布 Mavis(MiniMax as a Jarvis),采用 Leader/Worker/Verifier 对抗式多 Agent 架构,通过工程级状态机取代模型“拍脑门”决策,有效解决长程任务中 Agent 频繁停顿确认、上下文污染等问题。实测显示其在复杂长程任务、多任务并行、IM 集成等方面表现优于同类产品,同时将 Token 和 Agent 套餐合并统一。
事件概述
MiniMax 近日更新其 Agent 桌面端,正式上线名为 Mavis 的多 Agent 协作模式。Mavis 基于 MiniMax 自研的 Team Engine 引擎,将 Agent 团队分为 Leader(管理者)、Worker(执行者)和 Verifier(验收者)三类核心角色,并引入 Worker 与 Verifier 之间的“对抗”机制,以工程层面的确定性约束模型的随机性和不可控性。
核心信息
- 解决关键痛点:上下文焦虑:MiniMax 在技术博客中指出,传统单 Agent 面对超长任务时,由于模型对“任务完成”判断模糊,会频繁“停下来确认”,导致用户需不断手动批准后续步骤。Mavis 通过多 Agent 分工和状态机编排,让 Worker 专注于执行,Verifier 专门验收,Leader 负责协调,从根本上避免了模型“既当裁判又当选手”的问题。
- 典型工作流:用户下达任务后,Leader 自动拆解为子任务,分配至多个 Worker 并行执行。每个 Worker 完成后将结果提交给 Leader,Leader 随即生成对应的 Verifier 对交付物进行审查。Verifier 可判定“失败”并触发对应 Worker 重新执行,形成对抗式闭环。在实测中,一个复杂的研究任务经历了数十次这样的“1v1”对抗,Agent 之间铁面无私,显著提升了输出质量。
- 上下文隔离与多任务并行:Mavis 支持通过微信、飞书等 IM 平台接入。其核心设计之一是将“秒回”与“执行”逻辑解耦,每个 Agent Team 及团队内各 Agent 只看到与自己任务相关的信息摘要,实现端到端上下文隔离。这使得用户可在一个会话中同时发起多个长程任务,Agent 不会因上下文污染而混乱。测试中,在极短时间内分配 8 个任务均未出现语境错乱。
- 套餐额度统一:MiniMax 将原有的 Token Plan 和 Agent Plan 合并,用户可在一个统一套餐下使用官网/App 对话、Agent 功能、API 调用(包括 M2.7 旗舰模型及音乐、视频、语音等多模态模型)。此前同时订阅两个方案的用户将获赠一个月会员。
值得关注
- 对抗式架构 vs 传统提示词编排:MiniMax 指出,此前主流多 Agent 框架本质上是靠提示词让模型“角色扮演”,容易遇到上下文焦虑、长程退化、自检困难等问题。Mavis 的 Team Engine 在工程层面通过状态机控制角色职责和交接时机,使多 Agent 协作具备更强的可控性和稳定性,体感上明显优于同类产品。
- 共识成本问题:MiniMax 在技术博客中提出“共识成本”概念,包括交接成本、共享成本、聚合成本。多个 Agent 相互制衡虽提升了可靠性,但 token 消耗数倍于单 Agent,且在极端情况下可能因“吵架”偏离主题,准确率不升反降。这仍是该架构需要持续优化的方向。
- 行业意义:在模型 API 极度商品化的背景下,MiniMax 率先拆除产品矩阵内部分割墙,统一套餐策略有助于提升用户忠诚度。而 Mavis 的推出,也印证了业内观点——“对 Coding/Agent 认真的模型厂商,必须做自己的独立 Agent 产品”。
