Mistral 发布 Medium 3.5 模型:SWE-Bench 验证达 77.6%
2026/04/30 16:05阅读量 2
Mistral AI 正式推出 Medium 3.5 模型,该模型在 SWE-Bench 基准测试中取得了 77.6% 的解决率。此次发布同时引入了“Vibe remote agents”概念,旨在提升软件工程的自动化能力。
事件概述
Mistral AI 发布了其最新的 Medium 3.5 模型,并提出了“Vibe remote agents”(氛围远程智能体)的概念,以增强其在软件工程领域的应用能力。
核心信息
- 模型名称:Medium 3.5
- 关键指标:在 SWE-Bench(Software Engineering Benchmark)基准测试中,解决率达到 77.6%。
- 新特性:引入“Vibe remote agents”,专注于通过远程协作模式优化软件开发流程。
值得关注
该模型在 SWE-Bench 上的表现标志着 Mistral 在代码生成与修复任务上的显著进步,为自动化软件工程提供了新的技术参考。
