Mistral 发布 Medium 3.5 模型:SWE-Bench 验证达 77.6%

2026/04/30 16:05阅读量 2

Mistral AI 正式推出 Medium 3.5 模型,该模型在 SWE-Bench 基准测试中取得了 77.6% 的解决率。此次发布同时引入了“Vibe remote agents”概念,旨在提升软件工程的自动化能力。

事件概述

Mistral AI 发布了其最新的 Medium 3.5 模型,并提出了“Vibe remote agents”(氛围远程智能体)的概念,以增强其在软件工程领域的应用能力。

核心信息

  • 模型名称:Medium 3.5
  • 关键指标:在 SWE-Bench(Software Engineering Benchmark)基准测试中,解决率达到 77.6%。
  • 新特性:引入“Vibe remote agents”,专注于通过远程协作模式优化软件开发流程。

值得关注

该模型在 SWE-Bench 上的表现标志着 Mistral 在代码生成与修复任务上的显著进步,为自动化软件工程提供了新的技术参考。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。