Artificial Analysis 最新榜单:阿里千问 Qwen3.7-Max 登顶国产模型,全球第五
2026/05/21 17:16阅读量 3
Independent evaluation platform Artificial Analysis released its latest global LLM leaderboard on May 21, 2026. Alibaba's Qwen3.7-Max scored 56.6, surpassing all other domestic models and ranking fifth globally, behind only GPT, Claude, and Gemini variants. The model is designed for agentic tasks and will soon be available via Alibaba Cloud Bailian API.
事件概述
2026年5月21日,第三方评测机构 Artificial Analysis 发布了全球大模型最新榜单。阿里新旗舰模型 Qwen3.7-Max 以总分 56.6 位列全球第五、国产第一,超越了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,性能逼近 GPT-5.4(xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7(max)等顶尖模型。
核心信息
- 评分与排名:Qwen3.7-Max 得分为 56.6,较上代旗舰 Qwen3.6-Max-Preview 进步 4.8 分,全球排名第五。
- 国产对比:该模型在国产模型中首次问鼎,超越此前表现最好的 Kimi-K2.6 等模型。
- 模型定位:Qwen3.7-Max 专为 Agent 智能体场景设计,在编程、智能体协作、推理等核心能力上实现大幅突破。
- 生态与能力:可与 Claude Code、OpenClaw、Hermes Agent、Qwen Code 等 Agent 框架协同,独立完成 35 小时、超 1000 次工具调用的复杂长程任务。
- 服务上线:Qwen3.7-Max 即将在阿里云百炼平台对外提供 API 服务。
值得关注
Artificial Analysis 是业内公认最具影响力的第三方大模型评测平台之一,其榜单涵盖多维度基准测试。阿里千问系列已多次登上该榜单前列,此次 Qwen3.7-Max 在国产模型中首次跻身全球前五,显示国产大模型在 Agent 智能体方向的技术突破接近国际第一梯队。
