阿里千问3.5预览版登顶LMArena榜单,超越GPT-5.4等海外模型

3月20日,全球知名大模型盲测榜单LMArena更新排名,阿里巴巴Qwen3.5-Max-Preview以1464分的成绩位列第一。该模型在整体性能、专家级文本能力及数学能力上均表现优异,超越了GPT-5.4、Grok 4.1等国际顶级模型。作为千问3.5系列的旗舰预览版,其展现了中国大模型在综合评测中的领先地位。

事件概述

3月20日,全球权威的大模型盲测榜单LMArena发布最新一期排名。阿里巴巴最新推出的旗舰模型预览版 Qwen3.5-Max-Preview(千问3.5)首次亮相即斩获 1464分,成功登顶榜首。

核心数据与对比

  • 得分情况:Qwen3.5-Max-Preview 获得 1464 分。
  • 竞品对比:该分数超过了包括 GPT-5.4Grok 4.1 在内的多个海外顶级模型。
  • 能力定位:在整体性能、专家级文本处理能力以及数学解题能力方面,该模型均位列中国第一。

背景信息

  • 发布时间线:千问3.5系列于今年除夕正式发布。
  • 开源规模:目前已开源从 0.8B 到 397B 共 8 款不同参数量级的模型。
  • 本次版本:此次参赛的 Qwen3.5-Max-Preview 为千问3.5系列的旗舰模型预览版。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。