阿里千问3.5预览版登顶LMArena榜单,超越GPT-5.4等海外模型
3月20日,全球知名大模型盲测榜单LMArena更新排名,阿里巴巴Qwen3.5-Max-Preview以1464分的成绩位列第一。该模型在整体性能、专家级文本能力及数学能力上均表现优异,超越了GPT-5.4、Grok 4.1等国际顶级模型。作为千问3.5系列的旗舰预览版,其展现了中国大模型在综合评测中的领先地位。
事件概述
3月20日,全球权威的大模型盲测榜单LMArena发布最新一期排名。阿里巴巴最新推出的旗舰模型预览版 Qwen3.5-Max-Preview(千问3.5)首次亮相即斩获 1464分,成功登顶榜首。
核心数据与对比
- 得分情况:Qwen3.5-Max-Preview 获得 1464 分。
- 竞品对比:该分数超过了包括 GPT-5.4、Grok 4.1 在内的多个海外顶级模型。
- 能力定位:在整体性能、专家级文本处理能力以及数学解题能力方面,该模型均位列中国第一。
背景信息
- 发布时间线:千问3.5系列于今年除夕正式发布。
- 开源规模:目前已开源从 0.8B 到 397B 共 8 款不同参数量级的模型。
- 本次版本:此次参赛的 Qwen3.5-Max-Preview 为千问3.5系列的旗舰模型预览版。
