阿里千问Qwen3.7-Plus上线:多模态智能体新基座,可一键复刻桌面专业软件

2026/06/02 11:15阅读量 2

6月2日,阿里巴巴发布千问3.7系列多模态大模型Qwen3.7-Plus,文本与视觉能力大幅提升,在Vision Arena榜单中跻身全球前五、中国第一。该模型实现多模态混合智能体,将“看、想、写、做、验”整合为统一工作流,可复刻手机APP和桌面端专业软件,已上线阿里云百炼提供API服务。

事件概述

阿里巴巴于2026年6月2日发布千问3.7系列多模态大模型Qwen3.7-Plus,该模型在文本与视觉能力上实现大幅提升,在全球视觉大模型榜单Vision Arena中排名全球前五、中国第一。

核心能力

Qwen3.7-Plus实现了多模态混合智能体的突破,能将图像、视频、屏幕、网页和文本输入统一处理,并在GUI/CLI/工具环境中完成任务。其智能体工作流整合了“看、想、写、做、验”五个环节,可进行深度推理、自我编程、调用工具、验证测试并自主迭代。

该模型具备以下具体能力:

  • 视觉智能体:结合视觉理解、代码解释器和搜索增强,解决视觉谜题、真实世界问答和复杂推理任务。
  • 视觉编程:从图像或视频生成SVG、网页和交互式前端,实现视觉参考到代码的端到端转化。
  • GUI智能体:理解移动端和桌面端界面,进行控件定位、任务规划和多步操作。
  • 真实世界感知与推理:覆盖真实场景、文档图表、OCR、视频和驾驶场景理解。

应用与可用性

Qwen3.7-Plus能轻松完成一键复刻手机APP应用、桌面端专业软件等复杂长程任务。目前该模型已上线阿里云百炼,对外提供API服务,同时可通过Qwen Studio进行体验。相关博客和平台链接已对外开放。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。