商汤新模型SenseNova-U1 Pro曝光：对标GPT-Image-2，主攻设计赛道

2026/06/25 17:40阅读量 2

商汤科技在股东大会上预告下一代多模态基座模型SenseNova-U1 Pro，定位“理解·生成·行动”原生统一，对标GPT-Image-2，将于2026年7月启动邀请测试。该模型支持原生8K分辨率输出，在复杂设计任务（如国画长卷、杂志跨页、电影分镜）中展示出优于GPT-Image-2的能力，标志着“设计”正成为多模态模型竞争的新焦点。

事件概述

商汤科技在股东大会上首次对外预告下一代旗舰多模态基座模型——SenseNova-U1 Pro（日日新系列）。该模型定位为业界首个以“理解·生成·行动”原生统一为内核的多模态智能体基座，预计2026年7月启动邀请测试。商汤明确将GPT-Image-2作为对标对象，并将“交付级”设计作为重要应用赛道。

核心能力

多模态原生统一：在同一内核内打通多模态理解与生成，具备图文交错思维能力，能像“会思考的设计师”一样实现设计、生成、评审的长程循环。
原生8K分辨率：支持原生8K分辨率输出，而GPT-Image-2当前仅支持4K。
自主生成复杂内容：股东大会全套20余页PPT由该模型一次性生成，包括规划、思考、制作、评估全过程。

应用展示（与GPT-Image-2对比）

国画风“二十四节气”：同一提示词下，SenseNova-U1 Pro完整呈现全部24个节气，逐一标注日期与序号，四季分区清晰；GPT-Image-2生成内容存在缺失。
国画长卷（横版）：一句提示词直出，24个节气完整有序，每格配独立国画插图与气候描述。
杂志跨页：生成GQ风格“007·阿斯顿·马丁DB5座驾档案”横版跨页，包含车辆规格参数、多角度图集、车主历史时间轴等，版式达到商业出版可用水准。
学术海报：一键输出SenseNova U1论文海报，含架构图、基准表格与可识别二维码；GPT-Image-2版本留白偏多、密度偏低。
电影分镜：基于同一段深夜暗巷追逐戏提示词，SenseNova-U1 Pro输出16000×24000+像素、含40-60格的导演级分镜稿，每格附景别、机位与情绪标注；GPT-Image-2仅输出1024×1536，放大后细节失真。

行业影响

行业普遍预测OpenAI即将发布聚焦设计领域的模型。商汤此次预告SenseNova-U1 Pro，表明在编程之外，“设计”正在成为顶级多模态模型的下一个主要赛场。当模型能力突破工业红线，将给产品开发、平面设计、工业设计、视频制作、城市和园区规划等行业带来变革性升级。此外，该模型还将作为数字智能与物理智能融合的技术基座，驱动AI走向更广阔的物理空间。

阅读原文详情

事件概述

核心能力

应用展示（与GPT-Image-2对比）

行业影响

准备好启动您的定制项目了吗？