商汤新模型SenseNova-U1 Pro曝光:对标GPT-Image-2,主攻设计赛道

2026/06/25 17:40阅读量 2

商汤科技在股东大会上预告下一代多模态基座模型SenseNova-U1 Pro,定位“理解·生成·行动”原生统一,对标GPT-Image-2,将于2026年7月启动邀请测试。该模型支持原生8K分辨率输出,在复杂设计任务(如国画长卷、杂志跨页、电影分镜)中展示出优于GPT-Image-2的能力,标志着“设计”正成为多模态模型竞争的新焦点。

事件概述

商汤科技在股东大会上首次对外预告下一代旗舰多模态基座模型——SenseNova-U1 Pro(日日新系列)。该模型定位为业界首个以“理解·生成·行动”原生统一为内核的多模态智能体基座,预计2026年7月启动邀请测试。商汤明确将GPT-Image-2作为对标对象,并将“交付级”设计作为重要应用赛道。

核心能力

  • 多模态原生统一:在同一内核内打通多模态理解与生成,具备图文交错思维能力,能像“会思考的设计师”一样实现设计、生成、评审的长程循环。
  • 原生8K分辨率:支持原生8K分辨率输出,而GPT-Image-2当前仅支持4K。
  • 自主生成复杂内容:股东大会全套20余页PPT由该模型一次性生成,包括规划、思考、制作、评估全过程。

应用展示(与GPT-Image-2对比)

  1. 国画风“二十四节气”:同一提示词下,SenseNova-U1 Pro完整呈现全部24个节气,逐一标注日期与序号,四季分区清晰;GPT-Image-2生成内容存在缺失。
  2. 国画长卷(横版):一句提示词直出,24个节气完整有序,每格配独立国画插图与气候描述。
  3. 杂志跨页:生成GQ风格“007·阿斯顿·马丁DB5座驾档案”横版跨页,包含车辆规格参数、多角度图集、车主历史时间轴等,版式达到商业出版可用水准。
  4. 学术海报:一键输出SenseNova U1论文海报,含架构图、基准表格与可识别二维码;GPT-Image-2版本留白偏多、密度偏低。
  5. 电影分镜:基于同一段深夜暗巷追逐戏提示词,SenseNova-U1 Pro输出16000×24000+像素、含40-60格的导演级分镜稿,每格附景别、机位与情绪标注;GPT-Image-2仅输出1024×1536,放大后细节失真。

行业影响

行业普遍预测OpenAI即将发布聚焦设计领域的模型。商汤此次预告SenseNova-U1 Pro,表明在编程之外,“设计”正在成为顶级多模态模型的下一个主要赛场。当模型能力突破工业红线,将给产品开发、平面设计、工业设计、视频制作、城市和园区规划等行业带来变革性升级。此外,该模型还将作为数字智能与物理智能融合的技术基座,驱动AI走向更广阔的物理空间。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。