智象未来 HiDream-O1-Image-1.5 登顶文生图榜单,中国第一、全球第二

2026/06/10 19:52阅读量 3

智象未来(HiDream.ai)商用图像生成模型 HiDream-O1-Image-1.5 在 Artificial Analysis 文生图榜单上取得 ELO 1265 分,排名中国第一、全球第二,超越谷歌、英伟达和字节跳动等主流模型。该模型基于原生全模态架构 UiT,在文字渲染、复杂排版、多主体一致性和分镜叙事等任务上表现突出。

事件概述

智象未来(HiDream.ai)全新商用图像生成模型 HiDream-O1-Image-1.5 在全球 AI 模型评测平台 Artificial Analysis 的文生图榜单(Text to Image Leaderboard)上,以 1265 ELO 的成绩位列中国第一、全球第二,仅次于 OpenAI,超越 Google Nano Banana 2(Gemini 3.1 Flash Image Preview)、NVIDIA Cosmos3-Super-Text2Image 和字节跳动 Seedream 4.0 等模型。

此前,HiDream-O1 系列的开源模型 HiDream-O1-Image-Dev-2604 已登顶开源模型全球第一。本次商用版本的 SOTA 进一步验证了团队在图像生成大模型上的实力,标志着其已进入全球第一梯队。

核心信息

  • 评测机制:Artificial Analysis 使用匿名对比、用户投票和 ELO 动态排名,减少品牌认知偏差,更接近真实用户偏好。
  • 技术架构:HiDream-O1-Image-1.5 采用智象未来自研的像素级原生全模态架构 Unified Transformer (UiT),剔除了传统 VAE 和独立文本编码器,将图像像素、文本 Token 等原始信号映射到同一共享 Token 空间,实现底层融合,从而在文字渲染、复杂排版、多主体一致性、多分镜叙事等复杂任务中表现出色。
  • 功能亮点:模型在人像摄影级画质、动物精细建模、自然风光空间层次、多种艺术风格理解、电商海报图文融合、IP 形象多视角一致性、多宫格分镜叙事、多层次复杂文字渲染(中英文混排、图表、公式)等方面均有稳定产出,面向广告营销、品牌设计、电商视觉、游戏内容、影视分镜等商用场景。

值得关注

HiDream-O1-Image-1.5 的快速迭代验证了 UiT 原生全模态架构的可扩展性,将图像生成模型竞争从“更大参数”推进到架构能力、生产效率和工作流价值共同决定的新阶段。智象未来表示将继续沿原生全模态路线推进图像、视频、动作等多模态融合,加速构建下一代内容生产与智能交互基础设施。

商用模型体验:https://vivago.ai/https://hiharness.ai/;开源模型(HiDream-O1-Image)代码及权重已在 GitHub 和 Hugging Face 开放。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。