智象未来 HiDream-O1-Image-1.5 登顶文生图榜单，中国第一、全球第二

2026/06/10 19:52阅读量 3

智象未来（HiDream.ai）商用图像生成模型 HiDream-O1-Image-1.5 在 Artificial Analysis 文生图榜单上取得 ELO 1265 分，排名中国第一、全球第二，超越谷歌、英伟达和字节跳动等主流模型。该模型基于原生全模态架构 UiT，在文字渲染、复杂排版、多主体一致性和分镜叙事等任务上表现突出。

事件概述

智象未来（HiDream.ai）全新商用图像生成模型 HiDream-O1-Image-1.5 在全球 AI 模型评测平台 Artificial Analysis 的文生图榜单（Text to Image Leaderboard）上，以 1265 ELO 的成绩位列中国第一、全球第二，仅次于 OpenAI，超越 Google Nano Banana 2（Gemini 3.1 Flash Image Preview）、NVIDIA Cosmos3-Super-Text2Image 和字节跳动 Seedream 4.0 等模型。

此前，HiDream-O1 系列的开源模型 HiDream-O1-Image-Dev-2604 已登顶开源模型全球第一。本次商用版本的 SOTA 进一步验证了团队在图像生成大模型上的实力，标志着其已进入全球第一梯队。

核心信息

评测机制：Artificial Analysis 使用匿名对比、用户投票和 ELO 动态排名，减少品牌认知偏差，更接近真实用户偏好。
技术架构：HiDream-O1-Image-1.5 采用智象未来自研的像素级原生全模态架构 Unified Transformer (UiT)，剔除了传统 VAE 和独立文本编码器，将图像像素、文本 Token 等原始信号映射到同一共享 Token 空间，实现底层融合，从而在文字渲染、复杂排版、多主体一致性、多分镜叙事等复杂任务中表现出色。
功能亮点：模型在人像摄影级画质、动物精细建模、自然风光空间层次、多种艺术风格理解、电商海报图文融合、IP 形象多视角一致性、多宫格分镜叙事、多层次复杂文字渲染（中英文混排、图表、公式）等方面均有稳定产出，面向广告营销、品牌设计、电商视觉、游戏内容、影视分镜等商用场景。

值得关注

HiDream-O1-Image-1.5 的快速迭代验证了 UiT 原生全模态架构的可扩展性，将图像生成模型竞争从“更大参数”推进到架构能力、生产效率和工作流价值共同决定的新阶段。智象未来表示将继续沿原生全模态路线推进图像、视频、动作等多模态融合，加速构建下一代内容生产与智能交互基础设施。

商用模型体验：https://vivago.ai/ 及 https://hiharness.ai/；开源模型（HiDream-O1-Image）代码及权重已在 GitHub 和 Hugging Face 开放。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？