智象未来发布超2000亿参数原生全模态图像大模型，半月内再获融资

2026/05/20 22:09阅读量 2

智象未来在首届开放日上发布基于原生全模态架构UiT的图像大模型HiDream-O1-Image-Pro，参数超2000亿，在多个基准测试中刷新SOTA。该模型将图像、文本和任务条件统一编码，突破传统多模态拼接局限。同时公司半月内完成新一轮亿级融资，资方包括深创投、金浦投资等，并推出三大智能体产品加速商业化。

事件概述

5月19日，智象未来在首届开放日上正式发布基于原生全模态架构Unified Transformer（UiT）的图像大模型HiDream-O1-Image-Pro，参数量超过2000亿。该模型在通用文生图、高保真文字渲染、多样化场景生成、图像编辑等任务中达到新的SOTA水平。此前，其8B参数开源版本HiDream-O1-Image曾在Artificial Analysis文生图榜单上登顶开源模型全球第一。

核心信息：原生全模态架构

与当前主流的潜在扩散模型（LDM）不同，智象未来采用原生全模态架构，将原始图像像素、离散文本标记和任务条件统一纳入连续共享标记空间实现深度融合，而非图像与文本分离编码。智象未来创始人梅涛表示，原生全模态是从一开始就将世界规则刻进模型，使其能真正理解物理定律、空间关系和因果逻辑。CTO姚霆指出，该架构具备“Any to Any”能力，支持任意输入到任意输出，是世界模型所需的核心能力。

融资与商业化

智象未来在半月内完成多轮融资：此前宣布超5亿元融资后，开放日上又宣布完成由深创投、金浦投资、财鑫资本、复聚资本等参与的新一轮亿级融资。公司采用“1+1+3”业务架构：底层为HiDream系列大模型，中层为HiHarness企业服务平台，上层覆盖商业营销、影视创作和社媒创作三大场景的智能体产品。

商业营销智能体HiBurst：已覆盖TikTok、Meta、抖音等平台，成为TikTok官方top5服务商，年生产电商营销视频超百万条，覆盖GMV超亿元。
AI影视创作智能体“帧赞”：实现“创意-分镜-成片”全流程，已制作短漫剧超5000分钟，入驻专业团队与生态合作伙伴超千家。
社媒创作智能体vivago：支持端到端长思考生成分钟级故事视频，覆盖100多个国家及地区超4000万用户，曾登Product Hunt日榜第一。

此外，智象未来与上海电影集团、蓝色光标、北京捷成世纪、倍尔健康达成战略合作，推动在影视、营销、跨境电商、医疗等领域的产业化落地。

阅读原文详情

事件概述

核心信息：原生全模态架构

融资与商业化

准备好启动您的定制项目了吗？