智象未来发布超2000亿参数原生全模态图像大模型,半月内再获融资
智象未来在首届开放日上发布基于原生全模态架构UiT的图像大模型HiDream-O1-Image-Pro,参数超2000亿,在多个基准测试中刷新SOTA。该模型将图像、文本和任务条件统一编码,突破传统多模态拼接局限。同时公司半月内完成新一轮亿级融资,资方包括深创投、金浦投资等,并推出三大智能体产品加速商业化。
事件概述
5月19日,智象未来在首届开放日上正式发布基于原生全模态架构Unified Transformer(UiT)的图像大模型HiDream-O1-Image-Pro,参数量超过2000亿。该模型在通用文生图、高保真文字渲染、多样化场景生成、图像编辑等任务中达到新的SOTA水平。此前,其8B参数开源版本HiDream-O1-Image曾在Artificial Analysis文生图榜单上登顶开源模型全球第一。
核心信息:原生全模态架构
与当前主流的潜在扩散模型(LDM)不同,智象未来采用原生全模态架构,将原始图像像素、离散文本标记和任务条件统一纳入连续共享标记空间实现深度融合,而非图像与文本分离编码。智象未来创始人梅涛表示,原生全模态是从一开始就将世界规则刻进模型,使其能真正理解物理定律、空间关系和因果逻辑。CTO姚霆指出,该架构具备“Any to Any”能力,支持任意输入到任意输出,是世界模型所需的核心能力。
融资与商业化
智象未来在半月内完成多轮融资:此前宣布超5亿元融资后,开放日上又宣布完成由深创投、金浦投资、财鑫资本、复聚资本等参与的新一轮亿级融资。公司采用“1+1+3”业务架构:底层为HiDream系列大模型,中层为HiHarness企业服务平台,上层覆盖商业营销、影视创作和社媒创作三大场景的智能体产品。
- 商业营销智能体HiBurst:已覆盖TikTok、Meta、抖音等平台,成为TikTok官方top5服务商,年生产电商营销视频超百万条,覆盖GMV超亿元。
- AI影视创作智能体“帧赞”:实现“创意-分镜-成片”全流程,已制作短漫剧超5000分钟,入驻专业团队与生态合作伙伴超千家。
- 社媒创作智能体vivago:支持端到端长思考生成分钟级故事视频,覆盖100多个国家及地区超4000万用户,曾登Product Hunt日榜第一。
此外,智象未来与上海电影集团、蓝色光标、北京捷成世纪、倍尔健康达成战略合作,推动在影视、营销、跨境电商、医疗等领域的产业化落地。
