智象未来CEO梅涛：多模态模型Token毛利率远高于语言模型，视频生成创业公司应先专注To B

2026/05/28 16:20阅读量 3

智象未来CEO梅涛在开放日上表示，多模态模型Token的毛利率远高于语言模型，公司定位原生多模态大模型公司，终极目标为世界模型。其采用原生全模态Unified Transformer架构，主攻To B市场，打造“1+1+3”MaaS平台，并已获得多轮融资。投资人王兵建议视频生成赛道创业公司在算力成本下降前避免与巨头正面To C竞争。

事件概述

智象未来（HiDream.ai）在首届开放日上提出“原生多模态是实现AGI的必经之路”，CEO梅涛强调公司定位为原生多模态大模型公司，终极目标为打造世界模型。同时，公司宣布近期完成5亿人民币B轮融资及后续亿元级新一轮融资，由安徽省产投、东方富海等机构投资。

核心观点

多模态模型毛利率更高：梅涛指出，多模态模型Token的毛利率远高于语言模型，To B服务的毛利率较高，且商业化前景明确。
技术路线选择：智象未来采用原生全模态Unified Transformer（UiT）架构，支持“Any to Any”输入输出，与世界模型所需能力一致。在数据方面，公司拥有20万小时有版权视频数据，并通过合成数据对抗行业数据稀缺瓶颈。
世界模型条件：梅涛认为真正的世界模型需掌握物理规律、解决长上下文因果推理、实现全模态交互并确保绝对安全。目前行业尚在早期，智象未来聚焦视频、图像、3D交互数据生成，为未来世界模型积累视觉能力。

商业策略

To B优先：投资人王兵建议在算力成本大幅下降前，创业公司应避免与巨头在To C市场正面竞争，先做To B提升产品逻辑与场景落地能力。
MaaS平台：智象未来构建“1+1+3”MaaS平台，底层为HiDream系列大模型，中层为HiHarness企业服务平台，上层覆盖商业营销、影视创作、社媒三大场景。商业化模式包括按Token售卖、RaaS素材服务、按GMV分佣（15%-30%）以及联合承制分佣。
差异化竞争：在图片领域做客户必选项，视频领域深耕营销、短剧等垂类场景。通过端到端Agent服务内容电商客户，每月消耗数千条短视频，体现Agent价值。

值得关注

梅涛认为行业尚未出现能一统天下的模型，创业公司可通过算法创新以少量资源实现与大厂同等效果。
具身智能领域：梅涛指出很多具身智能公司低估了视频模型的重要性，缺乏千亿规模底座模型难以实现泛化。

阅读原文详情

事件概述

核心观点

商业策略

值得关注

准备好启动您的定制项目了吗？