阿里发布世界模型HappyOyster:支持实时漫游与导演,对标谷歌Genie3

2026/04/16 15:18阅读量 3

4月16日,阿里巴巴ATH创新事业部发布基于原生多模态架构的世界模型产品HappyOyster(快乐生蚝),旨在与谷歌Genie3竞争。该模型支持长达1分钟的连续漫游和3分钟以上的实时导演模式,用户可通过自然语言指令主动干预场景演化。相比传统文生视频被动生成模式,HappyOyster实现了从“被动生成内容”到“主动模拟世界演化”的跨越,具备高保真长时序动态场景生成能力。

事件概述

2026年4月16日,阿里巴巴ATH创新事业部正式发布世界模型产品HappyOyster(快乐生蚝)。该产品由研发过HappyHorse的团队开发,采用原生多模态架构,支持多模态理解与音视频联合生成,致力于构建可交互、可演绎、可探索的AI数字世界。

核心技术与能力

  • 流派定位:属于世界模拟器流派,区别于传统文生视频模型的“输入提示词-等待渲染”被动流程。HappyOyster通过学习海量长视频数据及文本、动作、图像等控制信号,主动理解空间、物理与因果规律,预测情节演变。
  • 差异化优势
    • 更长时序建模:相比竞品,采用时间跨度更长的世界演化建模方式,保持高保真、长时序的动态场景生成。
    • 多信号协同:在建模初始设计多样控制信号,实现生成质量、长时序与实时可控性的协同优化。
    • 双模式交互
      • 漫游(Wander)模式:支持一句话或一张图生成具备物理一致性的完整空间。用户可自由切换方向与镜头,体验无限延展的探索乐趣。目前支持长达1分钟的连续实时位移与镜头控制,画面风格泛化能力强。
      • 导演(Direct)模式:支持在视频任意节点通过文字、语音或图像输入,实时介入世界演化、调度角色事件、改写剧情。目前支持连续生成3分钟以上的480p或720p实时画面。

应用场景与展望

HappyOyster正在改变传统内容创作与交互体验:

  • 游戏领域:快速生成可玩原型,玩家实时驱动世界演化,无需预设脚本即可实现动态剧情分支。
  • 影视创作:缩短创意验证周期,导演可用自然语言实时生成分镜并修改镜头、角色和剧情。
  • 文旅与教育:支持第一视角走进历史现场或名画,实现从知识传递到沉浸体验的跃迁。
  • 未来扩展:计划结合穿戴设备等智能硬件,根据人的位置、动作与语言动态,实时生成沉浸式内容。

注:当前漫游与导演两大模式尚未完全打通,未来将实现边探索、边创造的无缝融合体验。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。