阿里推出“快乐生蚝”世界模型:可实时交互、支持分支叙事,让用户走进AI生成的场景

2026/06/19 16:42阅读量 6

阿里ATH发布HappyOyster 1.0(快乐生蚝)开放式世界模型,支持用户以第一视角探索或导演模式实时操控剧情。该模型突破传统文生视频的“单向生成”局限,通过状态建模、内生一致性和因果动作空间实现长程交互与场景稳定性,已正式上线并计划开放API。

事件概述

阿里集团旗下ATH推出HappyOyster 1.0(快乐生蚝),一款可实时构建和交互的开放式世界模型产品。与现有文生视频工具不同,它不是生成固定视频片段,而是创建一个用户可直接进入、操控并持续演化的数字世界。

核心功能与体验

  • Adventure模式(世界探索):用户作为主角进入场景,通过键盘操作(加速、下蹲、攻击、跳跃)自由探索。模型根据用户动作实时推演角色姿态与物理反馈,场景内容(如马车、汽车等)自动匹配可交互玩法。支持截屏、保存世界并分享链接。
  • Directing模式(实时导演):用户以导演视角控制剧情走向。支持多模态参考(@图片锁定角色外观),输入自然语言指令实时改变叙事。核心亮点是回溯与分支剧情——可回退至特定节点,输入不同指令衍生多条故事线,角色、场景、服装全程保持一致性。

技术原理

  • 闭环世界状态建模:通过隐状态摘要(Latent State)递归传递世界信息,而非记忆所有历史帧,实现长程连贯性和低计算开销。这支撑了暂停、回溯、分支叙事等交互功能。
  • 内生一致性:为每个角色、物品分配“身份卡”,在注意力机制中维持全程一致性,解决传统文生视频中主体漂移(如换脸、换装)问题。
  • 开放因果动作空间:动作指令与自然语言共享同一语义接口,无需预设动作集,模型自行推演完整动作序列与物理反馈(如上马、骑行)。
  • 长时序音视频协同:音频与视频在同一世界状态下联合生成,实现声画物理合规(脚步声、雨声、打击音效等随动作变化)。

行业意义与进展

  • 该产品标志着AI生成能力从单向输出转向“可进入、可操控”的双向实时交互,有望在游戏(快速生成可玩场景)、互动内容(分支叙事短剧)、文旅(虚拟漫游)、博物馆(沉浸式历史还原)等领域落地。
  • HappyOyster团队正牵头与南京大学共建世界模型评测基准,填补行业缺乏系统性评测的空白。
  • 产品已正式上线(官网:https://www.happyoyster.cn),手机号注册即可体验;API计划于近期开放。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。