阿里推出“快乐生蚝”世界模型:可实时交互、支持分支叙事,让用户走进AI生成的场景
2026/06/19 16:42阅读量 6
阿里ATH发布HappyOyster 1.0(快乐生蚝)开放式世界模型,支持用户以第一视角探索或导演模式实时操控剧情。该模型突破传统文生视频的“单向生成”局限,通过状态建模、内生一致性和因果动作空间实现长程交互与场景稳定性,已正式上线并计划开放API。
事件概述
阿里集团旗下ATH推出HappyOyster 1.0(快乐生蚝),一款可实时构建和交互的开放式世界模型产品。与现有文生视频工具不同,它不是生成固定视频片段,而是创建一个用户可直接进入、操控并持续演化的数字世界。
核心功能与体验
- Adventure模式(世界探索):用户作为主角进入场景,通过键盘操作(加速、下蹲、攻击、跳跃)自由探索。模型根据用户动作实时推演角色姿态与物理反馈,场景内容(如马车、汽车等)自动匹配可交互玩法。支持截屏、保存世界并分享链接。
- Directing模式(实时导演):用户以导演视角控制剧情走向。支持多模态参考(@图片锁定角色外观),输入自然语言指令实时改变叙事。核心亮点是回溯与分支剧情——可回退至特定节点,输入不同指令衍生多条故事线,角色、场景、服装全程保持一致性。
技术原理
- 闭环世界状态建模:通过隐状态摘要(Latent State)递归传递世界信息,而非记忆所有历史帧,实现长程连贯性和低计算开销。这支撑了暂停、回溯、分支叙事等交互功能。
- 内生一致性:为每个角色、物品分配“身份卡”,在注意力机制中维持全程一致性,解决传统文生视频中主体漂移(如换脸、换装)问题。
- 开放因果动作空间:动作指令与自然语言共享同一语义接口,无需预设动作集,模型自行推演完整动作序列与物理反馈(如上马、骑行)。
- 长时序音视频协同:音频与视频在同一世界状态下联合生成,实现声画物理合规(脚步声、雨声、打击音效等随动作变化)。
行业意义与进展
- 该产品标志着AI生成能力从单向输出转向“可进入、可操控”的双向实时交互,有望在游戏(快速生成可玩场景)、互动内容(分支叙事短剧)、文旅(虚拟漫游)、博物馆(沉浸式历史还原)等领域落地。
- HappyOyster团队正牵头与南京大学共建世界模型评测基准,填补行业缺乏系统性评测的空白。
- 产品已正式上线(官网:https://www.happyoyster.cn),手机号注册即可体验;API计划于近期开放。
