火猫 AI

核心服务定制优势系统升级 AI 智能体 Skills 定制开发

AI 工具扣子智能体

精选案例资讯中心

安全保障关于我们联系我们

每日 AI 资讯

阿里推出“快乐生蚝”世界模型：可实时交互、支持分支叙事，让用户走进AI生成的场景

2026/06/19 16:42阅读量 6

阿里ATH发布HappyOyster 1.0（快乐生蚝）开放式世界模型，支持用户以第一视角探索或导演模式实时操控剧情。该模型突破传统文生视频的“单向生成”局限，通过状态建模、内生一致性和因果动作空间实现长程交互与场景稳定性，已正式上线并计划开放API。

事件概述

阿里集团旗下ATH推出HappyOyster 1.0（快乐生蚝），一款可实时构建和交互的开放式世界模型产品。与现有文生视频工具不同，它不是生成固定视频片段，而是创建一个用户可直接进入、操控并持续演化的数字世界。

核心功能与体验

Adventure模式（世界探索）：用户作为主角进入场景，通过键盘操作（加速、下蹲、攻击、跳跃）自由探索。模型根据用户动作实时推演角色姿态与物理反馈，场景内容（如马车、汽车等）自动匹配可交互玩法。支持截屏、保存世界并分享链接。
Directing模式（实时导演）：用户以导演视角控制剧情走向。支持多模态参考（@图片锁定角色外观），输入自然语言指令实时改变叙事。核心亮点是回溯与分支剧情——可回退至特定节点，输入不同指令衍生多条故事线，角色、场景、服装全程保持一致性。

技术原理

闭环世界状态建模：通过隐状态摘要（Latent State）递归传递世界信息，而非记忆所有历史帧，实现长程连贯性和低计算开销。这支撑了暂停、回溯、分支叙事等交互功能。
内生一致性：为每个角色、物品分配“身份卡”，在注意力机制中维持全程一致性，解决传统文生视频中主体漂移（如换脸、换装）问题。
开放因果动作空间：动作指令与自然语言共享同一语义接口，无需预设动作集，模型自行推演完整动作序列与物理反馈（如上马、骑行）。
长时序音视频协同：音频与视频在同一世界状态下联合生成，实现声画物理合规（脚步声、雨声、打击音效等随动作变化）。

行业意义与进展

该产品标志着AI生成能力从单向输出转向“可进入、可操控”的双向实时交互，有望在游戏（快速生成可玩场景）、互动内容（分支叙事短剧）、文旅（虚拟漫游）、博物馆（沉浸式历史还原）等领域落地。
HappyOyster团队正牵头与南京大学共建世界模型评测基准，填补行业缺乏系统性评测的空白。
产品已正式上线（官网：https://www.happyoyster.cn），手机号注册即可体验；API计划于近期开放。

阅读原文详情

准备好启动您的定制项目了吗？

现在咨询，即可获得免费的业务梳理与技术架构建议方案。

联系我们查看案例