阿里发布世界模型HappyOyster：从被动生成转向主动模拟

2026/04/16 22:37阅读量 56

阿里巴巴ATH创新事业部正式发布世界模型产品HappyOyster，支持用户实时构建可互动、可演绎的AI数字世界。该产品具备漫游（Wander）和导演（Direct）两大核心能力，实现了从传统文生视频的被动流程向主动模拟世界演化的转变。目前产品处于限量早期体验阶段，旨在游戏、影视及文旅等领域重塑内容创作模式。

事件概述

阿里巴巴旗下ATH创新事业部（Token Hub）正式发布世界模型产品HappyOyster。该产品基于原生多模态架构构建，支持多模态理解与音视频联合生成，标志着世界模型技术从实验室研究向产品化迈出了关键一步。

核心功能与技术特性

HappyOyster 区别于传统“输入提示词—等待渲染”的被动生成模式，采用长时间跨度的世界演化建模方式，能够主动理解空间、物理与因果规律，预测情节演变。

漫游模式 (Wander)：
- 用户仅需一句话或一张图，即可生成具备物理一致性的完整空间。
- 物体位置稳定，场景持久存在，视角与光照跟随第一人称视角持续移动。
- 支持长达 1分钟 的连续实时位移与镜头控制，并支持多样化风格切换。
导演模式 (Direct)：
- 为独家功能，允许用户在视频任意节点通过文字、语音或图像等多模态输入进行干预。
- 可实现镜头切换、剧情改写、角色调度，生成光照、重力、角色动作与场景因果持续演化的世界。
- 支持连续生成 3分钟以上 的 480p 或 720p 实时画面。

注：当前漫游与导演两大模式尚未完全打通，未来计划实现边探索、边创造的无缝融合体验。

应用场景与行业影响

HappyOyster 已在多个领域展现出改变传统内容创作模式的潜力：

游戏开发：快速生成可玩原型，玩家无需预设脚本即可驱动动态剧情分支与开放世界探索，降低生产成本并提升沉浸感。
影视创作：导演通过自然语言描述创意，系统实时生成分镜画面，支持在任意节点修改镜头、角色和剧情，大幅缩短创意验证周期。
文旅与教育：用户以第一视角进入历史复原场景或名画现场，在交互中探索因果、改写走向，实现从知识传递到沉浸体验的跃迁。
智能硬件结合：未来可与穿戴设备等结合，根据人的位置、动作与语言动态，实时生成沉浸式内容。

竞争格局与商业化现状

国际竞争：
- 谷歌 (Google)：运营闭源的世界模型 Genie 系列，已积累较多技术储备。
- 腾讯 (Tencent)：于同日开源混元 3D 世界模型 HY-World 2.0，可直接生成可二次编辑的 3D 资产文件，支持与现有游戏工作流对接。
商业化进展：
- HappyOyster 目前处于限量早期体验阶段，仅向部分用户开放访问权限。
- 大规模商业化模式尚未明确，付费意愿、定价策略及生态建设仍需时间验证。
- 如何在生成质量、实时性与成本控制之间取得平衡，是产品规模化面临的主要挑战。

战略背景

此次发布是阿里巴巴近期密集推出 AI 产品的最新动作。阿里已将云计算与 AI 业务确立为核心增长引擎，计划在五年内将相关年收入提升至 1000亿美元。财报显示，阿里云本季度收入同比增长 36%，AI 相关产品收入连续第十个季度实现三位数增长。HappyOyster 由新设业务单元 Token Hub 研发，旨在强化技术商业化落地能力。

阅读原文详情

事件概述

核心功能与技术特性

应用场景与行业影响

竞争格局与商业化现状

战略背景

准备好启动您的定制项目了吗？