阿里发布世界模型HappyOyster:从被动生成转向主动模拟
2026/04/16 22:37阅读量 2
阿里巴巴ATH创新事业部正式发布世界模型产品HappyOyster,支持用户实时构建可互动、可演绎的AI数字世界。该产品具备漫游(Wander)和导演(Direct)两大核心能力,实现了从传统文生视频的被动流程向主动模拟世界演化的转变。目前产品处于限量早期体验阶段,旨在游戏、影视及文旅等领域重塑内容创作模式。
事件概述
阿里巴巴旗下ATH创新事业部(Token Hub)正式发布世界模型产品HappyOyster。该产品基于原生多模态架构构建,支持多模态理解与音视频联合生成,标志着世界模型技术从实验室研究向产品化迈出了关键一步。
核心功能与技术特性
HappyOyster 区别于传统“输入提示词—等待渲染”的被动生成模式,采用长时间跨度的世界演化建模方式,能够主动理解空间、物理与因果规律,预测情节演变。
- 漫游模式 (Wander):
- 用户仅需一句话或一张图,即可生成具备物理一致性的完整空间。
- 物体位置稳定,场景持久存在,视角与光照跟随第一人称视角持续移动。
- 支持长达 1分钟 的连续实时位移与镜头控制,并支持多样化风格切换。
- 导演模式 (Direct):
- 为独家功能,允许用户在视频任意节点通过文字、语音或图像等多模态输入进行干预。
- 可实现镜头切换、剧情改写、角色调度,生成光照、重力、角色动作与场景因果持续演化的世界。
- 支持连续生成 3分钟以上 的 480p 或 720p 实时画面。
注:当前漫游与导演两大模式尚未完全打通,未来计划实现边探索、边创造的无缝融合体验。
应用场景与行业影响
HappyOyster 已在多个领域展现出改变传统内容创作模式的潜力:
- 游戏开发:快速生成可玩原型,玩家无需预设脚本即可驱动动态剧情分支与开放世界探索,降低生产成本并提升沉浸感。
- 影视创作:导演通过自然语言描述创意,系统实时生成分镜画面,支持在任意节点修改镜头、角色和剧情,大幅缩短创意验证周期。
- 文旅与教育:用户以第一视角进入历史复原场景或名画现场,在交互中探索因果、改写走向,实现从知识传递到沉浸体验的跃迁。
- 智能硬件结合:未来可与穿戴设备等结合,根据人的位置、动作与语言动态,实时生成沉浸式内容。
竞争格局与商业化现状
- 国际竞争:
- 谷歌 (Google):运营闭源的世界模型 Genie 系列,已积累较多技术储备。
- 腾讯 (Tencent):于同日开源混元 3D 世界模型 HY-World 2.0,可直接生成可二次编辑的 3D 资产文件,支持与现有游戏工作流对接。
- 商业化进展:
- HappyOyster 目前处于限量早期体验阶段,仅向部分用户开放访问权限。
- 大规模商业化模式尚未明确,付费意愿、定价策略及生态建设仍需时间验证。
- 如何在生成质量、实时性与成本控制之间取得平衡,是产品规模化面临的主要挑战。
战略背景
此次发布是阿里巴巴近期密集推出 AI 产品的最新动作。阿里已将云计算与 AI 业务确立为核心增长引擎,计划在五年内将相关年收入提升至 1000亿美元。财报显示,阿里云本季度收入同比增长 36%,AI 相关产品收入连续第十个季度实现三位数增长。HappyOyster 由新设业务单元 Token Hub 研发,旨在强化技术商业化落地能力。
