48小时见证AI新战场:阿里、腾讯与群核科技如何定义世界模型商业化
2026/04/20 10:14阅读量 3
2026年4月16日至17日,阿里云发布世界模型HappyOyster、腾讯开源混元3D世界模型2.0,群核科技登陆港交所成为“全球空间智能第一股”,标志着世界模型赛道从技术探索迈向商业化临界点。全球已有至少12家主要玩家布局该领域,形成生成式视频、抽象预测和空间智能三大流派,其中中国厂商在工程化落地与资本化进程上展现独特优势。尽管底层架构创新仍由美国主导,但中国企业在垂直场景盈利与生态构建上的尝试,正推动世界模型向产业基础设施演进。
事件概述
2026年4月16日至17日的短短48小时内,中国AI产业密集上演三场重磅事件,释放出世界模型(World Model)赛道即将迎来商业化爆发的强烈信号:
- 阿里云发布 HappyOyster:4月16日,阿里云ATH创新事业部正式发布世界模型 HappyOyster。该产品定位为“世界模拟器”,采用原生多模态+长时序建模技术,支持漫游模式(1分钟连续实时位移)和导演模式(3分钟以上画面)。此举被视为阿里AI战略从“大模型军备赛”转向“世界模型基础设施”的关键落子,与其“五年内云+AI收入超1000亿美元”的目标相呼应。
- 腾讯开源 HY-World 2.0:同日,腾讯混元团队宣布开源 Hunyuan3D 2.0(HY-World 2.0)。与阿里的闭源策略不同,腾讯选择完全开源并支持与 Unity 等游戏引擎无缝对接。其核心差异化在于“可导出性”,生成的 3D 资产文件(Mesh/3DGS/点云)可直接用于二次编辑,旨在抢占“空间智能基础设施”的生态位。
- 群核科技上市:4月17日,专注空间智能的群核科技(Manycore Tech,股票代码 0068.HK)在港交所挂牌。公司2025年实现营收8.2亿元,毛利率高达82.2%,经调整净利润5710万元,成功实现扭亏为盈。其香港公开发售获1591倍超额认购,上市首日股价大涨144%,总市值超300亿港元。
这三起事件分别代表了三种不同的战略路径:阿里的“云 + 模型”一体化、腾讯的“开源生态”卡位、群核的“垂直盈利”验证,标志着中国厂商在世界模型赛道已从“跟随者”转变为“定义者”。
核心信息:三大流派与全球格局
随着概念走红,世界模型领域已形成三大主流技术流派,全球至少有12家主要玩家参与竞争:
1. 生成式视频派(“世界即视频”)
- 代表玩家:Google Genie 3、OpenAI Sora、阿里 HappyOyster、Runway GWM-1。
- 核心理念:通过视频生成模拟世界演化,认为逼真视频生成意味着理解物理规律。
- 技术特点:采用 Diffusion Transformer 或 AR-Transformer 架构,强调时序连贯性和画面质量,追求长时长生成。
- 优劣势:直观易理解,商业化路径清晰;但对物理规律的理解停留在表象,难以支撑机器人训练等硬核场景。
2. 抽象预测派(“世界即因果”)
- 代表玩家:Meta V-JEPA 2(Yann LeCun 主导)。
- 核心理念:反对像素级重建,主张学习世界的抽象表征和因果逻辑,认为真正的世界模型应是预测未来的抽象大脑。
- 技术特点:采用 JEPA(联合嵌入预测架构),在 latent space 进行预测而非像素空间,强调因果推理和可解释性。
- 优劣势:更接近人类认知方式,适合决策规划,算力需求低;但缺乏直观输出,难以直接应用于内容创作。
3. 空间智能派(“世界即3D”)
- 代表玩家:斯坦福 World Labs、腾讯 HY-World 2.0、NVIDIA Omniverse、群核科技。
- 核心理念:真正的世界模型必须理解三维空间和物体关系,能够生成可编辑、可导出的 3D 资产。
- 技术特点:采用 3DGS、NeRF 等技术,强调几何稳定性和空间一致性,与现有游戏/机器人工作流对接。
- 优劣势:工程化落地最快,可直接用于游戏开发和机器人仿真;但实时交互性受限,计算复杂度高。
全球玩家梯队划分
- 第一梯队(产品化领先):Google Genie 3、阿里 HappyOyster、腾讯 HY-World 2.0、群核科技。特征为已发布可用产品,具备实时交互能力,场景定位清晰。其中群核科技是唯一实现盈利的空间智能企业。
- 第二梯队(技术独特但场景有限):Meta V-JEPA 2、Tesla FSD、NVIDIA Omniverse。聚焦特定垂直场景,不直接面向大众消费者。
- 第三梯队(早期探索):百度文心、字节豆包、Runway GWM-1、斯坦福 World Labs、OpenAI Sora。仍在技术验证阶段,商业化路径尚不清晰。
值得关注:中美博弈与未来情景
中美差异化优势
- 美国:优势在于基础研究、算力垄断(NVIDIA GPU、谷歌 TPU)和数据资源(YouTube、Instagram)。底层架构创新(如 LeCun 的 JEPA、DeepMind 的 AR-Transformer)主要由美国实验室主导。
- 中国:优势体现在工程化能力、应用场景丰富度及资本化进程。中国厂商在 Google Genie 3 发布八个月后迅速推出对标产品,展现了强大的工程优化能力。群核科技的上市标志着中国在空间智能赛道率先完成资本化布局。
- 挑战:底层架构创新仍由美国主导,中国多为“跟随式创新”。此外,高端 GPU 出口管制、数据跨境限制及技术标准分裂也是潜在风险。
商业化挑战与样本
- 成本问题:实时交互带来高昂的算力消耗,To B 和 To C 端的买单意愿仍需验证。
- 盈利样本:群核科技通过聚焦家装设计等垂直场景,采用 SaaS+API 服务模式,以 8.2 亿元营收和 82.2% 的高毛利证明了空间智能在特定场景下的商业可行性,但该模式能否扩展至通用世界模型仍是未知数。
- 战略分歧:Meta 和腾讯选择开源以建立生态标准,Google 和阿里选择闭源以构建商业壁垒。长期来看,开源方案可能凭借生态优势实现超越。
未来三种情景推演
- 乐观情景(概率30%):2028年出现杀手级应用,技术瓶颈突破,世界模型成为 AI 基础设施,与具身智能深度融合。
- 中性情景(概率50%):场景分化,长期共存。三大流派服务不同场景,10+ 玩家淘汰至 3-5 家,世界模型成为 AI 工具箱中的重要组件。
- 悲观情景(概率20%):泡沫破裂,技术瓶颈无法突破,大部分玩家退出,行业回归到更务实的组合方案。
结论
世界模型的终极竞争并非单纯的技术竞赛,而是生态竞赛。阿里、腾讯、群核科技的集体行动,标志着世界模型正从“实验室玩具”迈向“产业基础设施”。对于中国厂商而言,短期内的工程优化可以快速缩小差距,但长期必须在底层架构创新上有所突破,才能在 AGI 时代的生态格局中占据主导地位。谁掌控了空间,谁就能掌控物理 AI 的未来。
