国产世界模型GigaWorld-1登顶全球第一,3D准确度逼近满分
极佳视界推出的具身世界模型GigaWorld-1在由清华等8所顶尖机构联合打造的WorldArena榜单中综合得分突破60分,以断层优势超越谷歌、英伟达等团队。该模型通过显式动作建模与可微分物理引擎的融合,实现了近乎满分的3D准确度和显著领先的物理遵循能力。目前其核心代码与数据集已开源,并作为基准模型支持即将举办的CVPR 2026国际挑战赛。
事件概述
极佳视界(GigaVision)最新发布的具身世界模型 GigaWorld-1 在权威评估平台 WorldArena 上登顶全球第一。该榜单由清华大学联合普林斯顿大学、新加坡国立大学等8所国内外顶尖高校及科研机构共同构建,旨在对具身世界模型的感知精度、物理规律理解及三维空间认知进行严苛测试。GigaWorld-1是榜单中唯一一个综合得分突破 60分 大关的模型,在三大核心维度上均实现断层式领先:
- Physics Adherence(物理遵循):相比第二名提升整整 16%。
- 3D Accuracy(3D准确度):数值近乎逼近满分。
- Visual Quality(视觉质量):同样遥遥领先。
核心技术架构
GigaWorld-1 是一款专为具身场景设计的 AC-WM(Action-Conditioned World Model,动作控制世界模型),其技术突破主要源于以下两点:
- 显式动作建模机制:从根本上保证了视频生成过程中的几何一致性。
- 可微分物理引擎:能够获取精准的机械臂物理参数,实现对复杂物理交互过程的真实模拟与严格遵循。
此外,该模型基于团队积累的上万小时高质量真实机器人操作视频数据进行训练,极大地增强了在开放场景下的泛化能力。目前,GigaWorld-1的核心代码与部分数据集已在 HuggingFace 平台开源,上线半个月内下载量突破 16000次。
产品矩阵与应用成效
极佳视界构建了“世界模型×具身大脑”的双轮驱动战略,主要产品包括:
- GigaWorld(物理AI数字沙盒):能生成高保真、可控的合成数据。实测显示,基于此训练的VLA模型在新纹理、新视角、新物体位置三大泛化维度上性能提升近 300%,效率提升 10-100倍。
- GigaBrain(通用具身大脑):端到端视觉-语言-动作基础模型。其中 GigaBrain-0.5M* 是全球首个基于世界模型的强化学习具身基模,在高难度长时程任务(如折纸、咖啡制备、衣物折叠)中任务成功率接近 100%。
- GigaWorld-Policy:全球首次实现世界-动作模型(WA)在实时性、成功率和训练效率上的全面突破,推理速度与训练效率提升 10倍,任务成功率上涨 30%。
行业影响与未来计划
GigaWorld-1 将作为官方 Baseline,支持将于 3个月后 在美国举办的 GigaBrain Challenge@CVPR 2026 国际挑战赛。该赛事官网为:https://gigaai-research.github.io/GigaBrain-Challenge-2026/。
极佳视界近期已完成近 10亿元 Pre-B轮融资,投资方包括中芯聚源、上海半导体产投基金、华为哈勃投资等顶尖资本。公司定位为国内首家专攻世界模型的企业,致力于世界模型驱动的物理世界通用智能。
