群核科技上市:空间智能成AI世界模型关键拼图,中美技术路径分野显现
2026/04/17 16:21阅读量 2
群核科技作为“杭州六小龙”首家IPO企业登陆港股,创始人黄晓煌指出空间智能是连接世界模型与具身智能的关键环节。公司通过积累海量真实空间数据,推出SpatialLM和SpatialGen大模型,并构建了从设计工具到产业底座的完整产品矩阵。文章揭示了中美在空间智能商业落地上的显著差异:美国侧重虚拟世界应用,中国依托制造业优势聚焦物理世界连接。
事件概述
2026年4月17日,群核科技(HomePro)正式登陆港股,成为“杭州六小龙”中首家完成IPO的企业。创始人兼董事长黄晓煌在专访中阐述了空间智能(Spatial Intelligence)作为人工智能下一阶段核心驱动力的战略定位,并详细解析了其与“世界模型”及“具身智能”的技术协同关系。
核心信息与技术架构
1. 空间智能的定义与定位
- 概念定义:空间智能被定义为人类理解物理世界、建立空间认知及进行抽象视觉思维的底层能力,包含空间感知、表征、推理、预测和行动五大模块。
- 三者关系:
- 世界模型(World Model):充当“大脑”,负责在内部构建世界运行地图,预测因果关系及未来状态。
- 空间智能(Spatial Intelligence):负责将抽象理解映射到三维物理空间,明确物体位置、分布及相互作用,是AI从“认知”走向“行动”的桥梁。
- 具身智能(Embodied AI):拥有物理身体(如机器人),整合感知、推理与控制,在真实世界中执行任务。
- 技术演进:从早期的二维图像识别(ImageNet时代),发展到SLAM同步定位与建图,再到NeRF等3D表示方法及生成式模型,最终形成融合多模态信息的空间智能体系。
2. 两大技术路线对比
业界主要存在两种实现空间智能的路径:
- 空间生成路线(Space Generation):
- 代表:World Labs、群核科技、Meshy AI。
- 逻辑:通过重建、推断或生成方式构建高保真3D仿真环境,让AI在其中学习物理规律。
- 现状:World Labs已接入NVIDIA Isaac Sim平台;群核科技采用Mesh与3D Gaussian Splatting混合表征,兼顾几何可解释性与渲染效率。
- 潜空间预测路线(Latent Predictive Models):
- 代表:Yann LeCun的JEPA架构、DeepMind Dreamer系列。
- 逻辑:不还原具体像素或3D结构,直接将环境信息压缩至高维潜空间,学习动态统计规律。
- 局限:缺乏几何层面的可解释性,难以处理需要精细空间记忆或人工干预的任务。
3. 中美商业路径分野
- 美国模式:依托大模型优势,侧重虚拟世界应用(如游戏、影视),追求通用3D世界的构建,商业化路径偏向“学术+前沿”驱动。
- 中国模式:依托强大的制造业基础,聚焦物理世界连接,强调场景的真实性和工程化落地,群核科技90%的业务围绕真实物理场景展开。
群核科技的战略转型与产品矩阵
发展历程
- 2011-2012年:基于GPU渲染技术回国创业,早期因融资困难曾包装为家装O2O故事,后凭借酷家乐(Kujiale)迅速占领市场。
- 2018年:提前布局空间智能研究,开源InteriorNet数据集推动学术界发展。
- 2023年:全面转向空间智能战略,算力投入控制在营收的10%,确立以算法和模型为核心增长点的方向。
核心产品与数据壁垒
- 数据优势:拥有海量的CAD/BIM真实户型及房屋结构数据,这是训练“物理正确”空间模型的关键壁垒。
- 大模型成果:
- SpatialLM:空间语言模型,补充了LLM对3D空间的理解空白,2025年3月推出后位列HuggingFace全球前三。
- SpatialGen:空间生成模型,支持从文本/图片生成3D资产。
- 产品矩阵:
- SpatialVerse:面向具身智能与数字孪生的训练平台,提供高保真仿真与合成数据。
- LuxReal:面向视频创作,产出时空一致的AI视频内容。
- Aholo:开放平台,降低行业接入3D空间智能的门槛。
挑战与展望
- 核心瓶颈:高质量空间数据极度匮乏,需同步图像、深度、语义等多模态信息,标注成本高昂;现有数据存在分布偏差,难以覆盖真实世界的长尾场景。
- 未来预判:黄晓煌预计3-5年内空间智能将出现爆发点,类比GPU从图形计算工具演变为AI基础设施的过程。随着具身智能的普及,空间智能将成为机器人快速重建环境并自主行动的基础设施。
