群核科技上市：空间智能成AI世界模型关键拼图，中美技术路径分野显现

2026/04/17 16:21阅读量 216

群核科技作为“杭州六小龙”首家IPO企业登陆港股，创始人黄晓煌指出空间智能是连接世界模型与具身智能的关键环节。公司通过积累海量真实空间数据，推出SpatialLM和SpatialGen大模型，并构建了从设计工具到产业底座的完整产品矩阵。文章揭示了中美在空间智能商业落地上的显著差异：美国侧重虚拟世界应用，中国依托制造业优势聚焦物理世界连接。

事件概述

2026年4月17日，群核科技（HomePro）正式登陆港股，成为“杭州六小龙”中首家完成IPO的企业。创始人兼董事长黄晓煌在专访中阐述了空间智能（Spatial Intelligence）作为人工智能下一阶段核心驱动力的战略定位，并详细解析了其与“世界模型”及“具身智能”的技术协同关系。

核心信息与技术架构

1. 空间智能的定义与定位

概念定义：空间智能被定义为人类理解物理世界、建立空间认知及进行抽象视觉思维的底层能力，包含空间感知、表征、推理、预测和行动五大模块。
三者关系：
- 世界模型（World Model）：充当“大脑”，负责在内部构建世界运行地图，预测因果关系及未来状态。
- 空间智能（Spatial Intelligence）：负责将抽象理解映射到三维物理空间，明确物体位置、分布及相互作用，是AI从“认知”走向“行动”的桥梁。
- 具身智能（Embodied AI）：拥有物理身体（如机器人），整合感知、推理与控制，在真实世界中执行任务。
技术演进：从早期的二维图像识别（ImageNet时代），发展到SLAM同步定位与建图，再到NeRF等3D表示方法及生成式模型，最终形成融合多模态信息的空间智能体系。

2. 两大技术路线对比

业界主要存在两种实现空间智能的路径：

空间生成路线（Space Generation）：
- 代表：World Labs、群核科技、Meshy AI。
- 逻辑：通过重建、推断或生成方式构建高保真3D仿真环境，让AI在其中学习物理规律。
- 现状：World Labs已接入NVIDIA Isaac Sim平台；群核科技采用Mesh与3D Gaussian Splatting混合表征，兼顾几何可解释性与渲染效率。
潜空间预测路线（Latent Predictive Models）：
- 代表：Yann LeCun的JEPA架构、DeepMind Dreamer系列。
- 逻辑：不还原具体像素或3D结构，直接将环境信息压缩至高维潜空间，学习动态统计规律。
- 局限：缺乏几何层面的可解释性，难以处理需要精细空间记忆或人工干预的任务。

3. 中美商业路径分野

美国模式：依托大模型优势，侧重虚拟世界应用（如游戏、影视），追求通用3D世界的构建，商业化路径偏向“学术+前沿”驱动。
中国模式：依托强大的制造业基础，聚焦物理世界连接，强调场景的真实性和工程化落地，群核科技90%的业务围绕真实物理场景展开。

群核科技的战略转型与产品矩阵

发展历程

2011-2012年：基于GPU渲染技术回国创业，早期因融资困难曾包装为家装O2O故事，后凭借酷家乐（Kujiale）迅速占领市场。
2018年：提前布局空间智能研究，开源InteriorNet数据集推动学术界发展。
2023年：全面转向空间智能战略，算力投入控制在营收的10%，确立以算法和模型为核心增长点的方向。

核心产品与数据壁垒

数据优势：拥有海量的CAD/BIM真实户型及房屋结构数据，这是训练“物理正确”空间模型的关键壁垒。
大模型成果：
- SpatialLM：空间语言模型，补充了LLM对3D空间的理解空白，2025年3月推出后位列HuggingFace全球前三。
- SpatialGen：空间生成模型，支持从文本/图片生成3D资产。
产品矩阵：
- SpatialVerse：面向具身智能与数字孪生的训练平台，提供高保真仿真与合成数据。
- LuxReal：面向视频创作，产出时空一致的AI视频内容。
- Aholo：开放平台，降低行业接入3D空间智能的门槛。

挑战与展望

核心瓶颈：高质量空间数据极度匮乏，需同步图像、深度、语义等多模态信息，标注成本高昂；现有数据存在分布偏差，难以覆盖真实世界的长尾场景。
未来预判：黄晓煌预计3-5年内空间智能将出现爆发点，类比GPU从图形计算工具演变为AI基础设施的过程。随着具身智能的普及，空间智能将成为机器人快速重建环境并自主行动的基础设施。

阅读原文详情