Nature子刊：CATS Net双模块框架揭示机器“概念”形成的计算机制

2026/04/22 14:36阅读量 2

《自然·计算科学》发表研究提出CATS Net双模块神经网络，将概念形成与任务求解分离，成功让AI自主构建可迁移的低维语义结构。实验显示该模型自发涌现的20维概念空间与人类语义模型及腹侧视觉皮层高度对齐，并能通过低维向量实现跨网络知识传递。这一成果标志着AI研究从单纯追求预测精度转向探索结构化表示与类人认知机制的新范式。

事件概述

《自然·计算科学》（Nature Computational Science）于2026年3月24日发表题为《A neural network for modeling human concept formation, understanding and communication》的研究论文。该研究提出了一种名为CATS Net的双模块神经网络框架，旨在解决现有AI模型缺乏自主概念形成能力的问题，弥合感知经验与抽象理解之间的鸿沟。

核心信息

1. 架构设计：概念与任务的解耦

CATS Net由两个独立但协同工作的模块组成：

概念抽象模块（Concept Abstraction, CA）：负责接收高维感知输入，将其压缩为低维的概念向量（concept vector），并生成控制信号。
任务求解模块（Task Solving, TS）：处理具体的感知判断任务，但其内部计算路径受CA模块生成的概念信号进行动态调制（层级门控）。

这种设计使得“概念”不再是隐含在参数中的静态标签，而是直接改变网络行为逻辑的控制变量。同一输入图像在不同概念信号下会被重新解释和分类。

2. 可学习的语义结构与功能特异性

自组织语义空间：训练后的模型自发形成了一个20维的概念空间，无需预设语言符号。该空间呈现出显著的语义聚类结构（如动物、家具、交通工具等群组），且与人类语义模型（Binder65、SPOSE49）具有显著相关性。
功能熵分析：研究发现，训练后的概念空间表现出低熵和强选择性特征，证明概念是任务中涌现的功能性结构，而非人为定义的类别。相比之下，使用固定概念空间（如Word2Vec或one-hot编码）会导致性能显著下降。

3. 概念通信与知识迁移

研究展示了类似人类语言的“概念通信”机制：

实验设置：构建Teacher-Student体系，Teacher学习全部类别，Student缺失特定类别（如“苹果”）。
翻译模块：通过一个独立的翻译模块将Teacher的概念向量映射到Student的空间。
结果：Student仅凭接收到的低维概念向量，即可识别从未见过的类别，准确率远超随机水平。这表明知识可以通过低维符号进行传递，而无需复制庞大的模型参数。

4. 脑 - 模型对齐（Model–Brain Alignment）

通过fMRI数据分析，模型与真实大脑神经机制表现出高度一致性：

表征对应：模型的“概念层”与人类腹侧视觉皮层（VOTC）的表征高度相关，负责对象表征。
控制对应：CA模块与人类的语义控制网络（semantic-control network）显著相关，负责信息的调度与选择。
最优解假设：多个独立训练的模型收敛至相似的概念结构，且这些高一致性模型与人脑的对应关系更强，暗示概念结构可能是计算约束下的“最优解”。

值得关注

该研究的核心价值在于推动了AI范式的转变：

问题重构：从关注“如何预测”转向探究“如何形成概念”。
技术路径：指出实现类人智能的关键不在于扩大模型规模，而在于构建更结构化的表示系统（压缩表示 + 可调度计算 + 可通信接口）。
理论意义：为理解人类认知机制提供了统一的计算框架，证明了语义结构可以从纯感知任务中自然涌现，而非语言专属。

阅读原文详情