材料版AlphaFold诞生：深度原理MPA模型40项工业任务全SOTA，AI4S实现突破

2026/06/01 13:25阅读量 2

深度原理Deep Principle发布材料基座模型MPA，借鉴大语言模型三段式训练思路，加入中期物理对齐训练和后训练混合读出结构，在40个真实工业实验数据集上均取得SOTA，尤其在骨架划分等陌生结构预测上优势显著，平均误差降低14.6%。该模型首次将AI4S从计算理论榜单拉入真实实验场景，使材料性质预测具备可迁移的“物理直觉”。

事件概述

深度原理（Deep Principle）推出材料基座模型 MPA（Materials Property Axiom），该模型在 40个真实工业任务数据集 上全面取得SOTA，涵盖沸点、生成焓、生物活性等多种分子性质。传统AI模型在计算理论榜单上表现优异，但面对真实实验数据时往往失效，核心原因在于训练数据多依赖理想化计算，缺乏对真实物理规律的对齐。MPA通过引入大语言模型（LLM）式的多阶段训练，填补了这一鸿沟。

核心技术突破

三段式训练架构：在传统预训练+微调之间增加 中期训练（mid-training），专门用于“物理对齐”。该阶段利用大规模第一性原理计算数据，让模型学习分子结构背后的物理规律（如偶极矩、生成焓等与结构的关联），从而建立可迁移的“物理直觉”，而非仅记忆分子几何特征。
Hybrid Readout混合头：后训练阶段设计双重路径——注意力池化（自由捕捉全局性质，如沸点、生物活性）与 原子加和（遵循“分子性质等于原子贡献之和”的物理约束，用于生成焓、热容等加和性质），并通过可训练参数 α 动态平衡两条路径的权重。

效果与对比

自对比消融：相比不加中期训练和混合头的同模型，MPA在随机划分下 38/40个性质 误差降低，平均降低 14.0%；在更难的骨架划分（测试集为训练中未见过的全新结构）下，38/40个性质 改善，平均降低 14.6%。
横向对比：与 ChemBERTa、ChemProp、Chemeleon、Uni-Mol2、Suiren 五个主流模型对比，MPA在 40个任务中拿下35个SOTA，尤其在骨架划分（分布漂移）场景下优势最显著。

应用与价值

MPA已作为技能接入深度原理的 AI Agent 产品（sciclaw.cn）。该模型的核心意义在于：将材料基础模型的训练问题重新定义为 物理对齐问题，通过统一框架整合理论计算、实验数据和下游微调，使模型同时具备理论知识和真实世界反馈能力。随着计算与实验数据的积累，MPA有望沉淀为可复用的通用材料预测能力，替代当前割裂的单一任务小模型。

阅读原文详情

事件概述

核心技术突破

效果与对比

应用与价值

准备好启动您的定制项目了吗？