材料版AlphaFold诞生:深度原理MPA模型40项工业任务全SOTA,AI4S实现突破

2026/06/01 13:25阅读量 2

深度原理Deep Principle发布材料基座模型MPA,借鉴大语言模型三段式训练思路,加入中期物理对齐训练和后训练混合读出结构,在40个真实工业实验数据集上均取得SOTA,尤其在骨架划分等陌生结构预测上优势显著,平均误差降低14.6%。该模型首次将AI4S从计算理论榜单拉入真实实验场景,使材料性质预测具备可迁移的“物理直觉”。

事件概述

深度原理(Deep Principle)推出材料基座模型 MPA(Materials Property Axiom),该模型在 40个真实工业任务数据集 上全面取得SOTA,涵盖沸点、生成焓、生物活性等多种分子性质。传统AI模型在计算理论榜单上表现优异,但面对真实实验数据时往往失效,核心原因在于训练数据多依赖理想化计算,缺乏对真实物理规律的对齐。MPA通过引入大语言模型(LLM)式的多阶段训练,填补了这一鸿沟。

核心技术突破

  1. 三段式训练架构:在传统预训练+微调之间增加 中期训练(mid-training),专门用于“物理对齐”。该阶段利用大规模第一性原理计算数据,让模型学习分子结构背后的物理规律(如偶极矩、生成焓等与结构的关联),从而建立可迁移的“物理直觉”,而非仅记忆分子几何特征。
  2. Hybrid Readout混合头:后训练阶段设计双重路径——注意力池化(自由捕捉全局性质,如沸点、生物活性)与 原子加和(遵循“分子性质等于原子贡献之和”的物理约束,用于生成焓、热容等加和性质),并通过可训练参数 α 动态平衡两条路径的权重。

效果与对比

  • 自对比消融:相比不加中期训练和混合头的同模型,MPA在随机划分下 38/40个性质 误差降低,平均降低 14.0%;在更难的骨架划分(测试集为训练中未见过的全新结构)下,38/40个性质 改善,平均降低 14.6%
  • 横向对比:与 ChemBERTa、ChemProp、Chemeleon、Uni-Mol2、Suiren 五个主流模型对比,MPA在 40个任务中拿下35个SOTA,尤其在骨架划分(分布漂移)场景下优势最显著。

应用与价值

MPA已作为技能接入深度原理的 AI Agent 产品(sciclaw.cn)。该模型的核心意义在于:将材料基础模型的训练问题重新定义为 物理对齐问题,通过统一框架整合理论计算、实验数据和下游微调,使模型同时具备理论知识和真实世界反馈能力。随着计算与实验数据的积累,MPA有望沉淀为可复用的通用材料预测能力,替代当前割裂的单一任务小模型。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。