刘淼:数据是AI时代材料科学唯一的壁垒,模型差异已非关键
2026/05/29 14:57阅读量 1
刘淼指出,AI与机器人正推动材料科学革命,全球布局以数据为切入点。当前技术路线已清晰:通过密度泛函理论批量计算材料性质。他认为模型差异极小,数据将成为行业唯一壁垒,DeepMind等机构已公开模型参数但未开放核心训练数据。中国团队已实现3个月筛选出新型超导体等案例。该领域类似早期大语言模型发展阶段,参考生物医药路径,材料科学有望成为下一个数据突破领域。
事件概述
AI与机器人正在成为各领域效率革命的核心方式,材料科学是AI for Science的关键落地领域。刘淼提出,在AI时代,数据将成为材料科学领域唯一的核心壁垒,模型差异已不再是决定因素。
核心信息
- 全球布局方向明确:中美战略方向一致,但策略不同——中国偏政府政策主导,美国偏市场化主导。美国科技公司进展突出:DeepMind发布GNoME数据集和模型(号称发现38万种稳定材料),Microsoft推出MatterGen和MatterSim,Google、Meta等均参与。贝索斯投资62亿美元布局Physical AI,材料科学为其中板块。
- 技术路线:核心方法是用密度泛函理论(DFT)批量计算材料性质(解电子薛定谔方程),属于科学第四范式。已有ICSD数据库等基础。
- 中国案例:
- 超导体发现:从MgB₂结构出发,通过元素替代高通量计算,仅用3个月完成筛选到合成。
- 全固态电池:从5万多个化合物中筛选出几十个潜在镀层材料;并找到性能可能超越磷酸铁锂的氟化物钠电池正极材料(已申请专利)。
- 预测材料稳定性、微调力场、离子扩散率模拟等结果与实验值高度吻合。
- 数据壁垒:模型差异极小,未来只有数据会成为核心壁垒。DeepMind等机构仅公开模型参数,不开放核心训练数据——该趋势已普遍。
- 从业者背景:核心参与者多为科学出身,单纯AI出身难以做深。该领域类似早期大语言模型阶段,具备长期发展潜力。
值得关注
- 参考生物医药AI化路径(早20年),材料科学是第二个有望实现数据突破的领域,10年内机遇与不确定性并存。
- 数据开放策略:部分数据可浏览浏览,但供机器学习使用的核心数据不会公开。
- 选择科学问题的关键在于数据质量(如AlphaGo选择围棋因数据清晰)。
