定制化 Amazon Nova 模型统一药物发现中的分子性质预测

2026/04/16 00:10阅读量 28

Amazon 与 Nimbus Therapeutics 合作，通过监督微调（SFT）和强化微调（RFT）将通用大语言模型定制化为药物发现助手，实现了在分子性质预测上媲美多个专用图神经网络（GNN）的精度。该方案将原本需要维护多个独立 GNN 模型的复杂流程简化为单一 LLM 接口，支持多属性预测及交互式推理。实验显示，未经微调的通用模型误差高达 40%-200%，而微调后的 Amazon Nova 2 Lite 模型显著缩小了这一差距，大幅提升了早期药物设计的效率。

事件概述

针对药物研发中分子性质预测的传统痛点，Amazon 科学家与 Nimbus Therapeutics 合作，提出了一种基于定制化大语言模型（LLM）的新范式。该研究旨在解决传统依赖多个专用图神经网络（GNN）导致的流程割裂、维护成本高以及缺乏交互推理能力的问题。

核心挑战与背景

传统局限：药物研发通常需使用多个独立的 GNN 模型来预测不同的分子属性。每个模型拥有独立的接口、数据格式和失效模式，导致化学家必须手动整合分散的结果。
扩展困难：当需要预测新属性时，必须从头构建多任务数据集并训练新模型，这一过程耗时数周。
通用模型不足：虽然 Claude Sonnet 4 和 Nova 2 Lite 等通用 LLM 在其他领域表现优异，但在直接应用于分子性质预测时，其精度远低于专用 GNN。测试数据显示，未微调模型的均方根误差（RMSE）比专用 GNN 高出 40% 至超过 200%。