NAIRR科学计划获NVIDIA AI基础设施支持,推动700余项科研项目
美国国家科学基金会NAIRR试点项目运行两年,依托NVIDIA DGX系统等AI基础设施,支持超700个研究项目。项目涵盖蛋白质预测、传染病监测等领域,典型案例包括Polymathic AI的流体模拟基础模型、密歇根大学的能源存储分子AI模型以及波士顿大学的传染病检测AI管道,大幅缩短研究时间并加速行业创新。
事件概述
美国国家科学基金会(NSF)的NAIRR(国家人工智能研究资源)试点项目运行两年来,依托NVIDIA提供的AI基础设施,已支持超过700个研究项目,覆盖蛋白质预测、传染病爆发管理等领域。NVIDIA通过云资源为研究人员提供至少4个DGX节点的专属访问权限(至少一个月),并提供技术支持和DGX参考架构,显著缩短了工作流程时间,推动了医疗、农业、能源等行业的技术突破。
核心项目
1. Polymathic AI的流体模拟与基础模型
由Flatiron研究所、剑桥大学、劳伦斯伯克利国家实验室等组成的Polymathic AI合作联盟,借助NVIDIA GPU和NVLink互连技术,构建了大规模流体模拟数据集“Well”,并训练出迄今最大、最通用的流体行为基础模型Walrus。该模型及其数据、代码和预训练权重已公开。研究团队计划进一步探索扩展定律,加速科学应用基础模型的开发。
2. 密歇根大学的能源存储融合模型
密歇根大学研究人员在航空航天工程系教授Venkat Viswanathan领导下,开发了模型融合框架,将分子AI模型与大语言模型结合。其分子基础模型家族MIST(基于SMILES的分子洞察Transformer)通过新分词器Smirk更好捕捉分子结构信息,在电化学、量子化学等领域的400余项结构-性质关系微调中达到或超越现有最优性能。MIST基于NAIRR分配的40-GPU NVIDIA DGX集群和ALCF Polaris集群的20万GPU小时开发,使用NVIDIA NGC PyTorch容器实现可复现的GPU加速开发。融合后的框架使量子化学计算更易用,加速了交通电气化(如重型卡车和航空)所需的储能材料设计。
3. 波士顿大学的传染病检测AI管道BEACON
波士顿大学Hariri计算研究所与新兴传染病中心利用NVIDIA加速计算训练大语言模型,支持名为BEACON(生物威胁涌现、分析与通信网络)的疫情监测项目。模型基于大量传染病文献和优先病原体文档训练,可分析全球在线发布的新兴疾病爆发信息,提取特征用于分类和优先级排序。BEACON整合HealthMap、新闻、社交媒体、专家意见等多种信号,快速生成疫情报告。据Hariri研究所所长Ioannis Paschalidis介绍,此前专家编写报告需数小时,现在约两分钟即可完成。该模型已被国际医生、政府机构和研究人员用于快速识别和治疗传染病。
更广泛影响
除上述项目外,哈佛大学、斯坦福大学、科罗拉多州立大学等高校也在NAIRR和NVIDIA支持下取得科学突破。AI与加速计算的广泛普及使更安全、更健康的创新成果更加触手可及。
