Nature:西湖大学郭天南团队提出“虚拟酵母”计划,用AI打造首个虚拟真核细胞
西湖大学郭天南团队联合多个机构在Nature发表前瞻性评述,提出“虚拟酵母”计划,旨在用AI构建全球首个可预测、可实验验证的虚拟真核细胞。该计划以酿酒酵母为模型,将细胞功能拆分为八个AI模块,由大语言模型协调调度,整合机制知识、亚细胞空间结构和动态状态数据,形成闭环主动学习流程。该框架未来可推广至人类细胞虚拟模型的构建,用于疾病机制研究和药物筛选。
2026年7月1日,西湖大学郭天南教授联合北京大学、上海人工智能实验室、复旦大学、斯坦福大学、苏黎世联邦理工学院、多伦多大学等数十个研究团队,在Nature发表题为“Towards the construction of a virtual yeast”的前瞻性评述文章,提出“虚拟酵母”(Virtual Yeast)计划。该计划旨在使用AI打造全球首个可预测、可实验验证的虚拟真核细胞——一个能模拟酵母从基因表达到代谢产物全链条行为的AI系统。
为什么选择酵母?
酿酒酵母是真核生物研究的“黄金模式生物”。它拥有完整的真核细胞结构(直径仅3-10微米),遗传工具箱丰富(覆盖所有非必需基因的敲除文库、全基因组标签库、百万级遗传互作图谱),且核心细胞过程与人类高度保守。把酵母的数字模型做通后,方法可平移到更复杂的真核细胞研究,为癌症机制解析、药物筛选打下基础。
模块化AI架构
虚拟酵母将细胞复杂性分解为八个以功能为中心的模块:膜系统模块、遗传中枢模块、线粒体能量模块、胞质代谢模块、生物合成网络模块、细胞骨架模块、应激处理模块、降解机器模块。每个模块均以特定领域AI工具实现(如代谢模块使用变分自编码器和扩散模型),并通过基于大语言模型(LLM)的协调层统一调度。LLM作为“总指挥”,能根据用户问题自动调用或组合模块。
为保证预测可靠性,系统设置三重约束:知识图谱把关因果关系、物理化学规则约束反应逻辑、真实实验结果作为强化学习反馈。
三大数据支柱
虚拟酵母建立在三个核心数据支柱之上:
- 先验生物学知识:包括SGD基因注释、YMDB代谢物信息、YeastNet蛋白互作网络、近100万对遗传互作图谱等,整理为结构化知识图谱。
- 亚细胞空间架构数据:借助空间组学、膨胀显微镜、冷冻电镜断层扫描等技术,获取分子定位和细胞器精细结构数据,为模型建立“空间感”。
- 动态状态数据:团队已完成969个天然酵母菌株在碳氮源变化、温度波动、化学胁迫等条件下超过1.5万份时间分辨蛋白组检测、5000多份代谢组数据和生长曲线。采用主动学习策略,形成“模型预测→实验验证→数据反哺”闭环。
当前进展与未来规划
目前代谢模块已落地:将AI与传统基因组尺度代谢模型(GEM)结合,预测高产菌株基因编辑方案的准确率高于传统机器学习。项目计划未来5-10年分三阶段推进:第一阶段打磨代谢模块并建立基准;第二阶段整合2-3个细胞器模块;第三阶段完成八模块完全整合,形成全细胞AI智能体。
意义与前景
虚拟酵母的核心价值是提供一套可推广的虚拟细胞构建框架:从功能出发拆分模块、用多模态数据训练、靠实验闭环迭代、兼顾预测能力和可解释性。未来可用类似方法构建人类细胞虚拟模型,用于模拟疾病发生、筛选药物靶点、设计个性化治疗方案。
