Science:AI系统DefensePredictor快速挖掘数千种新型细菌抗病毒蛋白,45%经实验验证有效

  • 2026-04-23 10:27:44
  • 来源:医药头条

美国麻省理工学院(MIT)的研究人员利用一个名为DefensePredictor的人工智能系统,发现了数千种能够保护细菌免受病毒攻击的新型蛋白质。原本需要数月实验室工作才能完成的任务,现在可以在几分钟内缩小到有希望的候选者范围。

病毒防御

细菌持续受到称为噬菌体的病毒的攻击。它们最强大的防御系统之一是CRISPR-Cas,该系统通过切割病毒DNA来阻止感染,如今已成为实验室中精确编辑基因的宝贵生物技术工具。

寻找这些防御系统的传统方法漫长而费力,如同大海捞针。这些方法需要搜索附近已知的防御基因,并手动测试数千个DNA片段。但现在,AI可以承担这项繁重的工作。

为了开发他们的机器学习工具,科学家们用17,000个不同的细菌基因组对其进行了训练,正如他们在发表在《Science》期刊上的一篇论文中所描述的那样。由于基因包含制造蛋白质的指令,该系统识别每个基因组中编码的蛋白质,并使用名为ESM2的蛋白质语言模型对其进行分析。它通过检查特定特征(如基因长度、邻近基因以及每个基因周围DNA序列的模式)来区分正常蛋白质和防御性蛋白质。

为了进一步优化DefensePredictor,研究团队用15,000种已知抗病毒的蛋白质和186,000种执行日常任务的正常蛋白质对其进行了训练。通过比较这两组蛋白质,AI学会了快速区分防御性蛋白质和非防御性蛋白质。

识别新的防御系统

接下来是系统的大考。DefensePredictor扫描了69种不同的大肠杆菌菌株,并识别出624个蛋白质簇具有防御性。这其中包括100多个此前与细菌免疫系统无已知关联的蛋白质簇。然后,研究人员将这些预测系统中的94个克隆到大肠杆菌细胞中,并让它们暴露于24种不同的噬菌体。结果显示,近45%的蛋白质簇能够保护细菌免受感染。

“我们的结果表明,DefensePredictor是发现新的原核生物免疫系统的强大工具,”研究作者在论文中评论道。“我们识别出的新系统表明,大肠杆菌所拥有的抗噬菌体防御景观比先前认识到的要广阔得多。”

这个AI工具不仅识别了新的细菌防御系统,而且其速度远超传统方法。除了大肠杆菌,科学家们还在1,000种不同的微生物上测试了他们的系统,它识别出近3,000个与先前已知的细菌免疫系统没有相似性的蛋白质簇。

研究人员已将DefensePredictor作为资源向全球科学界开放,并将在新数据出现时继续对其进行完善。(生物谷Bioon.com)

参考文献:

Peter C. DeWeirdt et al, DefensePredictor: A machine learning model to discover prokaryotic immune systems, Science (2026). DOI: 10.1126/science.adv7924.


八宝山殡葬服务