Cell:机器学习从化学结构预测基因表达,发现肝癌与肺纤维化新候选药物!

  • 2026-04-15 16:27:49
  • 来源:医药头条

在一个病变细胞内部,基因处于混乱状态。有些基因接收到信号,过度产生某种蛋白质;另一些基因则将活性降低到异常水平。上行下效,上下颠倒。正确的分子可以恢复秩序,逆转特定基因的失调。但要找到理想的化合物,可能需要检查数百万种化学物质对数百或数千个基因的影响。

一个由密歇根州立大学(MSU)领导的研究团队展示了一种更好的方法。利用在海量已发表数据上训练的机器学习,他们能够仅基于化学物质的结构,预测化学物质将如何影响基因表达。他们的研究最近发表在《Cell》期刊上,已发现对治疗两种疑难疾病有希望的化合物:最具侵袭性的肝癌,以及一种尚无治愈选择的慢性肺部疾病。

由于对加速药物发现具有启示意义,这些结果是多年跨学科、跨机构工作的成果,资深作者之一、人类医学院儿科与人类发展系及药理学与毒理学系副教授Bin Chen表示。

“很多人参与了这一概念的工作。我们涉及了超过20名研究人员,这是一段漫长的旅程,”Chen博士说,他的研究重点是开发计算方法和工具,与计算机科学家、实验科学家和临床医生合作进行药物发现。

这种跨学科方法是该项目的关键。它始于在数百万个实验测量值上训练一个基于化学结构的基因表达谱预测器(GPS)。Chen与另一位资深作者、曾任教于MSU、现任职于密歇根大学的Jiayu Zhou博士合作完成了这一阶段。

Chen将这一过程比作训练一个神经网络将图像分类为人、猫或狗。“在我们的方法中,我们不看猫或狗,而是想知道该化合物是会向上调节还是向下调节某个特定基因的表达,”Chen说。“这仍然是一个分类问题,但更具生物学驱动性。”

“但生物学数据很少是干净的,”Zhou说。“想象一下,试图从一大堆例子中学习,其中一些是清晰的,一些是模糊的,有些甚至可能具有误导性。我们的方法帮助模型从较弱的信号中分离出较强的信号,这样它就可以从数据中学习,而不会被所有噪声干扰。”

在评估了数据对多种疾病的理论应用后,团队选择了两种疾病进行实际测试。肝细胞癌(HCC)是全球癌症相关死亡的第三大原因。特发性肺纤维化(IPF)是一种慢性肺部疾病,诊断后中位生存期为三年。这两种疾病都需要新的治疗方法,并且都引起了研究人员的浓厚兴趣。

Chen此前发现一种驱虫药可能用于治疗HCC。他与合著者、Lui Hac Minh教授Samuel So博士以及斯坦福大学亚洲肝脏中心资深研究科学家Mei-Sze Chua博士长期合作,致力于开发一种有益于HCC患者的化合物。

“我们以前的努力仅限于重新利用FDA批准的药物,”Chua说。“这种新方法极大地扩展了在HCC中具有潜在治疗活性的新型化合物的池子。”

“随着美国HCC发病率的持续上升,能够针对HCC分子异质性的新型且更有效的化合物直接解决了一个未满足的临床需求,”So说。

MSU的另一位资深作者、人类医学院儿科与人类发展系副教授Xiaopeng Li博士将研究重点放在IPF等肺部疾病上。

“我们知道这种疾病很难攻克,”Li说。“在过去20年里,识别新药物有太多失败。我认为AI部分帮助我们以不同且更系统的方式探索这个问题。”

理论上发现化合物是一回事。它们仍然必须在现实世界中进行验证,MSU药物化学设施主任、药理学与毒理学系教授Edmund Ellsworth博士说。

作为研究的贡献者,Ellsworth和他的团队负责创建该平台发现的相关化合物,并将其优化为安全有效的药物。他说,这一关键步骤仅仅是一个复杂过程的开始。

“要向前推进,必须认识到药物发现是一项团队运动,不适合胆小的人,”Ellsworth说。“它很复杂,各种事情都会发生,你需要多样化的专家来克服困难并取得成功。”

这些化合物在实验室的细胞系上进行了测试,以确认它们对基因的影响,并确定在生物体内测试的主要候选物。

当抗HCC化合物在小鼠身上测试时,团队发现了两种能减小肿瘤尺寸的新化合物。对于IPF,团队确定了一种可重定位的药物和两种显示出前景的新化合物。

测试IPF化合物也从小鼠开始,但扩展到人类肺组织样本,这得益于与位于Grand Rapids的Corewell Health肺移植项目的临床研究合作。

该项目是密歇根州最繁忙的。由于肺纤维化是肺移植的主要指征,该项目有足够的离体组织样本作为活培养物与研究人员分享,肺科医生、移植项目医学主任、研究贡献者Reda Girgis博士说。

Girgis说这项研究说明了通过Corewell与MSU之间的合作可能实现的进步。“我认为这是推动医学知识进步的最佳方式,让临床医生与生物学家并肩工作,现在还有计算科学人员,”Girgis说。“这对推动研究进展确实至关重要。”

该团队已共享其代码,并开发了一个门户网站供研究人员使用GPS进行虚拟化合物筛选。“这就像一种范式转变的方法,让人们推动发现,”Chen说。“我希望更多人测试这种方法。但最重要的是,我希望人们真正能够使用它来发现新的治疗方法。”

Li也怀有同样的雄心。“我认为已经证明,这个平台可以应用于两种完全不同的疾病,”他说。“所以这个平台可以用于其他疾病,释放其潜力。”(生物谷Bioon.com)

参考文献:

Jing Xing et al, Deep-learning-based de novo discovery and design of therapeutics that reverse disease-associated transcriptional phenotypes, Cell (2026). DOI: 10.1016/j.cell.2026.02.016.


八宝山殡葬服务