在人类发育过程中,细胞类型的多样性是通过转录因子的差异表达和活动而形成的,这些转录因子整合了细胞内在和外在的信号,以指导基因的调控。转录因子会与转录调控元件中的特定 DNA 序列结合,通常会诱导局部染色质的可及性,并改变邻近基因的表达。
然而,对于在人类发育过程中驱动染色质状态变化的转录因子模式缺乏全面的认识,这限制了我们对转录因子结合位点的组织如何促进调控的理解。
通过使用 DNA 酶 I 超敏感位点测序(DNase-seq)和转座酶可访问染色质测序(ATAC-seq)技术,可以对染色质可访问性进行图谱绘制,并借此通过序列模式推断人类组织中的转录因子活性。然而,批量测量会掩盖细胞的异质性,而大多数单细胞图谱都只关注单个器官或单一的组学模式。
因此,需要一个涵盖多个器官、多种模式的视角,以捕捉顺式调控的细胞环境特异性,并将染色质状态与转录程序联系起来。
2026年4月8日,斯坦福大学William J. Greenleaf团队在Nature在线发表题为Multiomics and deep learning dissect regulatory syntax in human development的研究论文,该研究推出了“人类发育多组学图谱”,这是一个来自 817,740 个胎儿细胞、涵盖 12 个器官、涵盖 203 种细胞类型以及超过 100 万个候选顺式调控元件的单细胞染色质可及性和基因表达图谱,其中许多元件在体内表现出器官特异性的增强子活性。
人类发育的多组学、多器官图谱(图源自Nature)
由训练有素的深度学习模型从局部 DNA 序列预测可及性的方法揭示了影响可及性的全面模式,包括表现出不同模式约束的复合模式,这些模式被预测为介导转录因子的协同作用。该研究识别出“严格”的模式规则,要求精确的模式间距和方向,以及“宽松”的规则,允许灵活的模式排列,还有普遍存在的抑制可及性的模式。
基于模型对基因变异的解读表明,具有正向和负向影响的基序的破坏与基因表达的协同效应有关。总之,该研究阐明了基序的模式如何控制细胞类型特异性的染色质可及性,并为解读顺式调控逻辑以及在人类发育过程中解读基因变异提供了基础资源。
参考消息:https://www.nature.com/articles/s41586-026-10326-9