串联重复序列是具有显著功能后果的高度可变基因组元件,但其进化起源的潜在机制尚不清楚。一种被提出的机制是微同源介导的串联重复(MTD),其中侧翼存在微同源序列的单拷贝DNA片段发生重复,并可能随后扩增。尽管MTD最早在裂殖酵母(Schizosaccharomyces pombe)中被描述,但其在生命界中的普遍性及进化意义尚未得到系统阐明。
2026年5月5日,浙江大学蒋超和何向伟共同通讯在PNAS在线发表题为Microhomology-mediated tandem duplication is a conserved mechanism of genomic variation with implications for human disease的研究论文。
该研究通过全基因组深度测序和统一的分析框架,作者证明了MTD在细菌、古菌、真菌和病毒中从头产生。对2,245个参考基因组、来自103个微生物物种的数百万个基因组以及人类数据集的综合分析表明,微同源介导的重复是生命各域中串联重复的主要来源。
全基因组分析显示,大多数MTD在中性或近中性动力学下进化,而纯化选择优先从编码区中清除MTD。在机制上,保守的瓣状核酸内切酶Rad27的缺失特异性增加了芽殖酵母中从头MTD的形成,提示冈崎片段成熟参与MTD的产生。在人类中,微同源特征在参考基因组、多态性和疾病相关的串联重复中普遍存在,并在与基因组稳定性和癌症相关的致病性变异中富集。
综上所述,这些发现确立了MTD作为一种塑造基因组变异保守机制的地位,并对人类疾病具有重要启示。
重复序列在基因组中普遍存在,且其拷贝数具有极高的变异性,使其成为基因组不稳定性和遗传多样性的主要驱动因素。在人类基因组中,重复元件占总序列含量的50%以上,其中串联重复序列(TRs)约占6%。
在不同生物体中,TRs影响基因调控、染色质组织和基因组可塑性,同时也导致基因组不稳定性,包括脆性染色体位点。其动态变化特性与人类疾病(包括癌症和神经退行性疾病)密切相关。尽管具有重要的生物学和临床意义,但关于TRs起源和分布的进化过程仍不完全清楚。
TRs被认为是通过初始的串联重复(TD)产生的,即从单拷贝序列(1×)转变为重复的双拷贝序列(2×),随后可能扩展为更高拷贝数的串联重复。然而,TRs为何在特定的基因组位点出现,以及特定的DNA片段如何经历拷贝数扩增,这些问题仍未得到解答。
基于酿酒酵母的全基因组分析,Haber和Louis提出,TRs可能源于两侧带有短微同源序列的非重复DNA片段,通过复制滑脱或不等交换等机制产生。尽管这一模型具有影响力,但支持该模型及其在不同生物体中普遍性的直接实验证据仍然有限。
图1.在种内水平上,MTD是可变TDs的主要形式(摘自PNAS)
在作者之前对裂殖酵母的研究工作中,作者鉴定了一种名为微同源介导的串联重复(MTD)的突变形式。在MTD中,两侧带有微同源臂(MHAs)的短单拷贝DNA片段发生串联重复,产生高度可逆的2×拷贝。MTD广泛分布于整个基因组,对序列长度几乎没有限制,并可能发生在数百万个潜在位点。
对源于单细胞的酵母群体进行的深度全基因组测序揭示了数千个低频MTD事件,揭示了在表面同源的群体中存在意想不到的高遗传多样性。然而,单个MTD通常以极低的频率持续存在,这可能是由于漂变、纯化选择和高回复率所致,使其难以使用常规的变异检测方法被识别。
在粟酒裂殖酵母之外的物种中,MTD的普遍性、进化动态和生物学意义在很大程度上仍未被探索。特别是,尚不清楚MTD是否代表了一种跨生物界的保守突变过程,它们如何在不同的基因组和群体尺度上被选择所塑造,以及它们是否对人类中的串联重复变异和疾病背景具有实质性贡献。
在此,作者利用全基因组深度测序和统一的分析框架,在三个进化尺度上解决这些问题:i)在单祖先群体中产生的从头MTD,ii)微生物物种内菌株水平的TD,以及iii)跨类群参考基因组中固定的TD。将分析扩展到后生动物,作者进一步检查了人类群体变异、体细胞突变和疾病相关TD中类似MTD的特征。
作者的泛域分析涵盖了细菌、古菌、真菌、病毒和人类,结果表明MTD广泛存在,并构成了跨生物界TD的主要机制来源。全基因组分布和群体遗传学分析表明,大多数可观察到的MTD在中性或近中性动力学下进化,而纯化选择优先从编码区清除MTD。
在机制上,作者证明了在芽殖酵母中删除保守的瓣状核酸内切酶Rad27会显著增加从头MTD的形成,这表明DNA复制过程中冈崎片段成熟这一高度保守的过程参与了这些事件的发生。最后,作者发现MTD相关的序列特征在人类致病性串联重复变异体中富集,包括与癌症相关的突变。
总之,这些结果确立了MTD作为一种保守的、反复发生的突变过程,该过程启动了串联重复变异,为理解串联重复序列在生物界的起源、进化约束和偶尔的持续存在提供了一个统一的框架。
参考消息:https://doi.org/10.1073/pnas.2606747123