Nat Genet:从新石器时代到基因组时代:王晓武/武剑厘清芸薹属作物驯化与异源四倍体起源之谜

  • 2026-06-14 10:27:47
  • 来源:医药头条

自新石器时代以来,芸薹(Brassica rapa)一直是一种重要的油料和蔬菜作物,然而其模糊的进化历史阻碍了对其驯化过程及其异源四倍体后代——甘蓝型油菜(Brassica napus)和芥菜型油菜(Brassica juncea)——物种形成机制的理解。

2026年6月8日,中国农业科学院王晓武和武剑共同通讯在Nature Genetics 在线发表题为“Genomic analysis of 3,330 accessions provides insights into the evolutionary history and self-incompatibility locus of the Brassica A genome”的研究论文。该研究通过对21个芸薹基因组组装体中的所有同线性区域进行泛区块(pan-blocks)界定,并分析涵盖上述三个物种的3,330份种质资源,重建了芸薹属A基因组的进化轨迹。

研究结果表明,该基因组起源于中亚和西亚,随后通过三条路线扩散至欧亚大陆。作者鉴定出一个古老倒位事件,该事件支持甘蓝型油菜和芥菜型油菜中A亚基因组的差异性起源。此外,S位点表现出极高的单倍型多样性,每个变异体均具有独特的转座元件条形码模式,这对自交不亲和系统至关重要。这些发现凸显了整合了泛区块的3,330个A基因组变异体对芸薹属研究界的重大价值。


芸薹属作物构成了著名的“U三角”模型,该模型包括三个二倍体物种——白菜(AA,2n=20)、黑芥(BB,2n=16)和甘蓝(CC,2n=18)——以及由它们两两杂交形成的三个四倍体物种:欧洲油菜(AACC,2n=38)、芥菜(AABB,2n=36)和埃塞俄比亚芥(BBCC,2n=34)。三个二倍体芸薹属物种为中期多倍体,而三个双二倍体则为近期多倍体,这使得该属成为研究多倍体进化的理想模型。作为A基因组的携带者,欧洲油菜(油菜)、芥菜(芥末)及其二倍体祖先白菜兼具蔬菜和油料作物的高度适应性,表现出巨大的形态变异,例如膨大的根或茎,以及紧凑的叶球。

有证据表明,自新石器时代以来,白菜对早期人类农业文明至关重要。重要发现显示,古代美索不达米亚人食用芜菁种子以获取必需脂肪酸。在中国西北半坡新石器时代遗址(距今6000–7000年)中发现了芸薹属种子,且在印度梵文文献(约距今3600年)中也有提及,使其成为与普通小麦(可追溯至距今8500–9000年)并列的最早作物之一。作为携带A基因组的四倍体,据报道欧洲油菜起源于距今7500年的地中海地区,而芥菜则起源于距今8000–14,000年的西亚地区。这些线索凸显了A基因组物种作为作者祖先数千年来在全球范围内栽培作物的重要性。

图1.构建A基因组泛块的方法(摘自Nature Genetics

由于A基因组物种的古代传播以及野生植株的缺乏,其物种形成与驯化过程仍不明确,尤其是对于古老的白菜作物。过往研究提出了白菜的几个潜在起源中心,包括地中海附近的山丘地区、阿富汗及巴基斯坦毗邻地区、小亚细亚、外高加索、伊朗、一个欧洲-中亚联合区域以及中亚的兴都库什山脉,这使得白菜的驯化路线难以确定。此外,研究表明欧洲油菜中的A亚基因组源于欧洲芜菁祖先,而芥菜可能源自南亚的白菜亚种tricolaris或西亚的未知形态。A基因组模糊不清的起源和全球传播对研究广泛栽培的白菜、欧洲油菜和芥菜作物的遗传分化构成了挑战。尽管这三个物种被独立驯化为理想的作物形态,但二倍体遗传位点可通过倍性间基因渐渗转移到四倍体基因组中,从而促进了优良性状的共享。

有限的样本也阻碍了对二倍体祖先白菜基因组进化历史的分析。群体测序有助于探索白菜基因组进化及农艺性状,但由于来自中亚和西亚(CWA)以及中国西北地区的遗传资源稀缺,其驯化历史仍不明确。这些地区是史前丝绸之路上的关键枢纽,促进了东亚、CWA和欧洲之间的古代作物交流。这些挑战突显了理解以下问题的必要性:在欧洲油菜和芥菜物种形成之前,具有A基因组的白菜是如何在全球传播的,以及该基因组随后是如何融入二倍体和四倍体形式的驯化过程中的。此外,不同的白菜形态型表现出显著的表型和基因组大小变异。由于存在大量缺失序列,依赖单一参考基因组会导致分析不完整。尽管泛基因组策略已应用于作物,但其尚未通过整合变异完全解决单一参考基因组的偏差问题,从而在理解缺失序列在驯化中的作用方面留下了空白。

此外,有限的样本和单一参考基因组的偏差阻碍了对高度复杂基因组区域的分析,例如自交不亲和性(SI)位点(S-位点)——通常包含SCR/SP11和SRK,分别编码雄性和雌性特异性决定因子——该位点促进异交并维持芸薹科植物遗传多样性。SI一直是自然平衡选择的经典案例,其中个体的交配成功率与其表达的SI特异性因子的频率呈负相关。SI系统具有众多共存的S-等位基因,在白菜中多达48个。花粉和雌蕊功能组分中S-等位基因间的极端序列差异导致了高水平的跨物种甚至跨属多态性。由于这种多样性,对天然芸薹科群体进行S-位点基因分型仍然是一个主要的方法学挑战。S-位点基因组特征的高度复杂性包括升高的杂合性、降低的重组率和转座子富集,覆盖了一个大的基因组区域。这种复杂性不仅阻碍了该区域的组装,也阻碍了对基因组特征如何支撑SI的理解。

在本研究中,作者基于21个白菜基因组的共线性定义了A基因组泛区块,同时探究了包含3330份芸薹属A基因组集合中的变异。作者通过提出A基因组的起源及其跨越欧亚大陆的三条主要传播路线,重建了其进化历史。作者的发现为欧洲油菜和芥菜的物种形成提供了新见解,其证据来自一个古老的基因组倒位。此外,作者揭示了芸薹属SI系统中高度多样化S-位点的“基因组安全区”。这些泛区块以及A基因组变异的综合数据集为推进芸薹属育种工作提供了宝贵资源。

参考消息:https://www.nature.com/articles/s41588-026-02626-7


八宝山殡葬服务