Science|河北农业大学构建白菜图泛基因组系统解析着丝粒重塑,揭示其亚种分化的基础,为理解被子植物的快速进化与作物驯化提供了理论依据
2026年2月“Science”杂志在线发表了河北农业大学赵建军教授联合多家单位“Gapless pangenome analyses reveal fast Brassica rapa subspeciation”的研究论文,该研究在白菜图泛基因组的基础上,系统解析了着丝粒重塑和大规模结构变异对其亚种快速分化的作用。研究成果为理解被子植物快速进化与作物驯化提供了重要的理论依据,为甘蓝类作物性状改良方面提供重要的基因资源。该研究以快速多样化分化的白菜为模型,通过构建包含1720份材料重测序和11个T2T无间隙基因组的高质量泛基因组,系统解析了开花植物快速演化的基因组基础。研究揭示了着丝粒动态变化和结构变异在物种形成和形态型分化中的关键作用,绘制了高分辨率着丝粒和结构变异图谱,并验证了调控白菜叶球发育的关键基因BrLH1。该泛基因组资源为理解植物快速多样化机制提供了新见解。
该研究对1720份种质资源进行了深度重测序(平均26.1×),这些材料涵盖了包括大白菜、菜心、乌塌菜、白菜、芜菁在内的多个亚种与变种。基于系统发育关系、群体结构及农业重要性,从中精选了11份代表性材料进行无间隙基因组组装。组装的基因组大小介于426.54至446.60 Mb之间,连续性高(平均contig N50为46.36 Mb),且准确性优异(平均QV值52.57,BUSCO完整度99.28%)。所有11个基因组共包含110个完整着丝粒。在注释分析方面,重复序列平均占基因组的58.26%,以LTR逆转录转座子为主。每个基因组平均注释出46,603至48,562个蛋白编码基因(BUSCO完整度98.80%),并发现了6992个新基因。此外,还全面鉴定了各类非编码RNA。该研究是迄今为止最全面、高质量的白菜类蔬菜基因组数据,为后续的遗传分析与育种研究奠定了坚实基础。
通过对芸薹属(Br)多个亚种和形态型基因组中着丝粒及着丝粒周边区域的序列组成、结构特征与进化动态。通过染色质免疫沉淀测序(ChIP-seq)技术,利用着丝粒特异性抗体精准定位了11个材料共110条染色体的着丝粒区域,发现其大小在0.58至2.20 Mb之间,平均为1.16 Mb。这些着丝粒主要由CentBr1和CentBr2卫星重复序列组成,并伴有特定类型的LTR逆转录转座子(如Ale/Copia和CRM/Gypsy),基因数量稀少且表达水平普遍较低。还鉴定了五种新型卫星重复序列(如pBrSTR92、pBrSTR144等),并揭示了其通过基本单元复制形成的演化关系。通过比较不同Br形态型和亚种,发现这些卫星序列存在显著的拷贝数变异,表明快速演化的卫星序列扩张与收缩可能驱动了着丝粒的进化,并与物种分化相关联。进一步对六种芸薹属物种的比较分析显示,这些卫星序列主要存在于AA基因组中,可能起源于CC基因组,并在异源多倍体中得以保留。最后,研究发现不同染色体的着丝粒进化速率差异巨大,其中10号染色体(A10)的着丝粒结构在多个材料中高度保守,且该区域内包含多个对植物生长发育至关重要的功能基因,暗示其结构保守性可能受到关键基因功能的限制。
该研究构建了一个基于蛋白编码基因的甘蓝型油菜泛基因组,整合了11个新组装的T2T基因组和20个已发表的基因组。通过分析31个油菜品系的1,439,526个基因,将其聚类为47,946个非冗余泛基因家族。分析显示基因家族数量已达到饱和。根据基因在不同品系中的分布,鉴定出15,558个核心基因家族(存在于所有品系中)和32,388个可变基因家族(至少在一个品系中缺失)。可变基因家族进一步分为8536个软核心基因家族(存在于28-30个品系)、22,340个非必须基因家族(存在于2-27个品系)和1512个特有基因家族(仅存在于一个品系)。研究发现,核心和软核心基因的CDS数量和长度显著大于非必须和特有基因,且非同义替换率与同义替换率比值从核心到特有基因逐渐增加,表明非必须和特有基因进化速率更快,可能与形态类型多样化和亚种分化的农艺性状相关。研究还聚焦于亚种特异性基因,分别鉴定出芜菁(膨大根)、菜心(无需春化)和大白菜(叶球)中特有的基因,这些基因可能分别与根系发育、开花和叶片发育相关,为甘蓝型油菜的形态类型形成和亚种分化提供了基因组基础。
该研究构建30份芸薹属种质的图形泛基因组,共鉴定出276,700个结构变异(SV),包括PAV、倒位、重复和易位。分析表明,大部分SV为稀有变异,主要分布于染色体臂和基因间区,并与转座元件密切相关。群体遗传学分析揭示SV对形态型分化具有重要贡献。通过将SV整合至泛基因组图谱,对1720份材料进行重测序关联分析,发现多个与重要农艺性状相关的PAV,如调控叶球形成的RZ-1B基因、影响根部发育的BrWIP4以及控制春化开花的BrTFL1和BrFCA基因。这些发现为理解芸薹属物种分化和性状改良提供了重要的基因组资源。
通过全基因组关联分析(GWAS)对1720份白菜种质的结球性状进行遗传解析,在A07染色体上鉴定到一个控制叶片结球的关键基因BrLH1。该基因编码含1048个氨基酸的蛋白质,其三个非同义SNP位点(539、556和658)形成的单倍型与结球性状密切相关:携带AAC单倍型的植株表现为结球,而CTC和CTT单倍型则呈现叶片展开表型。通过EMS诱变获得功能缺失突变体fg7,该突变体因BrLH1基因第1264位核苷酸C-to-T突变导致提前终止(编码421aa截短蛋白),在275个F2群体中该突变与不结球性状完全共分离。进一步研究表明BrLH1编码具有多个C2结构域和跨膜结构域的蛋白,其拟南芥同源蛋白QUIRKY通过与STRUBBELIG受体激酶互作调控细胞形态建成。本研究证实BrLH1通过与BrSUB互作调控白菜结球形态发生,为叶片结球性状的分子机制提供了关键证据。
该文章创新点
(1)构建了11个代表7个关键亚种的无缺口端粒到端粒(T2T)基因组。
(2)发现了大量与物种分化和形态型相关的未知遗传元件。
(3)揭示了白菜快速驯化与分化的遗传机制并鉴定到关键基因。
https://doi.org/10.1126/science.ady7590