1. Ebpay

    新闻中心
    NEWS
    Nature 项目文章 | 多倍体甘蔗单倍型基因组破译,全面解析高糖遗传机制
    2026-06-03 09:42

    2026年5月27日,由中国农科院深圳农业基因组研究所、中国热带农业科学院等10余家单位联合攻关的重大研究成果“Genetic architecture of sugarcane traits in a polyploid genomics framework”,在线发表于Nature。团队自主研发三套算法,并且首次完成“蔗王”POJ2878完整单倍型分型基因组组装,破译甘蔗高糖抗逆高产的遗传密码,为甘蔗及多倍体作物精准育种带来革命性工具。Ebpay为该研究给予基因组建库测序服务。



    图片

    研究背景

    现代栽培甘蔗(Saccharum spp.hybrids)是高糖的热带种(S.officinarum,2n=80;x=10)和抗逆性强的野生种割手密(S.spontaneum,2n=40~130;x=8)的种间杂交再经多代回交培育而成。而全球80%的食糖来自甘蔗,优良的甘蔗品种是实现高产高糖高效栽培的关键,但其作为遗传背景高度复杂的异源多倍体或非整倍体作物(2n=100-130,~10 Gb),高糖遗传机制长期未被解析,仍依赖经验表型选择,育种周期长达10–12年,效率难以提高。


    研究材料方法

    01 单倍型基因组组装分型和注释

    材料和测序策略:以现代栽培甘蔗“蔗王”POJ2878(2n=118)及其祖先种热带种XZ(2n=8x=80)、野生种割手密82-114(2n=8x=64)为研究材料,采集幼嫩叶片,利用PacBio HiFi、ONT、Pore-C等技术完成多组学测序。

    表1 测序策略[1]

    图片


    02 群体重测序与GWAS分析

    材料和测序策略:对全球19个主产区的981份甘蔗种质(78份热带种、290份割手密、613份杂交品种)召开全基因组重测序(125Tb,平均16X),试验材料种植于海南省临高县甘蔗试验基地、广西壮族自治区扶绥县和云南省开远市3个气候特征各异的试验基地。

    群体结构和选择消除分析:召开群体结构、遗传多样性、连锁不平衡及遗传渐渗分析,将种质划分为野生种、热带种、现代杂交种三大类群。结合XP-CLR、FST、ROH分析分组比对,鉴定甘蔗驯化与人工育种过程中的选择信号。

    GWAS分析:陆续在2年多点测定蔗糖含量、茎径、株高、分蘖数等12个农艺性状数据。265份核心杂交品种,精准测定茎薄壁细胞大小、密度、糖度(Brix)。


    图片


    图1 技术路线图 


    主要研究结果

    01 POJ2878完整单倍型基因组的组装、重排及注释

    研究团队自主开发C-Phasing算法,整合HiFi、ONT、Pore-C数据,并引入基于超图的聚类算法,以hifiasm完成初始Contig组装,利用Pore‑C高序染色质互作信息实现同源染色体聚类分型,结合Hi‑C数据与遗传图谱完成染色体挂载与质量验证,并顺利获得人工校正剔除嵌合错误序列,最终取得“蔗王”POJ2878高质量完整单倍型分型基因组。该基因组包含118条染色体,总大小达10.37Gb,Contig N50达15.6Mb,分型错误(Switch)率仅2.02%、塌缩(collapse)率0.82%,BUSCO完整性98.6%,成为现在最完整单倍型的甘蔗参考基因组。并且利用10份热带种和10份野生种的重测序数据,进一步证明POJ2878基因组中80.5%来源于热带种,19.5%来源于割手密,且至少10%的基因组区域发生了染色体间重组事件,即包含92条热带种起源、16条野生种起源及10条重组染色体。顺利获得构建祖先种单体型T2T基因组和共线性分析,发现大量非同源染色体重排,并验证了Chr 5g1染色体重组结构。另外,端粒与着丝粒注释表明,10条热带种野生种重组染色体中,40%为端着丝粒或近端着丝粒类型。


    图片


    图2 基因组组装、亚基因组鉴定与染色体重排[1]

    研究团队整合MAKER、BRAKER、TransDecoder完成POJ2878基因预测。该基因组转座元件(TE)占比69.24%,以LTR逆转座子为主体,亚基因组特异性转座爆发有助于基因组分化;共鉴定28523个部分同源基因对,BUSCO评估完整性达98.6%,为解析多倍体等位变异与功能研究给予了高质量注释基础。

    为精准解析多倍体中等位基因的表达差异,研究结合叶片与茎的全长转录组数据优化注释,并利用自主开发的Allele-Express工具,高效区分高度同源的等位基因转录本并准确定量等位基因特异性表达(ASE),分别在茎、叶中鉴定到6994个和7325个等位基因特异性高表达基因(ASHEG)。尽管野生种亚基因组仅占基因组的20%,却表现出更高的ASHEG密度,对组织特异性高表达贡献显著。功能富集显示,这些基因与糖代谢、细胞膨压、液泡发育及信号调控等关键通路密切相关。

    02 甘蔗群体结构和育种单倍型

    981份全球甘蔗种质重测序,以POJ2878为参考基因组比对取得1143万个SNPs和736万个InDels。群体结构与进化分析显示,研究材料分为了野生种、热带种、杂交种三大支系,存在广泛遗传渐渗。野生种核苷酸多样性最高,杂交种与其相近,热带种多样性最低。


    图片


    图3 遗传多样性与群体结构分析[1]

    对573份(327份中国、246份国外)具有广泛地理代表性的种质进行IBD(Identity by Descent)分析以评估POJ2878对现代甘蔗品种的遗传贡献。结果显示,95.3%的现代栽培种与POJ2878共享超过821.6Mb的同源片段,基因组渗入达98.15%,表明该品种被全球育种广泛使用。

    研究筛选出育种家偏好的单倍型,SUS2是蔗糖合成核心基因,含4种单倍型,野生来源的Ss_hap1携带特异插入与缺失变异,携带1–3个拷贝的品种蔗糖含量显著提高且存在最佳剂量效应。中外品种对POJ2878的利用存在区域性差异:国外品种更偏好抗逆相关单倍型,中国品种更富集抗除草剂相关位点。


    图片


    图4 POJ2878的遗传贡献和育种优选的单倍型分析[1]

    03 甘蔗的驯化与遗传改良

    该研究顺利获得对甘蔗分阶段分层次的群体遗传解析,清晰重建了其从野生种逐步演化为高糖栽培作物的驯化与改良演化路径,阐明了不同阶段的受选择基因与选择特征。

    • 野生种阶段:自然选择抗病、抗逆基因(CBL1、RPM1),适应野外复杂生存环境;

    • 热带种驯化:选择蔗糖代谢、抑开花基因(NINV、FPB、TFL4),形成糖分含量大幅提升、营养生长旺盛的典型驯化表型;

    • 现代杂交改良:聚焦于蔗糖储存效率、细胞形态建成、分蘖特性与综合抗逆性。TB1影响分蘖,SUS2、SWEET等基因调控糖的合成与运输,TIP1和QRT1则参与液泡发育和细胞壁松弛,表明高糖是由植物结构、生长方式与细胞特性共同决定的综合性状。


    图片


    图5 S. spontaneum、S. officinarum和S. hybrid的选择消除分析[1]

    04 甘蔗高糖遗传机制解析

    265份杂交品种表型观测发现,高糖甘蔗品种的茎薄壁细胞体积显著更大,且细胞大小与蔗糖含量呈显著正相关。为解决多倍体基因分型不准确、剂量估计难的瓶颈问题,该研究开发了基于k-mer的全基因组关联分析流程KMERIA,可直接处理复等位基因与剂量效应,无需基因型转换。对甘蔗群体糖分、细胞形态、抗逆、分蘖等重要农艺性状召开GWAS分析,精准定位到多个与薄壁细胞发育和储糖相关的关键基因。如在甘蔗中过表达ShSUT2基因时,甘蔗茎秆的薄壁细胞体积显著增加,将甘蔗的驯化推进到了“细胞结构”的微观层面,也为未来培育“超级高糖”品种给予了分子靶点。


    图片

    图6 薄壁细胞性状的GWAS分析[1]

    05 多倍体作物基因组学分析新范式

    该研究建立了一套面向复杂多倍体作物的基因组学分析体系:C-Phasing(分型组装)、Allele-Express(等位表达)、KMERIA(多倍体GWAS),不仅成功构建并解析甘蔗高质量分型基因组,更为小麦、棉花、马铃薯、牧草等复杂多倍体作物基因组分析给予可行的解决方案。栽培甘蔗基因组的破译,不仅为复杂作物遗传机制研究给予思路,更有助于育种工作由“经验育种”向“精准育种”转变,将大幅加速高产、高糖、抗逆、宜机等优良甘蔗品种的定向培育。


    图片


    图7 多倍体作物基因组学分析新范式[1]

    参考文献:

    [1] Wang, Jungang et al. “Genetic architecture of sugarcane traits in a polyploid genomics framework.”Nature, 10.1038/s41586-026-10576-7. 27 May. 2026.