转自:
近日,洛阳师范学院植物多样性保护课题组联合菲沙基因在国际主流期刊 Molecular Ecology Resources (IF=,中科院一区)上发表了题为“ The chromosome-scale genome assembly,annotation and evolution of Rhododendron henanense subsp. lingbaoense ”的研究论文。该研究通过PacBio+Hi-C技术首次构建了我国特有杜鹃种-灵宝杜鹃的高质量参考基因组,随后基于比较基因组分析揭示了灵宝杜鹃与其它杜鹃间的共线性,同时也初步揭示了灵宝杜鹃逆境适应性的分子机制,从而为灵宝杜鹃的种质资源保护与进化研究提供了新见解。
杜鹃花具有较高的观赏、园艺与药用价值,近期也有大量关于杜鹃花属的基因组与转录组研究报道,这些报道对于杜鹃花属基因家族的进化和广泛的表型可塑性研究具有重要意义。但到目前为止,我国特有杜鹃种-灵宝杜鹃的基因组尚未有报道,这限制了对其遗传资源、环境适应性及分子进化的研究,因此构建灵宝杜鹃基因组具有重要理论意义。
材料 :灵宝杜鹃( Rhododendron henanense subsp. lingbaoense) 测序策略 :PacBio(220×)+Hi-C(100×)+Illumina(90×)
通过Survey分析,预估灵宝杜鹃基因组大小为,杂合为。随后研究者利用高深度的PacBio测序和Hi-C辅助组装,构建了高质量的染色体水平灵宝杜鹃基因组,其基因组大小为 ,Contig N50=,Scaffold N50= 。接着,研究者通过多种方法证实了基因组组装的完整性与准确性,三代数据的比对率为,BUSCO评估基因组完整性为97%,二代数据检测基因组单碱基错误率仅为;且与已发表的其它杜鹃属物种相比,本研究组装的基因组完整性和准确性都是最好的。
结合从头注释、同源注释和全长转录组注释,研究者在灵宝杜鹃种鉴定到 31098 个蛋白编码基因,平均每个基因的长度为 bp ,其中的基因都可以得到功能注释。灵宝杜鹃基因组中的序列都是重复序列,其中LTR的含量最高。此外,研究者在灵宝杜鹃中还鉴定到 2251个rRNAs、448个tRNAs、488个snRNAs 以及94个miRNAs。
研究者选取14个近缘物种用于灵宝杜鹃的比较基因组分析,共鉴定到15483个基因家族,其中168个是灵宝杜鹃特有的基因家族。系统进化树分析表明, 杜鹃属内的亲缘关系较为密切 ,其分化时间大致在 ~ 百万年前,而猕猴桃、山茶属与杜鹃属的分化时间大致在百万年前。
共线性分析表明,马缨杜鹃( Rhododendron delavayi )、圆叶杜鹃( Rhododendron williamsianum )、杜鹃( Rhododendron simsii )与灵宝杜鹃间的共线性非常好,且以单染色体与单染色体间的共线性为主,但不同杜鹃的基因组间也存在染色体重排事件。通过WGD分析,检测到杜鹃属和山茶属有一个相似的WGD峰(Ks值在到),结合分子时钟,研究者确定了杜鹃属植物先发生一次WGD事件(百万年前),而后与近缘种山茶属产生了分化。基因扩增收缩分析表明,灵宝杜鹃中有2257个基因家族发生了扩张, 扩张基因显著富集在与对水杨酸的响应、细胞对酸化学的响应、防御反应的调节、应激反应的调节相关的通路中,这证实了灵宝杜鹃对逆境有着极强的抗性;收缩的基因则显著富集在与萜合酶活性、碳氧裂解酶活性和ADP结合相关的通路中。
之前研究表明, MYB的同源基因调控植物发育、花朵颜色和胁迫反应中发挥重要作用 ,研究者随后鉴定了灵宝杜鹃中MYB基因家族的变化。结果表明,灵宝杜鹃中存在110个MYB的同源基因,在13条染色体上都有分布,其MYB基因的数目要小于棉花、油菜等物种,且灵宝杜鹃中部分MYB基因存在串联重复事件。此外,基于MYB基因构建的系统进化树表明,灵宝杜鹃的MYB基因与拟南芥中的MYB基因属于不同的分类。这些结果将有助于后续MYB基因的功能验证工作。
总 结
本研究通过PacBio和Hi-C技术构建了染色体水平的灵宝杜鹃基因组,在此基础上通过与其它杜鹃植物及近缘植物进行比较分析,阐述了灵宝杜鹃的基因组进化、WGD事件、与逆境适应性相关基因的扩张与分类,从而为灵宝杜鹃种质资源保护、新品种选育及遗传进化研究提供了新见解。