马铃薯是全球性的重要作物,目前商业种植主要采用的是同源四倍体马铃薯块茎,运输和种植都多有不便。因此如果能使用二倍体马铃薯种子种植将会降低种植成本,便于马铃薯育种。但目前马铃薯基因组进化和物种多样性的研究十分有限。而本文填补了马铃薯泛基因组进化的空白并为马铃薯基因组设计育种提供了新的见解。
作者基于432个马铃薯株系建立起的系统发育树中选取了44个代表性株系,对其进行了Pacbio HiFi测序。并且在这44个株系中又选择了7个株系进行Hi-C测序并组成完整的基因组。
接下来为了构建马铃薯全基因库,作者利用44株马铃薯代表性物种+现有的一个马铃薯参考基因组 S. tuberosum Group Phureja 构建了泛基因组。通过聚类预测基因模型作者发现当马铃薯物种数在40左右的时候, 泛基因组规模(聚类预测基因数量)增大到了一个瓶颈。说明此时泛基因组已经能够反映物种的核心基因情况 。因此作者根据基因簇出现频率将其划分成四类:核心基因(core clusters ,存在于所有45份材料中)、次核心基因(soft-core clusters,存在于42-44份材料中)、边缘基因(shell clusters,存在于2-41个个体中)和特异性基因(accession-specific clusters)。这些泛基因组资源为利用马铃薯生物学和育种中的全段基因库提供了一个起点。
由于马铃薯家族遗传多样性和发育关系还未曾阐明,作者利用三代测序Pacbio从头测序了两个马铃薯的祖先种 Etuberosum ( Solanum etuberosum 和 Solanum palustre )并构建了系统发育树(Fig1a)。
结果非常Amazing!系统发育树关系显示(Fig1a)两个马铃薯的祖先种 Etuberosum ( 橙色块位置)与马铃薯家族的关系要比三个“外群”种 Lycopersicon (绿色快位置)更近, 这和刚刚的假设产生了矛盾 。此外作者分别使用单拷贝基因簇建树以及基因组随机滑窗建树,发现二者大致一致,但也存在相当数量的分歧。 这两点都说明了马铃薯家族进化关系相当复杂,在这里作者推断可能是发生了种间基因渗入 。因此采用了D统计和f4统计检测基因流及基因流动比例。D统计结果显示马铃薯家族 Petota 及其祖先Etuberosum存在明显的基因流动(fig1c),马铃薯基因组上的基因是由Etuberosum流入的。 种间基因流一定程度上解释了马铃薯家族系统发育的混乱。
采用无性繁殖获得的马铃薯容易感染块茎疾病,但实际上马铃薯可能通过扩张抗性基因库抵抗这些疾病。马铃薯的免疫系统进化值得深入研究。 在这里作者开发了新的NLR基因注释方法,其结合NLR-annotator和MAKER2两款软件,前者实现NLR基因的初步预测,后者能够根据现有Renseq数据,采用机器学习方法从头预测NLR基因并进行基因组注释 。最终二者取并集即为NLR基因重注释的结果。以此法作者注释了上述45个马铃薯家族成员一共 57,683个NLR基因。并且发现不同马铃薯种间NLR基因拷贝数差异巨大(Fig2ab)。
与祖先种 Etuberosum (ETB)和番茄基因组相比,马铃薯基因组中含有的NLR基因有了很大程度的扩张。作者将这些NLR基因分成了424个簇,其中161个簇呈现出扩张的迹象。这里面就包含了著名的 马铃薯抗性基因R3a (Fig2c)。
马铃薯块茎储存了大量的营养物质,有助于马铃薯的存活。前人为数不多的研究发现,马铃薯结块基因受到顺式作用元件(cis-regulatory elements,CREs)的调控,而后者在进化上存在规律。顺式作用元件通常以非编码的保守序列(conserved non-coding sequences,CNS)出现,作者因此根据45个马铃薯株系基因组保守性得分计算出149,663个马铃薯特异性CNS。其中存在于内含子位置,可能对结薯产生潜在影响。
为了进一步定位结薯相关基因,作者在块茎中检测到732种表达的基因,在这之中229个基因关联于马铃薯特异性CNS且在45个马铃薯株系中保持了保守性(Fig3a)。前任的研究显示TCP基因家族参与分生组织的发育,而这些基因中仅一个基因()属于TCP家族。关联于此基因的CNS位于启动子上游376bp和157bp(Fig3b),可能调控此TCP的表达。 转录组分析进一步证明了表达于马铃薯的匍匐茎或块茎,而在远亲番茄中却测不到表达(Fig3c),符合番茄到马铃薯谱系的分化特点。
紧接着, 作者为了找到与IT1互作的基因,进行了酵母双杂实验 。筛选得到了SP6A(SELF-PRUNING 6A )基因,控制着薯块维管束运输信号(Fig3f)。SP6A可能与IT1形成复合体调控薯块形成。在马铃薯祖先(ETB)中也有一段SP6A的同源序列 SP6A etb ,但是该序列在ETB中却检测不到表达(Fig3c)。于是作者对IT1及其同源进行了结构分析,结果发现其PEBP域产生了缺失(Fig3g)。 SP6A结构域的缺失导致了马铃薯祖先ETB不能结薯。
高度纯合的自交系对于杂交育种至关重要。因此作者希望调查所研究株系的纯合度以备选可能的杂交材料。此外,由于倒置(inversions)会抑制重组,在杂交的时候会产生连锁阻力,从而阻碍育种。育种需要选择含有目的基因但又不含倒置片段的物种作为供体。因此作者利用20株马铃薯地方种和4株栽培种祖先(ETB)构建了大尺度倒置图谱(Fig4a)。在这之中作者发现与参考基因组相比(DM/PG5068)马铃薯祖先种(PG5068)三号染色体上有一段的基因倒置(Fig4b),与控制块茎胡萝卜素合成的Y位点(Y locus)连锁。二者难以发生重组,重组事件分布图(Fig4c)也证实了这一点: 该inversion所在位置重组事件发生率急剧降低。
说明 农业上如果选择具有黄色块茎肉(胡萝卜素合成多)的个体,可能会同时选择出该倒置,从而导致表型连锁阻力。 借助这里构建的泛基因组倒置图谱,育种家能选择合适的供体或受体株系进行回交。
新颖且内容极其丰富的泛基因组研究。作者从构建马铃薯泛基因组,讨论马铃薯家族和祖先种系统发育关系。从免疫基因扩库和结薯基因上详细研究了马铃薯家族的进化关系。其结薯基因IT1的鉴定方法能结合CNS关联让人耳目一新。生信层面之外作者还进行了基因功能验证,结合CRISPR技术呈现出极为明显的结薯表型,无论是基因鉴定手段还是基因功能本身,都具有学术和应用价值。 关键一作还是个博士生(不是博后或副研),博士的悲喜并不相同,我只觉得自己太菜。
文献阅读仅供参考,如有谬误欢迎各位大佬批评指正哈。