基因家族投稿期刊sci

转自：

基因组（Denovo sequencing），即基因组从头测序，指在不依赖参考基因组的情况下绘制该物种的全基因组序列图谱，从而获取该物种的全部遗传信息。高连续性基因组的获得，对后续功能基因定位，结构变异检测具有重要的意义。结合近几年的文章我们不难发现，基因组研究主要以下面几种方向为出发点开展： 1）大型/多倍体/超复杂物种基因组破译，技术创新改革； 2）0 Gap基因组/单体型基因组构建，序列优化打磨； 3）未知基因组破译联合多组学分析，经济价值挖掘； 4）品种泛基因组构建解析功能变异，覆盖多样表型； 5）科属水平谱系基因组构建与分析，探索进化功能； 6）多种基因组联合多组学比对剖析，解析性状特征。 ... ...

前5种好理解，第6种方向能做什么呢？其实我们想要了解一个物种，往往单一基因组难以完整解析，例如

等等棘手但是却又热门的研究话题。

接下来我将通过百迈客最近三篇动植物上的成功案例带大家看看，如何通过数个材料基因组结合多组学的手段解析性状特征。

合作单位：中科院南海海洋研究所发表期刊：Science Advances 影响因子：14.131 发表时间：2021.08 研究材料：Denovo:雌性与雄性草海龙（Phyllopteryx taeniolatus）；雌性与雄性绿海龙（Syngnathoides biaculeatus）个体重测序：2只雄性草海龙 RNA-seq：脑、眼、鳃、肝、肠、肌肉、鳍、皮肤和附叶测序方案

Denovo：雌性、雄性草海龙与雄性绿海龙PacBio平台；雌性绿海龙Nanopore平台，雌性、雄性草海龙与雄性绿海龙进行Hi-C测序。三代测序技术对应测序数据如下表所示：个体重测序：~30X PacBio

草海龙最终组装大小为~659 Mb（♂）与 ~663Mb（♀）, contig N50分别为10.0 Mb与12.1 Mb。绿海龙分别组装~637 Mb（♂）与~648 Mb（♀），contig N50分别为18.0Mb与21.0 Mb。4个基因组BUSCO评估显示范围在94.00- 94.40%。并分别在草海龙和绿海龙中确定了31个和33个发生扩张的基因家族。通过19条鳍鱼类全基因组数据集进行系统发育分析，明确草海龙与绿海龙在系统发育地位上属于海龙亚科（Syngnathinae）的姊妹群，并于 27.3 百万年前左右发生分化。

草海龙的头部、颈部、腹部、背部和尾部区域有叶子状的附属物，可以与周围环境相融合，使草海龙以完美拟态隐匿于海草床中。这些结构是该物种的一种适应性进化产物，主要由骨基质和富含胶原纤维的结缔组织组成。

通过转录组学分析，发现其表达基因（如msx,dlx,fgf）主要从皮肤和鳍等器官募集而来，暗示了相关基因对新器官产生和维持的重要作用。而“附叶”与鳍相比缺乏肢体发育特异性的hox基因。草海龙的附叶在捕食者的袭击中经常受到损伤，为了研究相关机制，作者通过转录组分析研究发现在其附叶中炎症和损伤修复相关基因表现出高表达水平，说明这些基因可能与其附叶的快速愈合和再生能力相关。同时草海龙特异性扩张的MHC I基因也在附叶中显著高表达，能为其提供额外的免疫保护。

通过雄性和雌性叶海龙Illumina reads正反比对雄性和雌性的全基因组序列，来确定叶海龙中假定的性染色体和性别基因座。结果显示 Chr4上的一个~47-kb区域仅在雄性中存在，且reads覆盖度为Chr4平均值的一半，该片段经Hi-C互作分析结果支持。

注释及比较分析发现草海龙和绿海龙的性别决定基因均为amhr2的雄性特异性拷贝amhr2y，但两者的基因座不相同。系统发育分析表明，amhr2y起源于它们最近共同祖先的重复事件，而黄鲈amhr2y是从其谱系中的独立重复事件进化而来。研究发现amhr2y比amhr2受到的选择压力更强，其整体结构与amhr2相似。

草海龙与其他海龙科物种一样具有缺乏牙齿的管状吻。研究表明，大部分富含P/Q的分泌型钙结合磷蛋白（SCPP）基因的缺失可能是导致syngnathids无牙的原因。为了验证海龙科中因假基因化丧失功能这一点，作者使用CRISPR-Cas9技术构建了两个斑马鱼scpp5突变系，发现scpp5-/-突变体斑马鱼牙齿的数量减少且颌骨中存在用于附着牙齿的凹坑。

研究结论该研究通过雌雄性海龙基因组的破译，结合重测序分析、转录分析、比较基因组分析等研究揭示了海龙科物种性别决定基因的产生和演化历程，为海洋鱼类的环境适应性进化研究提供了重要理论依据。

合作单位：浙江大学发表期刊：Plant Biotechnology Journal 影响因子：9.801 发表时间：2021.08 研究材料：Denovo：Brassica juncea菜用芥菜T84-66、油用芥菜AU213；个体重测序：12个油菜品种；遗传进化：183份油用与菜用芥菜；测序方案： Denovo：菜用芥菜分别146 Gb Illumina（~150X）+ 251 Gb PacBio（ 200X）+Hi-C( 200X )；油用芥菜147 Gb Illumina（~150X）+205 Gb PacBio（ 200X）+Hi-C( 200X ) 个体重测序：~20X Nanopore 遗传进化与GWAS：~10X illumina

研究内容

在着丝粒附近的异染色质状态中具有相对较低的基因表达模式。

系统地鉴定了T84-66 和AU213的A和B亚基因组中的全基因组单核苷酸多态性(SNP)、插入/缺失(InDels)和存在/缺失变异(PAV)。在T84-66和AU213之间的A和B亚基因组中鉴定了24,768个PAV（> 100 bp），其中3,634个PAV导致6,425个基因的变异。随机选择了几个PAV并使用PCR来确保这些PAV的保真度。其中一些基因组变异位于基因区域内，预计会影响T84-66和AU213作物中涉及生物和非生物胁迫的基因功能。

为了破译芥菜基因组菜用和油用品种之间SVs衍生的功能差异，作者基于Nanopore重测序技术，系统比较了菜用和油用芥菜群体基因组结构变异（structural variation，SV），挖掘到包括1, 354个高可信度的插入、缺失、重复、倒位、易位等变异。其中两个重要的基因位点TGA1和HSP20在ChrA06和ChrB08，可能与B.juncea基因组的菜用与油用品种之间对生物和生物应力的反应的自然变异有关。这些变异研究为菜用芥和油用芥两个典型分化群体的演化提供了基因组变异基础。

使用T84-66作为参考基因组，对183份油用与菜用芥菜进行进化关系分析，并通过SGS-GWAS（scored genomic SNPs based GWAS）基因定位，在A02和A09中发现了两个参与控制芥菜硫苷（GSL）积累变异的关键遗传位，并首次发现A09中的MYB28与B. jucnea中GSL的积累有关。经过进一步研究并同过ONT验证发现，MYB28基因的拷贝数变异（copy number variations，CNVs）是导致芥菜种群中硫苷积累差异的原因，该基因的拷贝数变异在低硫苷芥菜群体中普遍存在。

研究小结该研究将为多倍基因组进化研究和精确基因组选择研究提供重要研究信息，对芥菜风味品质和油脂质量的分子遗传改良具有重要科学和应用价值。

合作单位：华中农业大学发表期刊：Molecular Biology And Evolution 影响因子：16.241 发表时间：2021.05 研究材料：基因组、Hi-C：圆叶棉G. rotundifolium(K2)、亚洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鲜叶片

测序方案 denovo：illumina K2、A2和D5分别108×, 118×, 132×；Nanopore K2、A2和D5分别124×, 131×, 167× Hi-C挂载：6碱基酶HindⅢ；K2、A2和D5分辨率分别为20kb、20kb、10kb Hi-C互作：4碱基酶DpnⅡ；分辨率20 Kb, 50 Kb, 100 Kb

研究内容

利用Nanopore测序技术组装了圆叶棉（ K2 ）基因组，组装大小为2.44Gb(contigN50 = 5.33 Mb)；提升了亚洲棉（ A2 ）和雷蒙德氏棉（ D5 ）的基因组，组装大小分别为1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C挂载率均超过99%，BUSCO结果分别为92.5%, 93.9%,及95.4%。

重复序列注释表明，相对于D5，K2和A2中棉种特异的反转录转座子扩增是造成这三个基因组大小三倍变化的原因,特别是Gypsy和DIRS类型。全长转座子插入时间分析表明K2基因组中转座子插入最为古老，A2基因组有更多新的转座子。

比较基因组分析表明，A2和K2基因组在Chr01与Chr02染色体间存在一个大的易位；K2和D5基因组在Chr13与Chr05染色体间存在一个大的易位。三个棉种在57-71百万年前存在一次共同的全基因组复制事件，并在5.1-5.4百万年前发生物种分化，基因共线性分析表明每个基因组大约有15%特异的基因家族。

通过HiC染色质互作数据揭示三个棉种染色体大小的规律，A2与K2比D5多了约7000个基因，三个基因组中17%的共线性同源基因表现为A/B区室的染色质状态改变，这与活跃的转座子扩增相关。

K2与A2及与D5相比更多的倾向于A向B的转化。K2和A2中有更多的基因处于A compartment，D5中有更多的基因处于B compartment。

大约60%的拓扑结构域（TAD）在三个基因组中发生了重新组织，K2基因组中有更多特异的TAD。基于边界TE覆盖度，边界TE表达以及TE插入时间分析，发现K2不保守的TAD边界存在特异的和较新的转座子（物种分化后爆发的TE）插入。这些结果表明最近在K2和A2基因组中表达的TEs的扩增可能有助于在三个物种分化后形成谱系特异性TAD边界。基于这些结果，作者提出了三个棉种分化过程中，基因组扩张-转座子扩增介导的A/B区室转换和TAD重组的进化模型。

研究小结

本次研究首次公布了棉属中二倍体圆叶棉基因组，并对亚洲棉和雷蒙德氏棉基因组进行了升级，解析了转座子活动驱动的基因组大小进化特征，从转座子扩增和染色质空间结构角度为棉花物种进化提供新的见解，为植物中转座子活动介导的转录调控进化研究提供参考。

很多，举例几个首先是著名的SCI，它并不拒绝基因家族文章的发表；然后是4区的Geome可以相对容易发表

水稻OsMKK基因家族的结构和表达分析OsMKK是水稻MAPK途径中位于中游的一个分裂原蛋白激酶激酶基因家族,主要承载着上游信号的汇聚、逐步向下扩散传递的作用。它们在水稻生长发育和逆境反应中的功能目前还不很清楚。干旱、低温、盐害等非生物逆境是影响水稻产量的重要因素。本文对OsMKK基因家族的结构进行了生物信息学分析,预测了其可能的生物学功能。并以籼稻品种9311为材料,在低温、高温、盐害、H2O2、ABA、JA、SA下胁迫水稻幼苗。测定了水稻苗期在7种处理下生理指标的变化和OsMKK基因家族的表达模式。最后,讨论了它们可能的生物学功能。主要实验结果如下： 1.OsMKK染色体定位、进化树和基因结构分析表明,OsMKK基因家族的8成员位于4条不同染色体上,分为2大类,A、B、C、D 4个亚组。第一大类有3个基因：OsMKK1、OsMKK6、OsMKK3,含有多个内含子和外显子,其调控形式多样。第二个大类包括5个基因：OsMKK4、OsMKK5、OsMKK10-1、OsMKK10-2、OsMKK10-3,仅仅含有一个外显子。OsMKK的sub-domain和motif分析表明,该基因家族都含有11个sub-domain、ATP结合位点,磷酸化位点。除OsMKK10-1, OsMKK10-2和OsMKK10-3外,均含有S/T XXXXX S/T motif. 2.对OsMKK基因家族5’端ATG上游1.0 kb区域启动子顺式作用元件的预测,鉴定了有多个特殊的顺式作用元件。如低温响应元件、热激响应元件、脱水响应元件、ABA响应元件、JA响应元件、防卫反应响应元件。每个基因均含多个不同的顺式作用元件,可能与多个逆境反应相关。 3.7种处理对水稻苗期叶片的生理指标变化结果表明,相对电导率、丙二醛和脯氨酸含量的变化趋势比较吻合。随胁迫时间的延长,相对电导率增大(除ABA处理外)；丙二醛含量都不同程度地增加；脯氨酸含量也呈递增趋势(除JA处理外)。说明水稻幼苗随着胁迫时间的延长,其细胞受胁迫的伤害程度越大。 4.OsMKK基因家族在12℃低温、38℃高温、250 mM盐、10mMH2O2、50μM ABA,50μM JA、1 mM SA胁迫下表达具有明显的诱导特性。12℃低温处理下,OsMKK4在0-12 h表达没有变化,在24 h诱导表达；38℃高温下,OsMKK3在3 h时激活表达,随后下降。OsMKK4、OsMKK5、OsMKK6在6 h表达最强,随后下降。其它基因的表达在6 h时都略有上升；250 mM盐处理下,OsMKK3在1h瞬间诱导表达,表达量达最高值；10 mM H2O2处理下,OsMKK4、OsMKK5、OsMKK10-2在1h内就瞬间诱导表达,表达量达最高,随后下降；50μM ABA处理下,OsMKK4、OsMKK5在1h时诱导表达；50μM JA处理下,OsMKK4诱导表达最强,随着时间增加而增强。其次是OsMKK5,在1 h瞬时表达增加,而后不再增加；1mMSA处理下,OsMKK6在6h内受到诱导表达,表达量达最高值。各种逆境对其它基因表达的影响较小。 5.OsMKK在水稻茎、叶、叶鞘、幼穗的表达有一定差异。OsMKK1在茎中表达低,其他基因在4个组织中均表达。OsMKK10-2在4个组织中表达量均不高,其它基因在4个组织中均有高有低。

基因家族投稿期刊

BZR（BRASSINAZOLE-RESISTANT）家族基因是编码参与油菜素内酯信号转导的植物特异性转录因子，在植物生长中起着至关重要的作用。今天我就给大家带来一篇甜菜中BZR基因家族分析的文章。文章于2019年5月9日在线发表在BMC Plant Biology（影响因子3.93，中科院分区二区）。具体分析内容如下：一、甜菜中 BvBZR 基因的鉴定通过鉴定，共鉴定出6个BvBZR基因： Bv5_cuzi 、 Bv_epwr 、 Bv1_fxre 、 Bv6_nyuw 、 Bv1_qnjn 、 Bv_yfzt 。二、Motif分析和系统发育分析为了阐明BZR家族的进化关系，作者基于来自甜菜、拟南芥、水稻和大白菜的41个BZR家族成员的氨基酸序列构建了系统发育树，并进行了motif分析。三、 BvBZR 基因染色体分布和基因结构分析作者将鉴定的6个 BvBZR 基因定位到了甜菜基因组的5条染色体上，并对基因结构进行了分析。四、 BvBZR 基因的顺势作用原件分析五、不同甜菜品种根茎的生长特征规律统计作者统计了包括主根的生长曲线（根重）、主根的生长速度、主根的含糖量以及主根含糖量的增加速率4个指标。六、与甜菜生长特征相关的基因表达模式和相关性分析七、 BvBZR 基因在E型和Z型根、茎、叶组织中表达模式分析八、 BvBZR 基因对植物激素响应的基因表达模式分析为了研究 BvBZR 基因的表达水平是否受外源植物激素的调节，作者对甜菜根喷洒了IAA、ABA、MeJA、GA3共4种植物激素，并检测了 BvBZR 基因的表达水平。九、 BvBZR 基因的亚细胞定位作者首先使用Wolf PSORT软件对 BvBZR 基因进行亚细胞定位预测，并采用实验手段对预测结果进行了验证。总结到此为止，这篇基因家族类文章的所有分析就完成了，在内容上还是比较常规的，只是在实验方面补充了因的亚细胞定位实验和一些生长指标，并没有复杂的实验操作和分析内容，值得大多数研究者借鉴！更多生物信息课程： 1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读 2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读 3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接： WGCNA-加权基因共表达网络分析 4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读 5. 微生物16S/ITS/18S分析原理及结果解读、 OTU网络图绘制、 cytoscape与网络图绘制课程 6. 生物信息入门到精通必修基础课，学习链接： linux系统使用、 perl入门到精通、 perl语言高级、 R语言画图 7. 医学相关数据挖掘课程，不用做实验也能发文章，学习链接： TCGA-差异基因分析、 GEO芯片数据挖掘、 GSEA富集分析课程、 TCGA临床数据生存分析、 TCGA-转录因子分析、 TCGA-ceRNA调控网络分析 8.其他课程链接：二代测序转录组数据自主分析、 NCBI数据上传、二代测序数据解读。