基因家族分析投稿期刊

黑麦（ Secale cereale , 2n = 2x = 14, RR）属于禾本科小麦族黑麦属，虽然与普通小麦（ Triticum aestivum ，Ta；2n=6x=42；AABBDD）和大麦（ Hordeum vulgare ，Hv）有亲缘关系，但黑麦具有独特的农艺性状和基因组特性。黑麦1RS染色体臂携带的抗病基因通过远缘杂交转入小麦基因组，为小麦生产中白粉病和条锈病的防治做出了巨大贡献。此外，黑麦也可以与普通小麦远缘杂交，染色体加倍后，人工合成八倍体小黑麦，具有比黑麦更高的生物量和产量。因此，黑麦是许多国家重要的粮食和饲料作物，也是全球小麦和小黑麦改良的重要遗传资源。

威宁黑麦是我国的栽培黑麦早抽穗优良品种，具有抗白粉病和条锈病的能力。为了解析黑麦优良性状的遗传和分子基础，促进黑麦及相关作物的基因组和育种研究，作者对威宁黑麦进行了基因组测序和分析。

基因组：

基因注释转录组测序：正常或胁迫（冷或干旱）条件下栽培的植物中的叶、茎、根和穗样品，以及在开花10、20、30、40天后收获的发育中的样品, 采用Illumina及Pacbio平台进行RNA-seq及Iso-Seq；

遗传图谱QTL : 295份威宁黑麦×荆州黑麦杂交的F2代样品，采用SLAF-seq进行标记开发；

抽穗基因表达 : 威宁黑麦和荆州黑麦样品，播种后4、7和10天采集叶片样品，每个时间点使用3个生物重复，使用Illumina平台进行测序；

选择进化分析：已发表的101份家养黑麦和野生黑麦品种材料的公共数据，包括81份 S. cereala 、5份 S. vavilovii 、11份 S. strictum 和4份 S. sylvestre 。

流式预估黑麦基因组大小约为7.86 Gb，结合PacBio、Illumina、Hi-C、遗传图谱、BioNano光学图谱等技术进行基因组组装。最终组装 7.74 Gb 基因组（为预估基因组大小的98.47%），scaffold N50 为1.04 Gb，并将93.67%的序列挂载至 7条染色体上（图1）。黑麦中每条染色体基因组大小均在 1G左右（2R、3R、4R、6R、7R（~1Gb）；1R（0.94097 Gb）、5R（0.99891 Gb) ），比乌拉尔图小麦（ T. urartu ；Tu；AA型）、节节麦（ Aegilops tauschii ；Aet；DD型）、野生二粒小麦（ T. turgidum ssp. dicoccoides ；WEW；AABB型）、普通小麦（Ta）和大麦（Hv）等复杂的麦类中的单条染色体基因组均要大。超大的基因组及染色体，对黑麦基因组组装，特别是染色体挂载带来了巨大的挑战。

将组装结果与两个冬季黑麦品种（Lo7和Lo225）构建的染色体连锁图相比，威宁黑麦1R至7R物理图具有较高的一致性。在先前报道的Lo7的pyro-sequencing reads中97.45%可以定位到威宁基因组，平均序列同源性为97.71%，平均序列覆盖率为97.27%。

LAI值为 18.42 ，远高于先前发表的小麦和大麦基因组的LAI值。BUSCO评估结果为 96.74% 。并注释了 86,991 个蛋白编码基因。尽管黑麦基因组非常复杂，通过以上评估结果说明，本次研究构建了一个高质量的威宁黑麦基因组。

威宁黑麦基因组中 90.31% 被注释为转座子（TE），共包含537个家族的2,671,941个成员，这些TE的含量明显比普通小麦 (84.70%), 乌拉尔图小麦 (81.42%), 节节麦 (84.40%), 野生二粒小麦 (82.20%)以及大麦 (80.80%)更高。其中长末端重复反转录转座子（ LTR-RTs ）是主要的转座子，在注释的TEs中占 84.49% 。

与乌拉尔图小麦、节节麦及大麦的LTR-RTs进行比较发现：（1） Gypsy 是威宁黑麦基因组扩张的主要原因之一(Fig. 2a)，并且有3个LTR-RT家族（ Daniela , Sumaya , Sumana ）在威宁黑麦中特异扩张，其中 Daniela 的占比最高 (Fig. 2b)。（2）威宁黑麦中完整的LTR-RTs插入时间存在独特的双峰分布(Fig. 2c)，最近一个扩增峰出现在50万年前，另一个出现在1.7 百万年（MYA）左右（与大麦相同） (Fig. 2c)。（3）这种双峰分布模式由 Gypsy RTs 的扩增主导 (Fig. 2d)。

通过比较威宁黑麦、乌拉尔图小麦、节节麦、普通小麦（亚基因组TaA、TaB和TaD）、大麦、水稻Os（ Oryza sativa ssp. japonica）、二穗短柄草Bd（ Brachypodium distachyon ）、玉米Zm（ Zea mays ）、高粱Sb（ Sorghum bicolor ）、谷子Si（ Setaria italica ）基因组，共找到2517个单拷贝同源基因。通过对单拷贝基因组构建进化树和计算分化时间发现，在大麦和小麦分化后（15MYA）黑麦和二倍体小麦发生了分化（9.6 MYA） (Fig. 3a)。

作者以水稻为祖先参考基因组，研究了威宁黑麦的染色体进化。威宁黑麦与水稻共鉴定出23个大的共线性区，包含10949对同源基因，可推断出祖先染色体片段在1R到7R之间的排列（图3b）：（1）3R来源于一条古老的染色体AGK1/Os1，该染色体的一段易位到6RL；（2）1R和2R分别由两条祖先染色体组成，1R与AGK10/Os10嵌套插入AGK5/Os5有关，2R与AGK7/Os7嵌套插入AGK4/Os4有关；（3）4R, 5R, 6R,7R是通过复杂易位从至少三条祖先染色体上获得的（图3b）。

在威宁黑麦基因组与普通小麦3个亚基因组的比较中，1R、2R和3R分别与小麦1、2和3组染色体完全共线。在4R中发现与4A/4B/4D、7A/7B/7D或6A/6B/6D部分共线性的三个区域。5R与5A完全共线，与5B、5D部分共线是由于易位的4B或4D片段在5BL或5DL的长臂融合（图3c）。在6R中，观察到3个区域与6A/6B/6D、3A/3B/3D或7A/7B/7D部分共线。这些数据将有助于黑麦在禾本科比较基因组学研究以及黑麦与普通小麦杂交研究中的应用。

作者在威宁黑麦中检测到4217个单拷贝基因、23753个分散重复基因 (DDGs) 、6659个近端重复基因 (PDGs) 、7077个串联重复基因(TDGs) 和1866个片段重复基因。转座重复基因（TrDGs）由TE活性诱导的，它们是DDGs的主要组成部分。作者以大麦为参考，在威宁黑麦中鉴定出10357个TrDG，远远大于以相同方式计算的乌拉尔图小麦（7145）和节节麦（7351）中TrDG的数量（图4b）。威宁黑麦所特有的TrDG（5926）也比乌拉尔图小麦（3513）和节节麦（3327）所特有的TrDG更多（图4b）。

接下来作者研究了黑麦淀粉生物合成相关基因（SBRGs）中的基因复制。研究发现这些重复类型在黑麦淀粉生物合成相关基因（SBRGs）中普遍存在，并且不同的 SBRG 的复制基因之间往往表现出表达差异，说明不同类型的基因复制可以丰富黑麦基因在重要生物过程中的遗传多样性（图4c），这些黑麦 SBRGs 的新变化可能为调控植物淀粉生物合成和性质提供新的酶活性，因此解析全套黑麦 SBRGs 有利于提高黑麦的产量潜力和营养品质。

与小麦和大麦相似，黑麦在胚乳组织中积累了丰富的储存蛋白SSPs。作者利用威宁基因组组装技术对黑麦SSP基因座进行了分析。

在威宁黑麦中未发现小麦低分子量麦谷蛋白亚基（LMW-GSs）或大麦B-hordein的同源序列（图5b），表明在黑麦进化过程中携带这些基因的染色体片段缺失，这可能是1BL1RS易位系小麦品种中，品质受影响的主要原因。

并且在威宁黑麦基因组中未发现α-醇溶蛋白基因，这说明小麦及其近缘种的α-醇溶蛋白（α-gliadin）基因可能在小麦和黑麦分化之后进化产生的。

这些SSP分析结果阐明了黑麦碱基因座的结构和组成，这将有助于进一步研究黑麦、小黑麦和小麦的加工和营养品质。

作者利用iTAK预测了威宁黑麦和其他8种禾本科植物的TF基因，在注释的65个转录因子基因家族中，威宁黑麦有28个家族成员增加，其中AP2/ERF TF基因家族成员增加幅度较大。威宁黑麦的抗病相关基因（DRA ）数量（1989）比乌拉尔图小麦（1621）、节节麦（1758）、大麦（1508）、二穗短柄草（1178）、水稻（1575）以及普通小麦的A（1836）、B（1728）和D（1888）亚基因组多。

鉴于AP2/ERF TFs和DRA基因在植物对非生物逆境和生物逆境的反应中的重要作用，上述发现可能有助于黑麦和相关作物的有效遗传研究和分子改良。

在长日照条件下，威宁黑麦比荆州黑麦提前抽穗10-12天（图6a），这与威宁黑麦茎尖分生组织发育更快有关（图6b）。在威宁黑麦基因组中，注释到在长日照条件下高表达的两个开花位点（FT）基因 ScFT1 （ScWN4R01G446100）和 ScFT2 （ScWN3R01G192500）。播种后7天和10天， ScFT1 和 ScFT2 在威宁黑麦中的表达水平显著高于荆州黑麦（图6c），且ScFT蛋白在黑麦中积累到相对较高水平，而荆州黑麦中几乎没有（图6d）。检测到的ScFT蛋白的大小（~29 kDa）比预测出的ScFT1和ScFT2的分子量大（~19 kDa）（图6d），表明ScFT蛋白具有潜在的翻译后修饰。用高效检测磷蛋白的磷酸标记SDS-PAGE分析表明，威宁黑麦中ScFT确实发生了翻译后磷酸化修饰。

作者突变了ScFT2磷酸化相关的两个残基（S76和T132），并为ScFT2构建了一系列去磷模拟位点（S76A、T132A和S76A/T132A）和磷模拟位点（S76D、T132D和S76D/T132D）。当使用马铃薯X病毒载体在烟草中进行外源表达时，ScFT2和去磷双突变体ScFT2 S76A/T132A 相对于游离GFP（对照）和其他ScFT2突变体，表现出持续促进烟草生长（图6e）。与GFP相比，ScFT2和三个去磷突变体（ScFT2 S76A 、ScFT2 T132A 及ScFT2 S76A/T132A ）的异位表达提高了开花植株的百分比，ScFT2 S76A/T132A 尤其明显，但在表达三个拟磷突变体（ScFT2 S76D , ScFT2 T132D , or ScFT2 S76D/T132D ）中没有观察到这种促进作用（图6f）。免疫印迹分析表明，ScFT2、ScFT2 S76A 、ScFT2 T132A 和ScFT2 S76A/T132A 在烟草植株中的积累量相当高，但ScFT2 S76D 、ScFT2 T132D 和ScFT2 S76D/T132D 在烟草植株中的积累量却很低（图6g）。因此，保守的S76和T132残基的改变影响了ScFT2控制植物开花的功能，这与ScFT2蛋白稳定性的改变有关。本研究首次发现FT磷酸化对开花时间控制的影响，为更全面地探索FT蛋白控制植物开花的分子和生化机制提供了新的途径。

作者进一步研究了光周期 Photoperiod （ Ppd ）基因的表达，该基因在长日照条件下正调控FT的表达。在威宁和荆州黑麦的转录组分析中发现了一个表达 Ppd 的基因 ScPpd1 （ScWN2R01G043000）。该基因在威宁黑麦内的表达非常早，在播种2 天后达到表达高峰；而荆州黑麦在播种4天后才达到高峰（图6h）。根据 ScPpd1 对黑麦抽穗期的调控作用，研究者利用威宁×荆州F2代群体，检测到与前期研究一致的三个主效抽穗期QTL（ Hd2R、Hd5R 和 Hd6R ）。

对驯化基因的分析可以促进对作物性状的理解和改良，但在黑麦中这类基因的分子分析方面进展甚微。作者通过全基因组选择清除分析，利用在栽培黑麦和瓦维洛夫黑麦（ S. vavilovii ）之间鉴定的123647个SNPs，挖掘黑麦驯化相关染色体区域和基因座。DRI、 F ST 、XP-CLR分析中，共同识别到11个选择信号（图7a-c）。通过与水稻和大麦的共线性比较，发现了一些可能的选择清除位点，包括已在水稻或大麦中已被功能分析的 ScBC1 、 ScBtr 、 ScGW2 、 ScMOC1 、 ScID1 和 ScWx 的同源基因（图7a-c）。

检测到的 ScID1 基因座包含一对具有相同编码序列的 ScID1 同源序列（ScWN6R01G057200和ScWN6R01G057300，下称 ScID1.1 和 ScID1.2 ）（图7d）。ScID1.1和ScID1.2蛋白与玉米ID1（63.19%）和水稻RID1（65.34%）具有很强的同源性，这两个蛋白在玉米和水稻中都被发现调控着从营养体向花发育的转换。 ScID1.1 和 ScID1.2 在威宁黑麦幼叶中的表达水平高于荆州黑麦（图7e）。在威宁×荆州分离的F2群体中， ScID1 JZ/JZ 纯合植株的平均抽穗期显著晚于 ScID1 JZ/WN 或 ScID1 WN/WN 个体（图7f），这与荆州黑麦相对于威宁黑麦的晚花表型相一致（图6a）。以上结果表明 ScID1 可能参与了抽穗期的调控，并可能通过黑麦驯化进行选择，使作物成熟度得到适当的调整，以更好地适应生长环境。

总结

本研究对我国栽培的优良品种威宁黑麦进行了基因组测序，基因组组装大小为7.74 Gb，其中93.67%被挂载到7条染色体上，重复序列占总基因组的90.31%。并基于高质量基因组揭示了全基因组基因复制及其对淀粉生物合成基因的影响，解析了复杂储存蛋白基因座位点、早抽穗性状的基因表达特征以及黑麦中与驯化相关的染色体区域和基因座。本次研究结果对黑麦的基因组特性及其农艺性状调控基因有了新的认识，获得了对进一步研究黑麦驯化遗传基础可能有用的染色体区域和基因座。威宁黑麦基因组组装对于破解黑麦基因组生物学，深化比较谷类基因组学研究，加速黑麦及相关谷类作物的遗传改良具有重要价值。

A high-quality genome assembly highlights rye genomic characteristics and agronomically important genes

很多，举例几个首先是著名的SCI，它并不拒绝基因家族文章的发表；然后是4区的Geome可以相对容易发表

2022年1月19日，广西农科院经济作物所严华兵团队联合菲沙基因在园艺领域权威期刊 Horticulture Research （IF=6.79）上发表了题为“ 《Chromosomal-level genome and multi-omics dataset of Pueraria lobata var. thomsonii provide new insights into legume family and the isoflavone and puerarin biosynthesis pathways》 ”的研究论文，该研究通过PacBio和Hi-C测序构建了粉葛高质量的染色体水平基因组，解析了粉葛的基因组特征，随后利用包括基因组、转录组、代谢组在内的多组学技术深入解析了粉葛重要次生代谢物的生物合成机制，从而为粉葛的资源利用、遗传育种等研究提供了新见解。

鉴于粉葛杂合度较高，研究者选用了PacBio和Hi-C测序，构建的粉葛基因组大小为 1.38Gb ， Contig N50=598 kb ，并将99.3%的序列锚定到 11 条染色体上，BUSCO评估基因组完整性为 92.9% 。通过注释，共获得了 45,270 个蛋白编码基因，其中94.4%的基因可以得到功能注释，基因组中重复序列占比为 62.7% 。

将粉葛与16个近缘物种（包含5个豆科植物）进行比较基因组分析，结果表明：

通过对高葛根素ZG-19和低葛根素ZG-39进行转录组和代谢组分析，研究者检测到了614种225种差异代谢物（DMs），1814个差异表达基因（DEG），DMs和DEG的丰富功能类别重叠，这说明它们都是与类黄酮、异黄酮和ABC转运相关的基因或代谢物。

进一步分析代谢物与基因表达的相关系数，结果表明代谢物和基因对在样本中高度相关，60%的显著相关性涉及上调的代谢物和下调或不变的基因，在15%的显著相关性中，代谢物和基因表达的变化方向相同。

此外，研究者在异黄酮生物合成途径中发现了大量的DMs和DEG。这充分解析了粉葛中异黄酮的生物合成途径。

通过同源基因搜索，研究者发现编码葛根素合成途径中关键酶的9个基因家族在粉葛中都有所扩张；通过分析糖基转移酶家族中催化糖基化修饰的基因，共鉴定出104个GT基因，有13个基因与8-C-葡萄糖基转移酶（8-C-GT）同源，其中6个与先前研究的催化大豆苷元C-糖基化为葛根素的PIUGT43基因同源。

编码大豆异黄酮合酶（IFS）的基因（CHR11G3854.1）催化着葛根素合成的中间代谢物大豆苷元的合成，被鉴定为与葛根素的合成途径高度相关。总之，上述分析初步解析了粉葛中葛根素的生物合成途径。

综上，该研究通过构建高质量的粉葛基因组解析了粉葛基因组的进化特征；通过多组学分析深入解析了粉葛中重要次生代谢物异黄酮、葛根素等生物合成途径，从而为粉葛的资源利用、遗传育种等研究提供了新见解。

广西农业科学院经济作物研究所严华兵研究员团队近些年与华中农业大学、菲沙基因、上海大学、广西中医药大学、广西医科大学等单位持续开展联合攻关，在全球葛根资源收集与鉴定评价、葛属资源分类、葛根基因组与分子生物学、粉葛和野葛品种选育、健康种苗生产、高产高效栽培等方面取得了一系列的成果。团队到目前为止，已广泛收集全球葛属种质资源419份，包括野葛、粉葛、葛麻姆、大花葛、泰葛、苦葛、红葛、须弥葛、食用葛等；通过开发葛SSR分子标记，构建了广西葛核心种质库；通过广泛靶向代谢组解析葛属葛种野葛、粉葛和葛麻姆等3个变种块根中影响食用品质和药用品质的代谢差异；结合表型鉴定通过叶绿体基因组研究，揭示了葛及其近缘种之间的系统发育关系；挖掘了调控葛根素合成代谢相关的结构基因和转录因子，并正在开展相关基因功能验证工作；选育出适合开发葛花茶、高葛根素粉葛、无渣粉葛、药用野葛等系列葛根新品种，并逐步建立配套种苗繁育和高效栽培技术。以上研究相关成果先后发表在Horticulture Research、Frontier in Plant Science、Molecules、植物遗传资源学报、植物生理学报等期刊，相关研究先后得到了国家自然科学基金委、广西科技厅等部门项目的资助。粉葛基因组文章的发表将进一步推动全世界葛属植物的进化与分类研究，促进我国葛根产业的科技进步，发挥基础研究源头供给作用以进一步推动广西地方特色优势粉葛产业的高质量发展。

说到葛根大家一定不陌生，野葛在美国开始被用作生态治理后来泛滥成灾被列为入侵生物，泰国葛根产业及其健康功效风靡全球。最早关于葛的文献记载出现在周代，《神农本草经》记载“(葛根)主消渴，身大热，呕吐，诸痹，起阴气，解诸毒”。葛根具有解肌退热，生津止渴，透疹，升阳止泻，通经活络，解酒毒等。现代药理研究表明，葛根在改善心血管系统、抗氧化、降血糖、解热、抗炎、解酒护肝、神经保护、抗骨质疏松和雌激素样作用等方面具有较好的药理活性。

粉葛为豆科葛属植物，为药食同源两用植物，素有“亚洲人参”、“南葛北参”的美誉，广泛种植在广西、广东、江西、湖南、湖北等地，其中广西是粉葛主要种植产区，种植面积全国第一！其中梧州藤县和平镇是中国著名的“葛根之乡”，藤县葛色天香和平粉葛产业（核心）示范区被评为广西现代特色农业(核心)四星级示范区。当前广西粉葛产业发展仍然面临很多亟待解决的问题，粉葛基因组的解析将为粉葛产业高质量发展提供科技支撑。

转自：

基因家族分析投稿期刊快

现在做转录组测序，看看差异基因，做做富集分析，再讨论下差异基因功能与自己研究性状或处理之间的关系，最后加简单的qPCR验证，这样的数据发SCI影响因子越来越低了。必须增加新的分析内容才能有所突破。今天给大家介绍一个能给文章增色的分析内容--基因共表达网络分析（WGCNA），该分析对样品数有一定要求，建议不少于15个，不过现在测序便宜了，达到这个数量已经不是难事了。下面就给大家介绍两篇利用WGCNA分析基因共表达网络来提升文章档次。文章1：题目： Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis 期刊： Journal of Experimental Botany IF： 5.3 性状：大豆籽粒大小实验材料大豆籽粒的大小是一个非常重要的农艺性状，直接关系到大豆产量，找到决定大豆籽粒大小的关键调控基因对后续的分子育种具有重要意义，因此作者，选取了两个大豆品种做转录组分析，分别是：大籽粒Wandou 28 (V1)，小籽粒Peixian Layanghuang (V2)，取样时期为三个时期：seed set (S1), seed growth (S2), and early seed maturation (S3)，其中前两个时期的取样部位分别为：Seed pod with whole seed（S1），Whole seed（S2），S3时期取了两个部位分别为：Seed coat（S3-1），Seed cotyledon（S3-2），两个品种每个样品三个生物学重复共24个样品。下图为种子发育不同时期照片以及籽粒大小差异统计结果：转录组分析结果：对转录组分析结果中每个基因做表达量分析，计算每个基因的表达量FPKM，如果基因的表达量，也就是FPKM值<0.5，认为基因无表达，去除这部分基因。然后，统计每个时期不同品种基因表达量高低的分布图，大约一半的基因处于低表达水平0.5<=FPKM<=5（下图A）；pca分析发现样品按照不同发育时期聚类在一起，而不是按照不同品种聚类，说明发育时期是决定基因表达谱的关键因素，而性状的不同引起的转录表达差异较小（下图B），下图C展示的为不同品种，不同发育时期之间表达基因的韦恩图，在不同的发育时期都表达的基因还是占绝大多数：差异基因分析：差异基因分析，下图A按相同发育时期，不同的品种之间差异比较，下图B为不同发育时期之间的差异比较，红色数字代表上调差异基因数量，黑色代表下调的差异基因数量：差异基因功能注释分析，主要针对决定籽粒大小的差异基因的比较，也就是上图A中的差异基因进行功能分析，挑出一些代表基因，看一下他的功能和表达量，例如，V1S1 vs V2S1差异比较当中，共找到973个差异基因，其中489个基因上调，484个基因下调，上调的代表基因的功能及表达量表格如下图所示，其中有转录因子，植物荷尔蒙（生长素等），脂肪酸代谢，蛋白激酶活性，类黄酮生物合成等功能相关的基因，总之挑选与种子果实等发育生长相关的基因来展示，其他还有好几个表格，也是关于上图A中不同时期的上调下调基因的功能注释表格，展示类似，我这里就不详细说明了，感兴趣的可以查看原文：不同发育时期差异比较：不同的发育时期差异基因比较，分别绘制每个发育时期高表达的基因的热图，差异基因很多，作者挑选的都是和发育相关，或者和重要农艺性状相关的差异基因做热图，例如转录因子相关的基因，荷尔蒙相关的，脂肪酸代谢，淀粉糖代谢等相关的基因。WGCNA分析找到调控籽粒大小的关键hub基因：首先对所有样品所有基因的表达量矩阵进行过滤，删除表达量低的基因（FPKM<0.05），一共有7359个基因用于基因共表达网络构建，总共分析得到12个共表达基因模块下图A（聚类树每一个枝代表一个基因，下面不同的颜色划分代表基因所处不同的模块），其中有4个模块和种子大小相关下图B，例如，lightyellow模块，所有的V1的不同时期的样品与这个模块高度相关，再例如green模块，有793个基因，不管是V1样品，还是V2样品，这个模块都与S1相关等等。 4个关键模块基因共表达网络构建发现hub基因：导出WGCNA共表达网络分析结果，绘制模块当中基因的表达量热图和网络图，左边热图从上到下分别代表：green module（A），darkturquoise module（C），black module（E），lightyellow module（G），右边网络图分别对应共表达网络，其中红颜色标记的为连通性较高的hub基因。通过研究这些hub基因的功能发现：这些网络中的关键hub基因，包括MYB家族转录因子，荷尔蒙（ABA，CK，BA）响应因子，细胞色素P450，BR信号激酶等等，都可能与籽粒的大小相关。文章2：题目： Global transcriptome and co-expression network analyses reveal cultivar-specific molecular signatures associated with seed development and seed size/weight determination in chickpea analysis 期刊： The Plant Journal IF： 5.7 性状：鹰嘴豆籽粒大小实验材料与方法这篇文章与上一篇文章思路几乎一致，只是研究的物种变成了鹰嘴豆。同样的，也是选取了两个籽粒大小差异明显的栽培品种：Himchana 1 (small-seeded) and JGK 3 (large-seeded)，取样时期为每个样品7个时期S1-S7，分别为授粉后5, 9, 12, 19, 25, 30 and 40 天（day after pollination DAP），还测了一下叶片的转录组，并取3个生物学重复，共48个样品。不同发育时期和种子重量差异结果如下：转录组测序结果：利用转录组测序所有基因以及所有样品的表达矩阵做样品间的相关性分析和PCA聚类分析，从中可以发现，相同的发育状态或者组织聚类在一起，说明他们之间具有较强的相关性。差异基因比较分析：作者主要比较了相同发育状态不同品种之间的转录组差异比较，差异基因的上下调数量和其中转录因子的数量图a，另外还统计差异基因中不同类型转录因子的数量展示图b，图c为不同时期差异基因的富集结果，颜色越深说明在该功能上越富集，最后S3时期差异基因在mapman中的Metabolic pathways做了富集分析，可以将差异基因的表达量变化情况展示在通路图中。基因共表达网络分析首先作者将不同的样品按籽粒大小不同品种分开，分别用WGCNA做共表达网络分析，其中在Himchana 1样品中共找到27个模块(a)，在JGK 3样品中找到21个模块(b)如下图所示：模块与样品之间相关性分析，从而发现不同发育时期的特有的基因模块，这部分也是分开做，图中颜色越红的方框对应的模块和样品具有较高的相关性，左边一半为Himchana 1中模块与发育时期相关图，右边一半为JGK3模块与发育时期相关结果，然后得到每个样品中每个时期对应的最相关的模块,(如下图)：结合上一步的分析结果，再来分析两个品种各自得到的模块之间的相关性，理论上讲，虽然品种不同但是各自品种相同发育时期的对应的特有模块应该具有较高的相关性，例如，在JGK 3样品中左下角黑色模块与S6发育时期相关，通过相关性分析，这个模块与Himchana 1中的darkorange相关，正好呢darkorange模块在Himchana 1 中也与S6相关（下图中红紫色方框）；同样的道理其他很多模块都有这样的相关性（下图中红色方框），但是在Himchana 1 中有个orange模块不与JGK 3中任何一个模块相关，作者推断这个特殊的模块很可能与籽粒大小相关，当然还有其他几个模块也有类似的现象。作者进一步研究这些模块中基因表达情况发现里面很多基因的表达量（在S3 和 S5时期）在不同的品种中具有相反的表达，之后作者进一步研究这些模块里面基因的相关功能等等：总结：上述两篇文章都是植物当中普通的转录组文章，由于添加了WGCNA分析从另一个角度分析与性状相关的基因，文章的档次提升不少。想得到WGCNA的分析技能吗，点击《 WGCNA视频教学视频》即可观看：手把手教学包你学会。更多生物信息课程： 1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读 2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读 3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接： WGCNA-加权基因共表达网络分析 4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读 5. 微生物16S/ITS/18S分析原理及结果解读、 OTU网络图绘制、 cytoscape与网络图绘制课程 6. 生物信息入门到精通必修基础课，学习链接： linux系统使用、 perl入门到精通、 perl语言高级、 R语言画图 7. 医学相关数据挖掘课程，不用做实验也能发文章，学习链接： TCGA-差异基因分析、 GEO芯片数据挖掘、 GSEA富集分析课程、 TCGA临床数据生存分析、 TCGA-转录因子分析、 TCGA-ceRNA调控网络分析 8.其他课程链接：二代测序转录组数据自主分析、 NCBI数据上传、二代测序数据解读。

在微生物多样性分析的报告中主要包括五个部分：Alpha多样性分析、Beta多样性分析、物种组成分析、进化关系分析、差异分析，其中Alpha多样性分析是生态学中生物多样性的一个重要的组成部分，也是比较基础的一部分。 Alpha多样性是指一个特定区域或生态系统内的多样性，是反映丰富度和均匀度的综合指标。Alpha多样性主要与两个因素有关：一是种类数目，即丰富度；二是多样性，群落中个体分配上的均匀性。群落丰富度（Community richness）的指数主要包括Chao1指数和ACE指数。群落多样性（Community diversity）的指数，包括Shannon指数和Simpson指数。另外，还有测序深度指数Observed spieces 代表OTUs的直观数量统计, Good’s coverage 指计算加入丰度为1 的OTUs数目，加入低丰度影响。 Alpha多样性各指数的意义 Chao1：是用chao1 算法估计群落中含OTU 数目的指数，chao1 在生态学中常用来估计物种总数，由Chao (1984) 最早提出。Chao1值越大代表物种总数越多。Schao1=Sobs+n1(n1-1)/2(n2+1)，其中Schao1为估计的OTU数，Sobs为观测到的OTU数，n1为只有一条序列的OTU数目，n2为只有两条序列的OTU数目。Chao1指数越大，表明群落的丰富度越高。 Ace：是用来估计群落中含有OTU 数目的指数，同样由Chao提出(Chao and Yang, 1993)，是生态学中估计物种总数的常用指数之一。默认将序列量10以下的OTU都计算在内，从而估计群落中实际存在的物种数。ACE指数越大，表明群落的丰富度越高。 Shannon：（Shannon, 1948a, b）综合考虑了群落的丰富度和均匀度。Shannon指数值越高，表明群落的多样性越高。 Simpson：用来估算样品中微生物的多样性指数之一，由Edward Hugh Simpson ( 1949) 提出，在生态学中常用来定量的描述一个区域的生物多样性。Simpson 指数值越大，说明群落多样性越低。辛普森多样性指数=1-随机取样的两个个体属于不同种的概率。 alpha多样性指数具体描述如下：计算菌群丰度（Community richness）的指数有: Chao - the Chao1 estimator ( ); ACE - the ACE estimator ( ); 计算菌群多样性（Community diversity）的指数有: Shannon - the Shannon index ( ); Simpson - the Simpson index ( ); 测序深度指数有: Coverage - the Good’s coverage ( ) alpha多样性与丰度展示稀释曲线微生物多样性分析中需要验证测序数据量是否足以反映样品中的物种多样性，稀释曲线（丰富度曲线）可以用来检验这一指标，并间接反映样品中物种的丰富程度。具体方法为:利用已测得16S rDNA序列中已知的各种OTU的相对比例，来计算抽取n个（n小于测得reads序列总数）reads时出现OTU数量的期望值，然后根据一组n值（一般为一组小于总序列数的等差数列）与其相对应的OTU数量的期望值做出曲线来。当曲线趋于平缓或者达到平台期时也就可以认为测序深度已经基本覆盖到样品中所有的物种；反之，则表示样品中物种多样性较高，还存在较多未被测序检测到的物种。注：横坐标代表随机抽取的序列数量；纵坐标代表观测到的OTU数量。样本曲线的延伸终点的横坐标位置为该样本的测序数量，如果曲线趋于平坦表明测序已趋于饱和，增加测序数据无法再找到更多的OTU；反之表明不饱和，增加数据量可以发现更多OTU。Shannon-Winner曲线 Shannon-Wiener 曲线，是利用shannon指数来进行绘制的，反映样品中微生物多样性的指数，利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线，以此反映各样本在不同测序数量时的微生物多样性。当曲线趋向平坦时，说明测序数据量足够大，可以反映样品中绝大多数的微生物物种信息。样本曲线的延伸终点的横坐标位置为该样本的测序数量，如果曲线趋于平坦表明测序已趋于饱和，增加测序数据无法再找到更多的OTU；反之表明不饱和，增加数据量可以发现更多OTU。其中曲线的最高点也就是该样本的Shannon指数，指数越高表明样品的物种多样性越高。注：与上图一样，横坐标代表随机抽取的序列数量；纵坐标代表的是反映物种多样性的Shannon指数。Rank-Abundance曲线 Rank-Abundance曲线用于同时解释样品多样性的两个方面，即样品所含物种的丰富程度和均匀程度。物种的丰富程度由曲线在横轴上的长度来反映，曲线越宽，表示物种的组成越丰富；物种组成的均匀程度由曲线的形状来反映，曲线越平坦，表示物种组成的均匀程度越高。注：横坐标代表物种排序的数量；纵坐标代表观测到的相对丰度。样本曲线的延伸终点的横坐标位置为该样本的物种数量，如果曲线越平滑下降表明样本的物种多样性越高，而曲线快速陡然下降表明样本中的优势菌群所占比例很高，多样性较低。这部分内容就讲到这里，后期我们会介绍微生物多样性beta多样性分析，研究微生物的同学请保持关注哦。更多可观看《微生物多样性分析原理视频课程》参考文献 [1] Shannon, C.E. (1948a). A mathematical theory of communication. The Bell System Technical Journal 27, 379-423. [2] Shannon, C.E. (1948b). A mathematical theory of communication. The Bell System Technical Journal 27, 623-656. [3] Simpson, E.H. (1949). Measurement of Diversity. Nature 163, 688. [4] Chao, A., and Yang, M.C.K. (1993). Stopping rules and estimation for recapture debugging with unequal failure rates. Biometrika 80, 193-201. [5] Chao, A. (1984). Nonparametric Estimation of the Number of Classes in a Population. Scandinavian Journal of Statistics 11, 265-270. 更多生物信息课程： 1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读 2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读 3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接： WGCNA-加权基因共表达网络分析 4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读 5. 微生物16S/ITS/18S分析原理及结果解读、 OTU网络图绘制、 cytoscape与网络图绘制课程 6. 生物信息入门到精通必修基础课，学习链接： linux系统使用、 perl入门到精通、 perl语言高级、 R语言画图 7. 医学相关数据挖掘课程，不用做实验也能发文章，学习链接： TCGA-差异基因分析、 GEO芯片数据挖掘、 GSEA富集分析课程、 TCGA临床数据生存分析、 TCGA-转录因子分析、 TCGA-ceRNA调控网络分析 8.其他课程链接：二代测序转录组数据自主分析、 NCBI数据上传、二代测序数据解读。

转录组是一类让人既爱又恨的项目，实验门槛低，却是文章泛滥的重灾区，总有人问我，现在转录组还能发文章吗？下面我就借一篇2020年5月4日发表在BMC Genomics上题为：Transcriptome analysis reveals rapid defence responses in wheat induced by phytotoxic aphid Schizaphis graminum feeding 的文章，详细地论述下2020年转录组文章到底有多难发？怎么发？下面我们先看下这篇文章具体内容：实验简介：文章研究的是小麦幼苗在麦二叉蚜采食后的快速防卫反应，分别于采食2、6、12、24、48 h后取幼苗叶片（3次生物学重复），进行转录组测序、叶绿素测定以及H2O2 积累测定以及NADPH抑制剂处理进一步探究小麦在咬食后氧迸发防御机制。实验结果： 1. 麦二叉蚜采食后小麦转录组分析这部分结果展示比较套路，主要是通过PCA分析看了下样品相关性及处理效应，介绍了一下差异基因总体情况。如下图：2. 差异基因GO分析作者按上调/下调基因集分别进行GO注释，并按时间点分别论述上调/下调基因集富集情况，如下图：3. 麦二叉蚜采食后小麦叶片叶绿素含量变化从差异基因GO分析可以看出，蚜虫采食可以负向调控小麦的光合作用过程、光捕获和光系统相关基因，所以作者又测定了采食后小麦叶片叶绿素含量变化，如下图：4. 麦二叉蚜采食后小麦叶片中水杨酸、茉莉酸相关防御途径的基因表达参与SA生物合成的苯丙氨酸解氨酶(PAL)基因在不同时间点均显著上调，但表达水平随采食时间的增加而逐渐降低；茉莉酸代谢途径中三种脂氧合酶(LOX)基因均显著上调；受MAPKs调控的WRKY转录因子也显示上调，如下图：5. 二叉蚜采食后小麦叶片中过氧化氢(H2O2)积累和抗氧化酶活性的变化蚜虫采食明显上调活性氧清除基因的表达，进一步通过3,3 ' -二氨基联苯胺(DAB)对小麦小麦叶片进行细胞学染色，采食2h后就出现H2O2积累，并且随采食时间的延长，斑点数量和大小逐渐增加，如下图：6. NADPH氧化酶抑制对小麦叶片H2O2积累和防御反应的影响 NADPH氧化酶抑制剂二苯碘铵(DPI)不仅能明显抑制由采食引起的氧迸发，并且对小麦叶片防御应答基因表达水平也有明显的下调作用。以上就是该篇文章全部结果，回头来看，这个实验设计并不复杂，内容也不是过多，为啥人家能发表而你却被拒稿呢？要知道，就这个2区3.5分影响因子的BMC Genomics ，也是很多人渴望而不可得的存在。 2020年，转录组类文章到底有多难发？从这篇文章我们可以看到，文章并没有你想像中的难发，我试着从中提炼以下几点，希望对您有所借鉴。 1. 实验设计相对合理，层级递进，取样点与植物防卫三级级联反应基本对应，后续分析论述层次较为分明。 2. 转录组仅是的实验中的一部分，套路式的罗列结果的时代已没过去了，将转录组与其他指标融合在一起，就像本文中，除了转录组，作者还进一步进行了生理指标测定，如叶绿素含量、氧迸发等，基因关联性状，使结果更有说服力。 3. 转录组数据介绍切忌空泛，要结合其他生理生化指标，提炼出某些相关基因加以展示，如本文中叶绿素含量与表达下调的光捕获、光和作用相关的基因；H2O2积累和抗氧化酶活性的变化等。 4. 论文精华都在讨论部分，多引用他人数据佐证自己的结果，能做到旁征博引，论文一般都错不了！精读文献原文，请点击文末“阅读原文” 直达。 2020年，转录组类文章有多难发？其实难的是你不肯转变观念，时代不同了，老套路也就过时了；很多老师目前面对的难题不是手里没数据，也不是不会写论文，而是数据看不明白，分析便无从下手，这个梗不破，怎么发文章？！我给大家推荐一部《转录组分析结果解读》视频教程，轻松解决您看不懂转录组结果数据的难题。更多技能学习链接：更多生物信息课程： 1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读 2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读 3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接： WGCNA-加权基因共表达网络分析 4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读 5. 微生物16S/ITS/18S分析原理及结果解读、 OTU网络图绘制、 cytoscape与网络图绘制课程 6. 生物信息入门到精通必修基础课，学习链接： linux系统使用、 perl入门到精通、 perl语言高级、 R语言画图 7. 医学相关数据挖掘课程，不用做实验也能发文章，学习链接： TCGA-差异基因分析、 GEO芯片数据挖掘、 GSEA富集分析课程、 TCGA临床数据生存分析、 TCGA-转录因子分析、 TCGA-ceRNA调控网络分析 8.其他课程链接：二代测序转录组数据自主分析、 NCBI数据上传、二代测序数据解读。

基因家族分析投稿sci的期刊

要看你的表型明不明显，别人做没做过，能不能讲清楚一个故事。很有新意的可以冲 Plant Cell；别人做过，但是你完善，可以冲Plant J，当时最好做拟南芥；工作量很大可以发Plant Physiology；做了一个完整地故事，然后有在新意上有点欠缺，还可以考虑PCP，New Phytologist再小一点的有plant science,Plant cell report当然如果你觉得很好，还可以往那些公共杂志上投投试试，什么CNS，PNAS，Cell & Development啊，呵呵

水稻OsMKK基因家族的结构和表达分析OsMKK是水稻MAPK途径中位于中游的一个分裂原蛋白激酶激酶基因家族,主要承载着上游信号的汇聚、逐步向下扩散传递的作用。它们在水稻生长发育和逆境反应中的功能目前还不很清楚。干旱、低温、盐害等非生物逆境是影响水稻产量的重要因素。本文对OsMKK基因家族的结构进行了生物信息学分析,预测了其可能的生物学功能。并以籼稻品种9311为材料,在低温、高温、盐害、H2O2、ABA、JA、SA下胁迫水稻幼苗。测定了水稻苗期在7种处理下生理指标的变化和OsMKK基因家族的表达模式。最后,讨论了它们可能的生物学功能。主要实验结果如下： 1.OsMKK染色体定位、进化树和基因结构分析表明,OsMKK基因家族的8成员位于4条不同染色体上,分为2大类,A、B、C、D 4个亚组。第一大类有3个基因：OsMKK1、OsMKK6、OsMKK3,含有多个内含子和外显子,其调控形式多样。第二个大类包括5个基因：OsMKK4、OsMKK5、OsMKK10-1、OsMKK10-2、OsMKK10-3,仅仅含有一个外显子。OsMKK的sub-domain和motif分析表明,该基因家族都含有11个sub-domain、ATP结合位点,磷酸化位点。除OsMKK10-1, OsMKK10-2和OsMKK10-3外,均含有S/T XXXXX S/T motif. 2.对OsMKK基因家族5’端ATG上游1.0 kb区域启动子顺式作用元件的预测,鉴定了有多个特殊的顺式作用元件。如低温响应元件、热激响应元件、脱水响应元件、ABA响应元件、JA响应元件、防卫反应响应元件。每个基因均含多个不同的顺式作用元件,可能与多个逆境反应相关。 3.7种处理对水稻苗期叶片的生理指标变化结果表明,相对电导率、丙二醛和脯氨酸含量的变化趋势比较吻合。随胁迫时间的延长,相对电导率增大(除ABA处理外)；丙二醛含量都不同程度地增加；脯氨酸含量也呈递增趋势(除JA处理外)。说明水稻幼苗随着胁迫时间的延长,其细胞受胁迫的伤害程度越大。 4.OsMKK基因家族在12℃低温、38℃高温、250 mM盐、10mMH2O2、50μM ABA,50μM JA、1 mM SA胁迫下表达具有明显的诱导特性。12℃低温处理下,OsMKK4在0-12 h表达没有变化,在24 h诱导表达；38℃高温下,OsMKK3在3 h时激活表达,随后下降。OsMKK4、OsMKK5、OsMKK6在6 h表达最强,随后下降。其它基因的表达在6 h时都略有上升；250 mM盐处理下,OsMKK3在1h瞬间诱导表达,表达量达最高值；10 mM H2O2处理下,OsMKK4、OsMKK5、OsMKK10-2在1h内就瞬间诱导表达,表达量达最高,随后下降；50μM ABA处理下,OsMKK4、OsMKK5在1h时诱导表达；50μM JA处理下,OsMKK4诱导表达最强,随着时间增加而增强。其次是OsMKK5,在1 h瞬时表达增加,而后不再增加；1mMSA处理下,OsMKK6在6h内受到诱导表达,表达量达最高值。各种逆境对其它基因表达的影响较小。 5.OsMKK在水稻茎、叶、叶鞘、幼穗的表达有一定差异。OsMKK1在茎中表达低,其他基因在4个组织中均表达。OsMKK10-2在4个组织中表达量均不高,其它基因在4个组织中均有高有低。

转自：

基因组（Denovo sequencing），即基因组从头测序，指在不依赖参考基因组的情况下绘制该物种的全基因组序列图谱，从而获取该物种的全部遗传信息。高连续性基因组的获得，对后续功能基因定位，结构变异检测具有重要的意义。结合近几年的文章我们不难发现，基因组研究主要以下面几种方向为出发点开展： 1）大型/多倍体/超复杂物种基因组破译，技术创新改革； 2）0 Gap基因组/单体型基因组构建，序列优化打磨； 3）未知基因组破译联合多组学分析，经济价值挖掘； 4）品种泛基因组构建解析功能变异，覆盖多样表型； 5）科属水平谱系基因组构建与分析，探索进化功能； 6）多种基因组联合多组学比对剖析，解析性状特征。 ... ...

前5种好理解，第6种方向能做什么呢？其实我们想要了解一个物种，往往单一基因组难以完整解析，例如

等等棘手但是却又热门的研究话题。

接下来我将通过百迈客最近三篇动植物上的成功案例带大家看看，如何通过数个材料基因组结合多组学的手段解析性状特征。

合作单位：中科院南海海洋研究所发表期刊：Science Advances 影响因子：14.131 发表时间：2021.08 研究材料：Denovo:雌性与雄性草海龙（Phyllopteryx taeniolatus）；雌性与雄性绿海龙（Syngnathoides biaculeatus）个体重测序：2只雄性草海龙 RNA-seq：脑、眼、鳃、肝、肠、肌肉、鳍、皮肤和附叶测序方案

Denovo：雌性、雄性草海龙与雄性绿海龙PacBio平台；雌性绿海龙Nanopore平台，雌性、雄性草海龙与雄性绿海龙进行Hi-C测序。三代测序技术对应测序数据如下表所示：个体重测序：~30X PacBio

草海龙最终组装大小为~659 Mb（♂）与 ~663Mb（♀）, contig N50分别为10.0 Mb与12.1 Mb。绿海龙分别组装~637 Mb（♂）与~648 Mb（♀），contig N50分别为18.0Mb与21.0 Mb。4个基因组BUSCO评估显示范围在94.00- 94.40%。并分别在草海龙和绿海龙中确定了31个和33个发生扩张的基因家族。通过19条鳍鱼类全基因组数据集进行系统发育分析，明确草海龙与绿海龙在系统发育地位上属于海龙亚科（Syngnathinae）的姊妹群，并于 27.3 百万年前左右发生分化。

草海龙的头部、颈部、腹部、背部和尾部区域有叶子状的附属物，可以与周围环境相融合，使草海龙以完美拟态隐匿于海草床中。这些结构是该物种的一种适应性进化产物，主要由骨基质和富含胶原纤维的结缔组织组成。

通过转录组学分析，发现其表达基因（如msx,dlx,fgf）主要从皮肤和鳍等器官募集而来，暗示了相关基因对新器官产生和维持的重要作用。而“附叶”与鳍相比缺乏肢体发育特异性的hox基因。草海龙的附叶在捕食者的袭击中经常受到损伤，为了研究相关机制，作者通过转录组分析研究发现在其附叶中炎症和损伤修复相关基因表现出高表达水平，说明这些基因可能与其附叶的快速愈合和再生能力相关。同时草海龙特异性扩张的MHC I基因也在附叶中显著高表达，能为其提供额外的免疫保护。

通过雄性和雌性叶海龙Illumina reads正反比对雄性和雌性的全基因组序列，来确定叶海龙中假定的性染色体和性别基因座。结果显示 Chr4上的一个~47-kb区域仅在雄性中存在，且reads覆盖度为Chr4平均值的一半，该片段经Hi-C互作分析结果支持。

注释及比较分析发现草海龙和绿海龙的性别决定基因均为amhr2的雄性特异性拷贝amhr2y，但两者的基因座不相同。系统发育分析表明，amhr2y起源于它们最近共同祖先的重复事件，而黄鲈amhr2y是从其谱系中的独立重复事件进化而来。研究发现amhr2y比amhr2受到的选择压力更强，其整体结构与amhr2相似。

草海龙与其他海龙科物种一样具有缺乏牙齿的管状吻。研究表明，大部分富含P/Q的分泌型钙结合磷蛋白（SCPP）基因的缺失可能是导致syngnathids无牙的原因。为了验证海龙科中因假基因化丧失功能这一点，作者使用CRISPR-Cas9技术构建了两个斑马鱼scpp5突变系，发现scpp5-/-突变体斑马鱼牙齿的数量减少且颌骨中存在用于附着牙齿的凹坑。

研究结论该研究通过雌雄性海龙基因组的破译，结合重测序分析、转录分析、比较基因组分析等研究揭示了海龙科物种性别决定基因的产生和演化历程，为海洋鱼类的环境适应性进化研究提供了重要理论依据。

合作单位：浙江大学发表期刊：Plant Biotechnology Journal 影响因子：9.801 发表时间：2021.08 研究材料：Denovo：Brassica juncea菜用芥菜T84-66、油用芥菜AU213；个体重测序：12个油菜品种；遗传进化：183份油用与菜用芥菜；测序方案： Denovo：菜用芥菜分别146 Gb Illumina（~150X）+ 251 Gb PacBio（ 200X）+Hi-C( 200X )；油用芥菜147 Gb Illumina（~150X）+205 Gb PacBio（ 200X）+Hi-C( 200X ) 个体重测序：~20X Nanopore 遗传进化与GWAS：~10X illumina

研究内容

在着丝粒附近的异染色质状态中具有相对较低的基因表达模式。

系统地鉴定了T84-66 和AU213的A和B亚基因组中的全基因组单核苷酸多态性(SNP)、插入/缺失(InDels)和存在/缺失变异(PAV)。在T84-66和AU213之间的A和B亚基因组中鉴定了24,768个PAV（> 100 bp），其中3,634个PAV导致6,425个基因的变异。随机选择了几个PAV并使用PCR来确保这些PAV的保真度。其中一些基因组变异位于基因区域内，预计会影响T84-66和AU213作物中涉及生物和非生物胁迫的基因功能。

为了破译芥菜基因组菜用和油用品种之间SVs衍生的功能差异，作者基于Nanopore重测序技术，系统比较了菜用和油用芥菜群体基因组结构变异（structural variation，SV），挖掘到包括1, 354个高可信度的插入、缺失、重复、倒位、易位等变异。其中两个重要的基因位点TGA1和HSP20在ChrA06和ChrB08，可能与B.juncea基因组的菜用与油用品种之间对生物和生物应力的反应的自然变异有关。这些变异研究为菜用芥和油用芥两个典型分化群体的演化提供了基因组变异基础。

使用T84-66作为参考基因组，对183份油用与菜用芥菜进行进化关系分析，并通过SGS-GWAS（scored genomic SNPs based GWAS）基因定位，在A02和A09中发现了两个参与控制芥菜硫苷（GSL）积累变异的关键遗传位，并首次发现A09中的MYB28与B. jucnea中GSL的积累有关。经过进一步研究并同过ONT验证发现，MYB28基因的拷贝数变异（copy number variations，CNVs）是导致芥菜种群中硫苷积累差异的原因，该基因的拷贝数变异在低硫苷芥菜群体中普遍存在。

研究小结该研究将为多倍基因组进化研究和精确基因组选择研究提供重要研究信息，对芥菜风味品质和油脂质量的分子遗传改良具有重要科学和应用价值。

合作单位：华中农业大学发表期刊：Molecular Biology And Evolution 影响因子：16.241 发表时间：2021.05 研究材料：基因组、Hi-C：圆叶棉G. rotundifolium(K2)、亚洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鲜叶片

测序方案 denovo：illumina K2、A2和D5分别108×, 118×, 132×；Nanopore K2、A2和D5分别124×, 131×, 167× Hi-C挂载：6碱基酶HindⅢ；K2、A2和D5分辨率分别为20kb、20kb、10kb Hi-C互作：4碱基酶DpnⅡ；分辨率20 Kb, 50 Kb, 100 Kb

研究内容

利用Nanopore测序技术组装了圆叶棉（ K2 ）基因组，组装大小为2.44Gb(contigN50 = 5.33 Mb)；提升了亚洲棉（ A2 ）和雷蒙德氏棉（ D5 ）的基因组，组装大小分别为1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C挂载率均超过99%，BUSCO结果分别为92.5%, 93.9%,及95.4%。

重复序列注释表明，相对于D5，K2和A2中棉种特异的反转录转座子扩增是造成这三个基因组大小三倍变化的原因,特别是Gypsy和DIRS类型。全长转座子插入时间分析表明K2基因组中转座子插入最为古老，A2基因组有更多新的转座子。

比较基因组分析表明，A2和K2基因组在Chr01与Chr02染色体间存在一个大的易位；K2和D5基因组在Chr13与Chr05染色体间存在一个大的易位。三个棉种在57-71百万年前存在一次共同的全基因组复制事件，并在5.1-5.4百万年前发生物种分化，基因共线性分析表明每个基因组大约有15%特异的基因家族。

通过HiC染色质互作数据揭示三个棉种染色体大小的规律，A2与K2比D5多了约7000个基因，三个基因组中17%的共线性同源基因表现为A/B区室的染色质状态改变，这与活跃的转座子扩增相关。

K2与A2及与D5相比更多的倾向于A向B的转化。K2和A2中有更多的基因处于A compartment，D5中有更多的基因处于B compartment。

大约60%的拓扑结构域（TAD）在三个基因组中发生了重新组织，K2基因组中有更多特异的TAD。基于边界TE覆盖度，边界TE表达以及TE插入时间分析，发现K2不保守的TAD边界存在特异的和较新的转座子（物种分化后爆发的TE）插入。这些结果表明最近在K2和A2基因组中表达的TEs的扩增可能有助于在三个物种分化后形成谱系特异性TAD边界。基于这些结果，作者提出了三个棉种分化过程中，基因组扩张-转座子扩增介导的A/B区室转换和TAD重组的进化模型。

研究小结

本次研究首次公布了棉属中二倍体圆叶棉基因组，并对亚洲棉和雷蒙德氏棉基因组进行了升级，解析了转座子活动驱动的基因组大小进化特征，从转座子扩增和染色质空间结构角度为棉花物种进化提供新的见解，为植物中转座子活动介导的转录调控进化研究提供参考。

基因家族投稿期刊

BZR（BRASSINAZOLE-RESISTANT）家族基因是编码参与油菜素内酯信号转导的植物特异性转录因子，在植物生长中起着至关重要的作用。今天我就给大家带来一篇甜菜中BZR基因家族分析的文章。文章于2019年5月9日在线发表在BMC Plant Biology（影响因子3.93，中科院分区二区）。具体分析内容如下：一、甜菜中 BvBZR 基因的鉴定通过鉴定，共鉴定出6个BvBZR基因： Bv5_cuzi 、 Bv_epwr 、 Bv1_fxre 、 Bv6_nyuw 、 Bv1_qnjn 、 Bv_yfzt 。二、Motif分析和系统发育分析为了阐明BZR家族的进化关系，作者基于来自甜菜、拟南芥、水稻和大白菜的41个BZR家族成员的氨基酸序列构建了系统发育树，并进行了motif分析。三、 BvBZR 基因染色体分布和基因结构分析作者将鉴定的6个 BvBZR 基因定位到了甜菜基因组的5条染色体上，并对基因结构进行了分析。四、 BvBZR 基因的顺势作用原件分析五、不同甜菜品种根茎的生长特征规律统计作者统计了包括主根的生长曲线（根重）、主根的生长速度、主根的含糖量以及主根含糖量的增加速率4个指标。六、与甜菜生长特征相关的基因表达模式和相关性分析七、 BvBZR 基因在E型和Z型根、茎、叶组织中表达模式分析八、 BvBZR 基因对植物激素响应的基因表达模式分析为了研究 BvBZR 基因的表达水平是否受外源植物激素的调节，作者对甜菜根喷洒了IAA、ABA、MeJA、GA3共4种植物激素，并检测了 BvBZR 基因的表达水平。九、 BvBZR 基因的亚细胞定位作者首先使用Wolf PSORT软件对 BvBZR 基因进行亚细胞定位预测，并采用实验手段对预测结果进行了验证。总结到此为止，这篇基因家族类文章的所有分析就完成了，在内容上还是比较常规的，只是在实验方面补充了因的亚细胞定位实验和一些生长指标，并没有复杂的实验操作和分析内容，值得大多数研究者借鉴！更多生物信息课程： 1. 文章越来越难发？是你没发现新思路，基因家族分析发2-4分文章简单快速，学习链接：基因家族分析实操课程、基因家族文献思路解读 2. 转录组数据理解不深入？图表看不懂？点击链接学习深入解读数据结果文件，学习链接：转录组（有参）结果解读；转录组（无参）结果解读 3. 转录组数据深入挖掘技能-WGCNA，提升你的文章档次，学习链接： WGCNA-加权基因共表达网络分析 4. 转录组数据怎么挖掘？学习链接：转录组标准分析后的数据挖掘、转录组文献解读 5. 微生物16S/ITS/18S分析原理及结果解读、 OTU网络图绘制、 cytoscape与网络图绘制课程 6. 生物信息入门到精通必修基础课，学习链接： linux系统使用、 perl入门到精通、 perl语言高级、 R语言画图 7. 医学相关数据挖掘课程，不用做实验也能发文章，学习链接： TCGA-差异基因分析、 GEO芯片数据挖掘、 GSEA富集分析课程、 TCGA临床数据生存分析、 TCGA-转录因子分析、 TCGA-ceRNA调控网络分析 8.其他课程链接：二代测序转录组数据自主分析、 NCBI数据上传、二代测序数据解读。