文章主要是从下面几个方面来讲述,其中包含的内容比较多,我挑选几个主要的方面进行讲述.
下面进行详细的概述:
首先清楚一个概念,就是遗传力估计的方法,在遗传领域,这个是一个比较常见的问题,文章中主要讲述了两种方法。
在这里作者主要讲述了4个方面的方法,当然在介绍4个方面的方法之前,也介绍了在进行关联分析的时候用到的基础-多重假设检验矫正的方法,因为在进行关联分析的时候,判断遗传与影像特征之间的关系的时候都是通过假设检验的 P值来判断是否显著,所以在多重假设检验之后都需要做矫正,文章中讲述了多种比较矫正的方法,例如FWER,FDR,以及一些基于这种方法的变种方法,总之这些改建的方法无非是矫正的时候减少比较的次数(将多个SNP按在基因上的位置化为一组,一起进行矫正)。在讲述这四个方面的方法之后,作者还分析在下游分析种用到的方法,通路和网络富集分析的方法,以及一些集成分析的方法,下面先讲述四个方面的方法
-- 先写到这些,剩下的明天继续
单个SNP与单形状之间的相关性分析,就是普通的GWAS分析(多元线性回归的方法),在文章中作者根据研究的类别分为三种:
李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时,引用《Scinence》上“第三次技术命革”中的一句话:“下一个传大时代将是基因组革命时代,它正处于初期阶段。”在当前的研究水平上,只要涉及生命体重要现象的课题,几乎离不开对基因及其作用的分析。2000年6月26日,英美两国首脑会同公私两大人基因组测序集团向世人正式宣告,人基因组的工作草图已绘制完成。科学家把这作为生命科学进入新时代的标志,即后基因组时代(post-genome era)。因此有必要对基因组及其研究内容和进展作一个了解。
1基因组学及其研究内容
基因组(GENOME)一词是1920年Winkles从GENes和chromosOMEs组成的,用于描述生物的全部基因和染色体组成的概念。1953年Watson和Crick发现DNA双螺旋结构,标志分子生物学的诞生,随着各学科的发展,当前生物学研究进入新的进代,在生物大分子水平上将不同的研究技术和手段有机的结合以攻克生物学难题。
基因组研究可以理解为:(1)基因表达概况研究,即比较不同组织和不同发育阶段、正常状态与疾病状态,以及体外培养的细胞中基因表达模式的差异,技术包括传统的RTPCR,RNase保护试验,RNA印迹杂交,但是其不足是一次只能做一个。新的高通量表达分析方法包括微点阵(microarrary),基因表达序列分析(serial analysis of gene expression,SAGE),DNA芯片(DNA chip)等;(2)基因产物-蛋白质功能研究,包括单个基因的蛋白质体外表达方法,以及蛋白质组研究;(3)蛋白质与蛋白质相互作用的研究,利用酵母双杂交系统,单杂交系统(one-hybrid sys tem),三杂交系统(thrdee-hybrid system)以及反向杂交系统(reverse hybrid system)等。
1986年美国科学家Thomas Roderick提出了基因组学(Genomics),指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。随着1990年人类基因组计划(Human Genome Project,HGP)的实施并取得巨大成就,同时模式生物(model organisms)基因组计划也在进行,并先后完成了几个物种的序列分析,研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。第一个标志是功能基因组学的产生,第二个标志是蛋白质组学(proteome)的兴起。
2 结构基因组学研究内容
结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。根据使用的标志和手段不同,作图有三种类型,即构建生物体基因组高分辨率的遗传图谱、物理图谱、转录图谱。
2.1遗传图谱
通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性);80年代后出现的有STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性)分析。
2.2物理图谱
物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30 000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因的cDNA克隆,进行测序,确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作模板扩增;比较并纯化特异带;利用STS制备放射性探针与基因组进行原位杂交,使每隔100kb就有一个标志;二是在此基础上构建覆盖每条染色体的大片段:首先是构建数百kb的YAC(酵母人工染色体),对YAC进行作图,得到重叠的YAC连续克隆系,被称为低精度物理作图,然后在几十个kb的DNA片段水平上进行,将YAC随机切割后装入粘粒的作图称为高精度物理作图.
2.3转录图谱
利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分 cDNA的5'或3'端序列称为表达序列标签(EST) ,一般长300~500bp左右。一般说,mRNA的3' 端非翻译区(3'-UTR)是代表每个基因的比较特异的序列,将对应于3'-UTR的EST序列进行RH定位,即可构成由基因组成的STS图。截止到1998年12月底,在美国国家生物技术信息中心(NCBI)数据库中分布的植物EST的数目总和已达几万条,所测定的人基因组的EST达180万条以上。这些EST不仅为基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外,EST计划还为基因的鉴定提供了候选基因(cand idantes)。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此,为了弥补EST计划的不足,必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。
3功能基因组学研究
功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。
比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。目前从模式生物基因组研究中得出一些规律:模式生物基因组一般比较小,但编码基因的比例较高,重复顺序和非编码顺序较少;其G+C%比较高;内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致;DNA 冗余,即重复;绝大多数的核心生物功能由相当数量的orthologous蛋白承担;Synteny连锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭示了人类疾病基因的功能,利用基因顺序上的同源性克隆人类疾病基因,利用模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂性状,加深对基因组结构的认识。 此外,可利用诱变技术测定未知基因,基因组多样性以及生物信息学(Bioinformatics)的应用。
4蛋白质组学研究
基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,它有自身的活动规律,因而仅仅从基因的角度来研究是远远不够的,必须研究由基因转录和翻译出蛋白质的过程,才能真正揭示生命的活动规律,由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科— —蛋白质组学(proteomics)。蛋白质组(proteome)是由澳大利亚Macquarie大学的Wilkins和Williams于1994首先提出,并见于1995年7月的“Electrophonesis”上,指全部基因表达的全部蛋白质及其存在方式,是一个基因、一个细胞或组织所表达的全部蛋白质成分,蛋白质组学是对不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式、功能机理、调节控制以及蛋白质群体内相互作用,为临床诊断、病理研究、药物筛选、药物开发、新陈代谢途径等提供理论依据和基础。 蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式(修饰形式)、结构、功能和相互作用方式等。它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性,复杂性,低表达蛋白质难以检测等,应该明确其研究的艰难性。总体上研究可以分为两个方面:对蛋白质表达模式(或蛋白质组成)研究,对蛋白质功能模式(目前集中在蛋白质相互作用网络关系)研究。对蛋白质组研究可以提供如下信息:从基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后被修饰的程度等。由于蛋白质数目小于基因组中开放阅读框(ORF, open reading frame)数目,因此提出功能蛋白质组学(functional proteomics),功能蛋白质指在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质,只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次,是细胞内与某个功能有关或某种条件下的一群蛋白质。
对蛋白质组成分析鉴定,要求对蛋白质进行表征化,即分离、鉴定图谱化,包括两个步骤:蛋白质分离和鉴定。双向凝胶电泳(2-DGE)和质谱(MS)是主要的技术。近年来,有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳(two-dimensional polyacrylamide gel electrophoresis,2-D PAGE);蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三大关键是:双向凝胶电泳技术、质谱鉴定、计算机图像数据处理与蛋白质数据库。
5与基因组学相关学科诞生
随着基因组学研究的不断深入,人类有望揭示生命物质世界的各种前所未知的规律,完全揭开生命之谜,进而驾驶生命,使之为人类的社会经济服务。基因组研究和其它学科研究交叉,促进一些学科诞生,如营养基因组学(nutritional genomics),环境基因组学(environmental genomics),药物基因组学(phamarcogenomics),病理基因组学(pathogenomics),生殖基因组学(reproductive genomics),群体基因组学(population genomics)等。其中,生物信息学正成为备受关注的新型产业的支撑点。
生物信息学是以生物大分子为研究,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质,以计算机为工具,研究各种学科交叉的生物信息学的方法,找出其规律性,进而发展出适合它的各种软件,对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括:序列对比,基因识别和DNA序列分析,蛋白质结构预测,分子进化,数据库中知识发现(Knowledge Discovery in Database, KDD)。这一领域的重大科学问题有:继续进行数据库的建立和优化;研究数据库的新理论、新技术、新软件;进行若干重要算法的比较分析;进行人类基因组的信息结构分析;从生物信息数据出发开展遗传密码起源和生物进化研究;培养生物信息专业人员,建立国家生物医学数据库和服务系统[5]。20世纪末生物学数据的大量积累将导致新的理论发现或重大科学发现。生物信息学是基于数据库与知识发现的研究,对生命科学带来革命性的变化,对医药、卫生、食品、农业等产业产生巨大的影响。
邹承鲁教授在谈论21世纪的生命科学时讲到,生物学在20世纪已取得巨大的发展,数理科学广泛而又深刻地深入生物学的结果在新的高度上揭示了生命的奥妙,全面改变了生物学的面貌。生物学不仅是当前自然科学发展的热点,进入21世纪后将仍然如此。科学家称21世纪是信息时代。生物科学和信息科学结合,无疑是多个学科发展的必然结果。
黑麦( Secale cereale , 2n = 2x = 14, RR)属于禾本科小麦族黑麦属,虽然与普通小麦( Triticum aestivum ,Ta;2n=6x=42;AABBDD)和大麦( Hordeum vulgare ,Hv)有亲缘关系, 但黑麦具有独特的农艺性状和基因组特性。黑麦1RS染色体臂携带的抗病基因通过远缘杂交转入小麦基因组,为小麦生产中白粉病和条锈病的防治做出了巨大贡献。此外,黑麦也可以与普通小麦远缘杂交,染色体加倍后,人工合成八倍体小黑麦,具有比黑麦更高的生物量和产量。因此,黑麦是许多国家重要的粮食和饲料作物,也是全球小麦和小黑麦改良的重要遗传资源。
威宁黑麦是我国的 栽培黑麦早抽穗优良品种,具有抗白粉病和条锈病的能力 。为了解析黑麦优良性状的遗传和分子基础,促进黑麦及相关作物的基因组和育种研究,作者对威宁黑麦进行了基因组测序和分析。
基因组:
基因注释转录组测序: 正常或胁迫(冷或干旱)条件下栽培的植物中的叶、茎、根和穗样品,以及在开花10、20、30、40天后收获的发育中的样品, 采用Illumina及Pacbio平台进行RNA-seq及Iso-Seq;
遗传图谱QTL : 295份威宁黑麦×荆州黑麦杂交的F2代样品,采用SLAF-seq进行标记开发;
抽穗基因表达 : 威宁黑麦和荆州黑麦样品,播种后4、7和10天采集叶片样品,每个时间点使用3个生物重复,使用Illumina平台进行测序;
选择进化分析 : 已发表的101份家养黑麦和野生黑麦品种材料的公共数据,包括81份 S. cereala 、5份 S. vavilovii 、11份 S. strictum 和4份 S. sylvestre 。
流式预估黑麦基因组大小约为7.86 Gb,结合PacBio、Illumina、Hi-C、遗传图谱、BioNano光学图谱等技术进行基因组组装。最终组装 7.74 Gb 基因组(为预估基因组大小的98.47%),scaffold N50 为1.04 Gb,并将93.67%的序列挂载至 7条 染色体上(图1)。黑麦中每条染色体基因组大小均在 1G左右 (2R、3R、4R、6R、7R(~1Gb);1R(0.94097 Gb)、5R(0.99891 Gb) ),比乌拉尔图小麦( T. urartu ;Tu;AA型)、节节麦( Aegilops tauschii ;Aet;DD型)、野生二粒小麦( T. turgidum ssp. dicoccoides ;WEW;AABB型)、普通小麦(Ta)和大麦(Hv)等复杂的麦类中的 单条染色体基因组均要大 。超大的基因组及染色体,对黑麦基因组组装,特别是染色体挂载带来了巨大的挑战。
将组装结果与两个冬季黑麦品种(Lo7和Lo225)构建的染色体连锁图相比,威宁黑麦1R至7R物理图具有较高的一致性。在先前报道的Lo7的pyro-sequencing reads中97.45%可以定位到威宁基因组,平均序列同源性为97.71%,平均序列覆盖率为97.27%。
LAI值为 18.42 ,远高于先前发表的小麦和大麦基因组的LAI值。BUSCO评估结果为 96.74% 。并注释了 86,991 个蛋白编码基因。尽管黑麦基因组非常复杂,通过以上评估结果说明,本次研究构建了一个高质量的威宁黑麦基因组。
威宁黑麦基因组中 90.31% 被注释为转座子(TE),共包含537个家族的2,671,941个成员,这些TE的含量明显比普通小麦 (84.70%), 乌拉尔图小麦 (81.42%), 节节麦 (84.40%), 野生二粒小麦 (82.20%)以及大麦 (80.80%)更高。其中长末端重复反转录转座子( LTR-RTs )是主要的转座子,在注释的TEs中占 84.49% 。
与乌拉尔图小麦、节节麦及大麦的LTR-RTs进行比较发现 : (1) Gypsy 是威宁黑麦基因组扩张的主要原因之一(Fig. 2a),并且有3个LTR-RT家族( Daniela , Sumaya , Sumana )在威宁黑麦中特异扩张,其中 Daniela 的占比最高 (Fig. 2b)。 (2)威宁黑麦中完整的LTR-RTs插入时间存在独特的 双峰 分布(Fig. 2c),最近一个扩增峰出现在50万年前,另一个出现在1.7 百万年(MYA)左右(与大麦相同) (Fig. 2c)。 (3)这种双峰分布模式由 Gypsy RTs 的扩增主导 (Fig. 2d)。
通过比较威宁黑麦、乌拉尔图小麦、节节麦、普通小麦(亚基因组TaA、TaB和TaD)、大麦、水稻Os( Oryza sativa ssp. japonica)、二穗短柄草Bd( Brachypodium distachyon )、玉米Zm( Zea mays )、高粱Sb( Sorghum bicolor )、谷子Si( Setaria italica )基因组,共找到2517个单拷贝同源基因。 通过对单拷贝基因组构建进化树和计算分化时间发现,在大麦和小麦分化后(15MYA)黑麦和二倍体小麦发生了分化(9.6 MYA) (Fig. 3a)。
作者以水稻为祖先参考基因组,研究了威宁黑麦的染色体进化 。威宁黑麦与水稻共鉴定出23个大的共线性区,包含10949对同源基因,可推断出祖先染色体片段在1R到7R之间的排列(图3b): (1)3R来源于一条古老的染色体AGK1/Os1,该染色体的一段易位到6RL; (2)1R和2R分别由两条祖先染色体组成,1R与AGK10/Os10嵌套插入AGK5/Os5有关,2R与AGK7/Os7嵌套插入AGK4/Os4有关; (3)4R, 5R, 6R,7R是通过复杂易位从至少三条祖先染色体上获得的(图3b)。
在威宁黑麦基因组与普通小麦3个亚基因组的比较中,1R、2R和3R分别与小麦1、2和3组染色体完全共线。在4R中发现与4A/4B/4D、7A/7B/7D或6A/6B/6D部分共线性的三个区域。5R与5A完全共线,与5B、5D部分共线是由于易位的4B或4D片段在5BL或5DL的长臂融合(图3c)。在6R中,观察到3个区域与6A/6B/6D、3A/3B/3D或7A/7B/7D部分共线。这些数据将有助于黑麦在禾本科比较基因组学研究以及黑麦与普通小麦杂交研究中的应用。
作者在威宁黑麦中检测到4217个单拷贝基因、23753个 分散重复基因 (DDGs) 、6659个 近端重复基因 (PDGs) 、7077个 串联重复基因(TDGs) 和1866个 片段重复基因 。转座重复基因(TrDGs)由TE活性诱导的,它们是DDGs的主要组成部分。作者以大麦为参考,在威宁黑麦中鉴定出10357个TrDG,远远大于以相同方式计算的乌拉尔图小麦(7145)和节节麦(7351)中TrDG的数量(图4b)。威宁黑麦所特有的TrDG(5926)也比乌拉尔图小麦(3513)和节节麦(3327)所特有的TrDG更多(图4b)。
接下来作者研究了黑麦淀粉生物合成相关基因(SBRGs)中的基因复制。研究发现 这些重复类型在黑麦淀粉生物合成相关基因(SBRGs)中普遍存在,并且不同的 SBRG 的复制基因之间往往表现出表达差异,说明不同类型的基因复制可以丰富黑麦基因在重要生物过程中的遗传多样性 (图4c),这些黑麦 SBRGs 的新变化可能为调控植物淀粉生物合成和性质提供新的酶活性,因此解析全套黑麦 SBRGs 有利于提高黑麦的产量潜力和营养品质。
与小麦和大麦相似,黑麦在胚乳组织中积累了丰富的储存蛋白SSPs。作者利用威宁基因组组装技术对黑麦SSP基因座进行了分析。
在威宁黑麦中未发现小麦低分子量麦谷蛋白亚基(LMW-GSs)或大麦B-hordein的同源序列(图5b), 表明在黑麦进化过程中携带这些基因的染色体片段缺失 ,这可能是1BL1RS易位系小麦品种中,品质受影响的主要原因。
并且在威宁黑麦基因组中未发现α-醇溶蛋白基因, 这说明小麦及其近缘种的α-醇溶蛋白(α-gliadin)基因可能在小麦和黑麦分化之后进化产生的。
这些SSP分析结果阐明了黑麦碱基因座的结构和组成,这将有助于进一步研究黑麦、小黑麦和小麦的加工和营养品质。
作者利用iTAK预测了威宁黑麦和其他8种禾本科植物的TF基因 ,在注释的65个转录因子基因家族中,威宁黑麦有28个家族成员增加,其中AP2/ERF TF基因家族成员增加幅度较大。威宁黑麦的 抗病相关基因(DRA )数量(1989)比乌拉尔图小麦(1621)、节节麦(1758)、大麦(1508)、二穗短柄草(1178)、水稻(1575)以及普通小麦的A(1836)、B(1728)和D(1888)亚基因组多。
鉴于AP2/ERF TFs和DRA基因在植物对非生物逆境和生物逆境的反应中的重要作用,上述发现可能有助于黑麦和相关作物的有效遗传研究和分子改良。
在长日照条件下,威宁黑麦比荆州黑麦提前抽穗10-12天(图6a),这与威宁黑麦茎尖分生组织发育更快有关(图6b)。在威宁黑麦基因组中,注释到在长日照条件下高表达的两个开花位点(FT)基因 ScFT1 (ScWN4R01G446100)和 ScFT2 (ScWN3R01G192500)。播种后7天和10天, ScFT1 和 ScFT2 在威宁黑麦中的表达水平显著高于荆州黑麦(图6c),且ScFT蛋白在黑麦中积累到相对较高水平,而荆州黑麦中几乎没有(图6d)。检测到的ScFT蛋白的大小(~29 kDa)比预测出的ScFT1和ScFT2的分子量大(~19 kDa)(图6d),表明ScFT蛋白具有潜在的翻译后修饰。用高效检测磷蛋白的磷酸标记SDS-PAGE分析表明,威宁黑麦中ScFT确实发生了翻译后磷酸化修饰。
作者突变了ScFT2磷酸化相关的两个残基(S76和T132),并为ScFT2构建了一系列去磷模拟位点(S76A、T132A和S76A/T132A)和磷模拟位点(S76D、T132D和S76D/T132D)。当使用马铃薯X病毒载体在烟草中进行外源表达时,ScFT2和去磷双突变体ScFT2 S76A/T132A 相对于游离GFP(对照)和其他ScFT2突变体,表现出持续促进烟草生长(图6e)。与GFP相比,ScFT2和三个去磷突变体(ScFT2 S76A 、ScFT2 T132A 及ScFT2 S76A/T132A )的异位表达提高了开花植株的百分比,ScFT2 S76A/T132A 尤其明显,但在表达三个拟磷突变体(ScFT2 S76D , ScFT2 T132D , or ScFT2 S76D/T132D )中没有观察到这种促进作用(图6f)。免疫印迹分析表明,ScFT2、ScFT2 S76A 、ScFT2 T132A 和ScFT2 S76A/T132A 在烟草植株中的积累量相当高,但ScFT2 S76D 、ScFT2 T132D 和ScFT2 S76D/T132D 在烟草植株中的积累量却很低(图6g)。因此,保守的S76和T132残基的改变影响了ScFT2控制植物开花的功能,这与ScFT2蛋白稳定性的改变有关。本研究首次发现FT磷酸化对开花时间控制的影响,为更全面地探索FT蛋白控制植物开花的分子和生化机制提供了新的途径。
作者进一步研究了光周期 Photoperiod ( Ppd )基因的表达,该基因在长日照条件下正调控FT的表达。在威宁和荆州黑麦的转录组分析中发现了一个表达 Ppd 的基因 ScPpd1 (ScWN2R01G043000)。该基因在威宁黑麦内的表达非常早,在播种2 天后达到表达高峰;而荆州黑麦在播种4天后才达到高峰(图6h)。根据 ScPpd1 对黑麦抽穗期的调控作用,研究者利用威宁×荆州F2代群体,检测到与前期研究一致的三个主效抽穗期QTL( Hd2R、Hd5R 和 Hd6R )。
对驯化基因的分析可以促进对作物性状的理解和改良,但在黑麦中这类基因的分子分析方面进展甚微。作者通过全基因组选择清除分析,利用在栽培黑麦和瓦维洛夫黑麦( S. vavilovii )之间鉴定的123647个SNPs,挖掘黑麦驯化相关染色体区域和基因座。DRI、 F ST 、XP-CLR分析中,共同识别到11个选择信号(图7a-c)。通过与水稻和大麦的共线性比较,发现了一些可能的选择清除位点,包括已在水稻或大麦中已被功能分析的 ScBC1 、 ScBtr 、 ScGW2 、 ScMOC1 、 ScID1 和 ScWx 的同源基因(图7a-c)。
检测到的 ScID1 基因座包含一对具有相同编码序列的 ScID1 同源序列(ScWN6R01G057200和ScWN6R01G057300,下称 ScID1.1 和 ScID1.2 )(图7d)。ScID1.1和ScID1.2蛋白与玉米ID1(63.19%)和水稻RID1(65.34%)具有很强的同源性,这两个蛋白在玉米和水稻中都被发现调控着从营养体向花发育的转换。 ScID1.1 和 ScID1.2 在威宁黑麦幼叶中的表达水平高于荆州黑麦(图7e)。在威宁×荆州分离的F2群体中, ScID1 JZ/JZ 纯合植株的平均抽穗期显著晚于 ScID1 JZ/WN 或 ScID1 WN/WN 个体(图7f),这与荆州黑麦相对于威宁黑麦的晚花表型相一致(图6a)。以上结果表明 ScID1 可能参与了抽穗期的调控,并可能通过黑麦驯化进行选择,使作物成熟度得到适当的调整,以更好地适应生长环境。
总结
本研究对我国栽培的优良品种威宁黑麦进行了基因组测序,基因组组装大小为7.74 Gb,其中93.67%被挂载到7条染色体上,重复序列占总基因组的90.31%。并基于高质量基因组揭示了全基因组基因复制及其对淀粉生物合成基因的影响,解析了复杂储存蛋白基因座位点、早抽穗性状的基因表达特征以及黑麦中与驯化相关的染色体区域和基因座。本次研究结果对黑麦的基因组特性及其农艺性状调控基因有了新的认识,获得了对进一步研究黑麦驯化遗传基础可能有用的染色体区域和基因座。威宁黑麦基因组组装对于破解黑麦基因组生物学,深化比较谷类基因组学研究,加速黑麦及相关谷类作物的遗传改良具有重要价值。
A high-quality genome assembly highlights rye genomic characteristics and agronomically important genes
题目:人类基因组计///作者///院系:///年级:///学号:摘要:人类基因组计划由美、英、日、中、德、法等国参加进行了人体基因作图,测定人体全部DNA序列创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。在揭示人类发展历史,基因治疗,农作物绿色革命,DNA鉴定方面具有深远影响。
关键字:人类基因组计划
正文:
人类基因组计划
人类基因组计划于20世纪80年代提出,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。其研究内容还包括创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。
人类基因组计划在二十多年的时间里取得了较大进展。
人类基因组计划最早在1985年由诺贝尔奖获得者,美国的杜尔贝克Renato Dulbecoo提出。最初目的是完成人类基因组全长约30亿个核苷酸的碱基序列测定,阐明所有人类基因并确定其在染色体上的位置,从而破译全部的人类遗传基因。
1986年3月7日,杜尔贝克在《科学》杂志上发表了一篇题为“癌症研究的转折点——测定人类基因组序列”的文章,指出癌症和其它疾病的发生都与基因有关,并提出测定人类整个基因组序列的途径和重要意义。
1988年美国能源部和国家卫生研究院率先在美国开展人类基因组计划,并经国会批准由政府给予资助。此后,成立了一个国际间的合作机构——人类基因组织(Human Genome Organization),由多个国家筹集资金和科研力量,积极参加这一国际性研究计划。
1990年10月,国际人类基因组计划正式启动,预计用15年时间,投资30亿美元,完成30亿对碱基的测序,并对所有基因(当时预计为8万~10万个)进行绘图和排序。全球性人类基因组计划有美国、英国、日本、法国、德国和中国六个国家负责,其中美国承担了全部任务的54%,英国33%,日本7%,法国2.8%,德国2.2%,中国于1999年9月获准加入人类基因组计划并承担了1%的测序任务,即3号染色体断臂自D3S3610标志至端粒区段约3000万个碱基的全序列测定。
中国1993年启动了相关研究项目,相继在上海和北京成立了国家人类基因组南、北两个中心,并承担人类基因组计划中1%的测序任务。经过多个国家的科学家的共同协作,人类终于在20世纪90年代完成了对自身基因组测序的初步工作。
2003年6月,中、美、日、德、法、英等六国科学家宣布首次绘成人类基因组“工作框架图”。
2003年4月14日,中、美、日、德、法、英等六国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。
2004年,人类基因组完成测序;
2005年,人类X染色体测序工作基本完成,并公布了该染色体基因草图。
HGP的主要任务是人类的DNA测序,包括下图所示的四张谱图,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。
1、遗传图谱(genetic map)
又称连锁图谱(linkage map),这是根据基因或遗传标记之间的交换重组值来确定它们在染色体上的相对距离、位置的图谱。其图距单位是厘摩(coml),以纪念现代遗传学奠基人摩尔根。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。
2、物理图谱(physical map)
物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。
用部分酶解法测定DNA物理图谱包括二个基本步骤:(1)完全降解 (2)部分降解
3、序列图谱(sequence map)
随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。
4、基因图谱(DNA map)
基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。
原理
基因图谱的意义
在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。
人类基因组计划的实施具有重大意义和影响。
第一,揭示人类发展历史
破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。同时,人类基因组图谱对揭示人类发展、进化的历史具有重要意义。对进化的研究,不再建立在假说的基础上,利用比较基因组学,通过研究古代DNA,可揭示生命进化的奥秘以及古今生物的联系,帮助人们更好地认识人类在自然界中的地位。
第二,基因治疗
获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。在不远的将来,根据每个人DNA序列的差异,可了解不同个体对疾病的抵抗力,依照每个人的“基因特点”对症下药,这便是21世纪的医学——个体化医学。更重要的是,通过基因治疗,不但可预防当事人日后发生疾病,还可预防其后代发生同样的疾病。
第三,基因工程药物研究
基因工程药物,是重组DNA的表达产物。广义的说,凡是在药物生产过程中涉及用基因工程的,都可以成为基因工程药物。基因技术应用于制药工业,可以生产出高效、高产、廉价、不再苦口的防治疾病的新药物,从而引起制药工业的革命性变革。对于肝炎、心血管疾病、肿瘤、艾滋病等目前尚无良药可治的重大疑难病,人们对生物工程寄予厚望,期待基因工程技术生产出有效地治疗药物。
第四,农作物的绿色革命
科学家们在利用基因工程技术改良农作物方面已取得重大进展,基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在开发可以生产出能够防病的疫苗和食品的农作物。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法,需要七、八年时间才能培育出一个新的植物品种,基因工程技术使研究人员可以将任何一种基因注入到一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。
第五,DNA鉴定
DNA鉴定已经给法医科学和犯罪司法系统带来了一场革命。DNA已经成为无数审判中的关键证据,帮助警察和法庭鉴别暴力犯罪中的罪犯,而且可信度非常高。它能够确定犯罪的人,同时也能够证明误判的人无罪。不仅如此,DNA鉴定还可以用于帮助寻找失踪的人、谋杀或事故中的受害者;还可以用于证明或否认父子关系。
第六,转基因动物
随着基因工程技术的飞速发展及其在动物上的应用,转基因动物的发展呈现出一片“大好形势”。比如基因育种能提供高产优质抗病的“超级动物”;基因工程疫苗为畜牧业节省了大笔开支;通过转基因动物进行器官移植。
人类基因组的重要性
由以上的事实我们可以看出,要想解开人类自身的秘密,就要从破解基因的密码做起。
对人类基因的了解和掌控,也将对人类物种的进化、人类社会的进步产生强大推动作用。通过对人类基因已知和未知领域的探索,可以找到更好的基因更有利人类进步的基因,人类社会将从本质上发生突破性的飞越。
因此我们可以说,这项耗资大耗时长的人类基因组计划确实是非常必要而且永世受益的。对于生物学界来说这可能是很小的一步,但对人类社会来说却是非常大的一步。
尽管该计划已宣告完成,但该计划尚未得出令人满意的人类基因图谱,因此,科学工作者们对人类基因组的探索研究仍在紧张的进行中。希望在不久的将来,人类能解开基因的面纱,了解它掌控它,给人类社会带来无穷的财富。
参考文献:
1、章波《人类基因研究报告》重庆出版社 2006年版
2、钱俊生、孔伟、卢大振《生命是什么》中共中央党校出版社2000年12月版
3、C.丹尼斯、R.加拉格尔、J.D.沃森 序《人类基因组 我们的DNA》科学出版社2003年4月版
4、杨业洲、陈廉《人类基因组计划》实用妇产科杂志2001年1月第17期 (Journal of Practical Obstetrics and Gynecology 2001 January Vol.17 No.1)
5、参考资料:《科学》(Science)