首页

> 学术发表知识库

首页 学术发表知识库 问题

基因组学研究热点论文

发布时间:

基因组学研究热点论文

历时22年,研究人员终于从头到尾破译了完整的人类基因组序列。

钛媒体App4月1日消息,据科技日报,全球顶级期刊《Science》(科学)杂志今天凌晨连发6篇论文报告,公布了人类基因组测序的最新进展:国家人类基因组研究中心(NHGRI)组成的端粒到端粒 (T2T) 联盟科学团队,通过新的技术研究出全球第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。

这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”,增加了之前整条染色体上隐藏的DNA片段,破译了缺失的大约2亿个DNA碱基对以及2000多个新基因——占人类基因组的8%。

这篇研究成果意义重大。科研人员揭示的完整人类基因组序列,是世界上最复杂的谜题之一,这一研究使得人类第一次看到最完整的、无间隙的DNA碱基基因序列,对于人类了解基因组变异的全谱,以及某些疾病的遗传贡献至关重要,将会推动与癌症、出生缺陷和衰老相关的研究与科学发展。

同时,这也是《Science》创刊141年来,首次在同一期杂志中连发6篇论文揭示人类基因组研究。

本论文作者,圣路易斯华盛顿大学医学院遗传学家Ting Wang(音译:王庭)表示,此次拥有完整的基因组,一定会改善生物医学研究。“毫无疑问,这是一项重要的成就。”

据中国科学报,人类基因组计划参与者、中国科学院北京基因组研究所研究员于军表示,假如把人类基因组序列比作一辆非常复杂的汽车,那么与20年前完成的人类基因组草图相比,完整的新序列非常于增添了更多零件。

“我们看到了以前从未阅读过的章节,”本论文通讯作者,华盛顿大学霍华德-休斯医学研究所(HHMI)研究员Evan Eichler(艾希勒)表示,这是全行业的一件大事。

Science封面图研究人员到底破译了什么?人类基因组由超过60亿个独立的DNA碱基、大约2-3万个蛋白质编码基因(整个基因仍未有统一答案)组成,与黑猩猩等其他灵长类动物的数量差不多,分布在23对染色体上。为了读取数以万计的基因组,科学家们首先将所有的DNA链切成几百到几千个单位长度的DNA片段。然后用测序机器读取每个片段中的各个碱基,科学家们试图按照正确的顺序组装这些片段,就像拼凑一个复杂的拼图。

2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。

然而,由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。

实际上,核心的挑战在于,基因组的某些区域反复重复相同的碱基。重复的区域包括着丝粒和核糖体DNA等,过去无法按照正确的顺序组装一些被切碎的片段。这就像拥有相同的拼图碎片一样,科学家们不知道哪块碎片在哪里,因此基因组图中留下了很大的空白。

而且大多数细胞包含两个基因组--一个来自父亲,一个来自母亲。当研究人员试图组装所有的片段时,来自父母双方的序列可能混合在一起,掩盖了个体基因组内的实际变异。

如今,研究人员通过新的纳米机器设备与核心技术,实现了新的无间隙版本T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。

这些候选基因大多数是失活的,但其中115个仍然可能表达。团队还在人类基因组中发现了大约200万个额外的变异,其中622个出现在与医学相关的基因中。此外,新序列还纠正了GRCh38中的数千个结构错误。

近端着丝粒染色体的显示图样(来源:论文)

具体而言,新序列填补的空白包括人类5条染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。其中包括在重要的染色体结构中及其周围发现的高度重复的DNA序列,如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。

此外,新序列还揭示了以前未被发现的节段重复,即在基因组中复制的长DNA片段,并揭示了关于着丝粒周围区域的前所未见的细节。这一区域内的变异性可能为人类祖先如何进化提供新证据。

值得一提的是,本研究成果的关键进展,其实是利用了新的技术设备——英国牛津纳米孔技术公司和太平洋生物科学公司制造的快速迭代的基因测序机器。

早在2017年,国家人类基因组研究中心(NHGRI)负责人Adam Phillippy(亚当-菲利皮),以及加州大学圣克鲁兹分校(UCSC)的凯伦-米加意识到,新的纳米孔机器实现了一次准确读取100万个DNA碱基的能力,可以为最终解决基因组难点打开了大门。

大约在同一时间,华盛顿大学霍华德-休斯医学研究所(HHMI)Evan Eichler(艾希勒)领导的科研团队已经证明,使用太平洋生物科学公司的设备技术,可以解决更复杂形式的遗传变异技术。

因此,三人一起创办了端粒到端粒(T2T)联盟,利用全球约100名科学家团队资源,使其加快了研究佳偶。

随后,该团队连续六个月不间断地利用快速迭代的纳米孔基因测序机器,并请来几十位科学家来组装这些基因片段并分析结果。最终利用设备、技术等,实现了长读数测序读数,并将长读测序与牛津纳米孔的数据相结合,准确率超过了99%,填补了全球基因学研究的空白。

一直到2020年夏天,该团队已经拼上了两条染色体。在新冠疫情爆发的期间,团队通过Slack等通讯工具进行远程工作,获得了另外21条染色体,将每个染色体从一端或端粒排序到另一端。而且,科研人员人员还试图组装基因组中最难的区域,即着丝粒中高度重复的DNA序列。

最终,通过长时间的研究与团队合作,该团队成功实现了对每个染色体进行了测序,包含了编码用于制造核糖体的RNA的基因的多个拷贝,总共400个。

2021年6月,这份研究成果首次发表在预印版平台bioRxiv上。经过同行评议等,如今一系列论文登上了《Science》(科学)杂志。

研究人员在会后采访中表示,下一阶段的研究将对不同人的基因组进行测序,以充分掌握人类基因的多样性、作用以及人类与近亲、其它灵长类动物的关系。

年增速超20%,中国百亿基因市场前景广阔

随着生物学技术的不断发展,新的行业层出不穷,本次研究成果所属的中国基因测序行业是一个百亿级市场,拥有广阔的发展前景。

根据千际投行的研究统计数据显示,早在2019年,基因测序所在的全球生物制品行业市场规模就达到了3172亿元,未来五年有望达到万亿级别。其中,2019年中国基因测序行业市场规模约为149亿元,年增速超20%。

近年来,基因测序行业得到迅速发展,吸引了大量资本和企业的进入。从产业上下游来看,基因测序产业链主要包括了上游仪器、中游服务提供商以及下游终端应用三个环节。涉及到的公司包括华大基因、达安基因、药明康德,以及互联网巨头苹果公司、亚马逊、谷歌、微软等。

整个产业看似简单,但上游的基因测序仪及配套试剂是整个产业链壁垒最高的部分,下游终端应用还涉及领域覆盖面非常广,既包括医疗领域的人体基因组、人体微生物基因组以及基础研究领域,还包括非医疗领域的环境治理、石油存储探测、农牧软文种等。

实际上,早在几十年前,医学界就对此有过尝试,将狒狒的心脏移植给了一个罹患先天性心脏病的孩子。如今,通过嵌合的方式,通过基因编辑的方式,甚至是通过合成生物学的方式,实现了猪心脏在人类身上的移植。

华大集团CEO尹烨曾表示,其实,今天人类进入了生命时代,我们关心的则是自身的基因和健康,以此就将去整合物理世界、信息世界和生命世界。

在应用场景不断拓宽,测序能力进一步加强的共同促进作用下,全球基因测序行业市场规模将不断增长,中国基因行业市场规模虽然与全球头部企业差距较大,但是在国内市场中仍然占据较大的优势,未来要想提高国际市场份额,还需进一步加强技术研发,未来发展具有巨大的想象空间。

今天,新的基因组序列研究成果,是科研人员必不可少的第一步,也是实现商业化的重要一步。

Evan Eichler(艾希勒)表示,“现在我们有了一块罗塞塔石碑(注:一块制作于公元前196年的花岗闪长岩石碑,解读出已经失传千余年的埃及象形文之意义与结构),可以在未来研究数十万个其他基因组的完整编译。”

这个问得太宽泛了,回答压力大啊。首先要看是根据研究对象分类,还是关注的层面分类- 根据研究对象可以大致分为动植物,人类健康和微生物1. 动植物方向近年热点包括基因组辅助分子育种,和杂合物种(如水产、林木等)基因组图谱绘制。当然群体进化一直是生物学永恒的问题,热度从未衰减。2. 人类健康方面主要是各类疾病的研究,首先,基因组学是定位单基因病(孟德尔遗传病)致病位点的利器;其次,基因组学被广泛应用于筛选复杂疾病(如2型糖尿病、免疫类疾病等)的致病基因;最后,癌症一直被认为是基因病,癌症基因组学也在近年成为一个独立的方向,快速发展。3. 微生物这块关注点包括环境微生物,能源微生物和致病微生物等。基因组图谱绘制、宏基因组,以及和其他方向(如合成生物学)的结合交叉等也都是近年热点。- 按照关注层面分类可分为DNA层面,表观修饰层面和RNA层面1. DNA层面逐步开始由单碱基的改变(SNP或point mutation)逐步过渡到结构变异等序列级别的差异。变异检测的灵敏度和准确度在近年都有很大的提升。2. 表观修饰层面对于DNA甲基化和组蛋白修饰的关注也是一直未减退,越来越多的甲基化图谱被绘制,用于观测细胞发育、癌症发展等;ChIP-chip和ChIP-seq也用来检测了大量的组蛋白和DNA的互作情况。3. RNA层面除了基因表达、可变剪切和microRNA之外,长非编码RNA(lncRNA)成为近年的热点。表达和调控一直以来被认为更适合解释我们观察到的表型差异。不断发展的测序技术和越来越多的尖端成果(如单细胞测序)正在推动着基因组学的发展。

李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时,引用《Scinence》上“第三次技术命革”中的一句话:“下一个传大时代将是基因组革命时代,它正处于初期阶段。”在当前的研究水平上,只要涉及生命体重要现象的课题,几乎离不开对基因及其作用的分析。2000年6月26日,英美两国首脑会同公私两大人基因组测序集团向世人正式宣告,人基因组的工作草图已绘制完成。科学家把这作为生命科学进入新时代的标志,即后基因组时代(post-genome era)。因此有必要对基因组及其研究内容和进展作一个了解。1基因组学及其研究内容基因组(GENOME)一词是1920年Winkles从GENes和chromosOMEs组成的,用于描述生物的全部基因和染色体组成的概念。1953年Watson和Crick发现DNA双螺旋结构,标志分子生物学的诞生,随着各学科的发展,当前生物学研究进入新的进代,在生物大分子水平上将不同的研究技术和手段有机的结合以攻克生物学难题。基因组研究可以理解为:(1)基因表达概况研究,即比较不同组织和不同发育阶段、正常状态与疾病状态,以及体外培养的细胞中基因表达模式的差异,技术包括传统的RTPCR,RNase保护试验,RNA印迹杂交,但是其不足是一次只能做一个。新的高通量表达分析方法包括微点阵(microarrary),基因表达序列分析(serial analysis of gene expression,SAGE),DNA芯片(DNA chip)等;(2)基因产物-蛋白质功能研究,包括单个基因的蛋白质体外表达方法,以及蛋白质组研究;(3)蛋白质与蛋白质相互作用的研究,利用酵母双杂交系统,单杂交系统(one-hybrid system),三杂交系统(thrdee-hybrid system)以及反向杂交系统(reverse hybrid system)等。1986年美国科学家Thomas Roderick提出了基因组学(Genomics),指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。随着1990年人类基因组计划(Human Genome Project,HGP)的实施并取得巨大成就,同时模式生物(model organisms)基因组计划也在进行,并先后完成了几个物种的序列分析,研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。第一个标志是功能基因组学的产生,第二个标志是蛋白质组学(proteome)的兴起。2 结构基因组学研究内容结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。根据使用的标志和手段不同,作图有三种类型,即构建生物体基因组高分辨率的遗传图谱、物理图谱、转录图谱。2.1遗传图谱通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性);80年代后出现的有STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性)分析。2.2物理图谱物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30 000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因的cDNA克隆,进行测序,确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作模板扩增;比较并纯化特异带;利用STS制备放射性探针与基因组进行原位杂交,使每隔100kb就有一个标志;二是在此基础上构建覆盖每条染色体的大片段:首先是构建数百kb的YAC(酵母人工染色体),对YAC进行作图,得到重叠的YAC连续克隆系,被称为低精度物理作图,然后在几十个kb的DNA片段水平上进行,将YAC随机切割后装入粘粒的作图称为高精度物理作图.2.3转录图谱利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分 cDNA的5'或3'端序列称为表达序列标签(EST),一般长300~500bp左右。一般说,mRNA的3' 端非翻译区(3'-UTR)是代表每个基因的比较特异的序列,将对应于3'-UTR的EST序列进行RH定位,即可构成由基因组成的STS图。截止到1998年12月底,在美国国家生物技术信息中心(NCBI)数据库中分布的植物EST的数目总和已达几万条,所测定的人基因组的EST达180万条以上。这些EST不仅为基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外,EST计划还为基因的鉴定提供了候选基因(candidantes)。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此,为了弥补EST计划的不足,必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。3功能基因组学研究功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。目前从模式生物基因组研究中得出一些规律:模式生物基因组一般比较小,但编码基因的比例较高,重复顺序和非编码顺序较少;其G+C%比较高;内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致;DNA 冗余,即重复;绝大多数的核心生物功能由相当数量的orthologous蛋白承担;Synteny连锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭示了人类疾病基因的功能,利用基因顺序上的同源性克隆人类疾病基因,利用模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂性状,加深对基因组结构的认识。 此外,可利用诱变技术测定未知基因,基因组多样性以及生物信息学(Bioinformatics)的应用。4蛋白质组学研究基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,它有自身的活动规律,因而仅仅从基因的角度来研究是远远不够的,必须研究由基因转录和翻译出蛋白质的过程,才能真正揭示生命的活动规律,由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科——蛋白质组学(proteomics)。蛋白质组(proteome)是由澳大利亚Macquarie大学的Wilkins和Williams于1994首先提出,并见于1995年7月的“Electrophonesis”上,指全部基因表达的全部蛋白质及其存在方式,是一个基因、一个细胞或组织所表达的全部蛋白质成分,蛋白质组学是对不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式、功能机理、调节控制以及蛋白质群体内相互作用,为临床诊断、病理研究、药物筛选、药物开发、新陈代谢途径等提供理论依据和基础。 蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式(修饰形式)、结构、功能和相互作用方式等。它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性,复杂性,低表达蛋白质难以检测等,应该明确其研究的艰难性。总体上研究可以分为两个方面:对蛋白质表达模式(或蛋白质组成)研究,对蛋白质功能模式(目前集中在蛋白质相互作用网络关系)研究。对蛋白质组研究可以提供如下信息:从基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后被修饰的程度等。由于蛋白质数目小于基因组中开放阅读框(ORF, open reading frame)数目,因此提出功能蛋白质组学(functional proteomics),功能蛋白质指在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质,只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次,是细胞内与某个功能有关或某种条件下的一群蛋白质。对蛋白质组成分析鉴定,要求对蛋白质进行表征化,即分离、鉴定图谱化,包括两个步骤:蛋白质分离和鉴定。双向凝胶电泳(2-DGE)和质谱(MS)是主要的技术。近年来,有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳(two-dimensional polyacrylamide gel electrophoresis,2-D PAGE);蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三大关键是:双向凝胶电泳技术、质谱鉴定、计算机图像数据处理与蛋白质数据库。5与基因组学相关学科诞生随着基因组学研究的不断深入,人类有望揭示生命物质世界的各种前所未知的规律,完全揭开生命之谜,进而驾驶生命,使之为人类的社会经济服务。基因组研究和其它学科研究交叉,促进一些学科诞生,如营养基因组学(nutritional genomics),环境基因组学(environmental genomics),药物基因组学(phamarcogenomics),病理基因组学(pathogenomics),生殖基因组学(reproductive genomics),群体基因组学(population genomics)等。其中,生物信息学正成为备受关注的新型产业的支撑点。生物信息学是以生物大分子为研究,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质,以计算机为工具,研究各种学科交叉的生物信息学的方法,找出其规律性,进而发展出适合它的各种软件,对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括:序列对比,基因识别和DNA序列分析,蛋白质结构预测,分子进化,数据库中知识发现(Knowledge Discovery in Database, KDD)。这一领域的重大科学问题有:继续进行数据库的建立和优化;研究数据库的新理论、新技术、新软件;进行若干重要算法的比较分析;进行人类基因组的信息结构分析;从生物信息数据出发开展遗传密码起源和生物进化研究;培养生物信息专业人员,建立国家生物医学数据库和服务系统[5]。20世纪末生物学数据的大量积累将导致新的理论发现或重大科学发现。生物信息学是基于数据库与知识发现的研究,对生命科学带来革命性的变化,对医药、卫生、食品、农业等产业产生巨大的影响。邹承鲁教授在谈论21世纪的生命科学时讲到,生物学在20世纪已取得巨大的发展,数理科学广泛而又深刻地深入生物学的结果在新的高度上揭示了生命的奥妙,全面改变了生物学的面貌。生物学不仅是当前自然科学发展的热点,进入21世纪后将仍然如此。科学家称21世纪是信息时代。生物科学和信息科学结合,无疑是多个学科发展的必然结果。

因为基因的破译是一个繁琐的工程,而且精密度非常高,所以说这是世界上最复杂的谜题之一。

棉花基因组学研究论文

转自:

基因组(Denovo sequencing),即基因组从头测序,指在不依赖参考基因组的情况下绘制该物种的全基因组序列图谱,从而获取该物种的全部遗传信息。高连续性基因组的获得,对后续功能基因定位,结构变异检测具有重要的意义。结合近几年的文章我们不难发现,基因组研究主要以下面几种方向为出发点开展: 1)大型/多倍体/超复杂物种基因组破译,技术创新改革; 2)0 Gap基因组/单体型基因组构建,序列优化打磨; 3)未知基因组破译联合多组学分析,经济价值挖掘; 4)品种泛基因组构建解析功能变异,覆盖多样表型; 5)科属水平谱系基因组构建与分析,探索进化功能; 6)多种基因组联合多组学比对剖析,解析性状特征。 ... ...

前5种好理解,第6种方向能做什么呢?其实我们想要了解一个物种,往往单一基因组难以完整解析,例如

等等棘手但是却又热门的研究话题。

接下来我将通过百迈客最近三篇动植物上的成功案例带大家看看,如何通过数个材料基因组结合多组学的手段解析性状特征。

合作单位:中科院南海海洋研究所 发表期刊:Science Advances 影响因子:14.131 发表时间:2021.08 研究材料:Denovo:雌性与雄性草海龙(Phyllopteryx taeniolatus);雌性与雄性绿海龙(Syngnathoides biaculeatus) 个体重测序:2只雄性草海龙 RNA-seq:脑、眼、鳃、肝、肠、肌肉、鳍、皮肤和附叶 测序方案

Denovo:雌性、雄性草海龙与雄性绿海龙PacBio平台;雌性绿海龙Nanopore平台,雌性、雄性草海龙与雄性绿海龙进行Hi-C测序。三代测序技术对应测序数据如下表所示: 个体重测序:~30X PacBio

草海龙最终组装大小为~659 Mb(♂)与 ~663Mb(♀), contig N50分别为10.0 Mb与12.1 Mb。绿海龙分别组装~637 Mb(♂)与~648 Mb(♀),contig N50分别为18.0Mb与21.0 Mb。4个基因组BUSCO评估显示范围在94.00- 94.40%。并分别在草海龙和绿海龙中确定了31个和33个发生 扩张的基因家族 。通过19条鳍鱼类全基因组数据集进行 系统发育分析 ,明确草海龙与绿海龙在系统发育地位上属于海龙亚科(Syngnathinae)的姊妹群,并于 27.3 百万年前 左右发生分化。

草海龙的头部、颈部、腹部、背部和尾部区域有叶子状的附属物,可以与周围环境相融合,使草海龙以完美拟态隐匿于海草床中。这些结构是该物种的一种适应性进化产物,主要由骨基质和富含胶原纤维的结缔组织组成。

通过转录组学分析,发现其表达基因(如msx,dlx,fgf)主要从皮肤和鳍等器官募集而来,暗示了相关基因对新器官产生和维持的重要作用。而“附叶”与鳍相比缺乏肢体发育特异性的hox基因。草海龙的附叶在捕食者的袭击中经常受到损伤,为了研究相关机制,作者通过转录组分析研究发现在其附叶中炎症和损伤修复相关基因表现出高表达水平, 说明这些基因可能与其附叶的快速愈合和再生能力相关 。 同时草海龙特异性扩张的MHC I基因也在附叶中显著高表达,能为其提供额外的免疫保护。

通过雄性和雌性叶海龙Illumina reads正反比对雄性和雌性的全基因组序列,来确定叶海龙中假定的性染色体和性别基因座。结果显示 Chr4上的一个~47-kb区域仅在雄性中存在 , 且reads覆盖度为Chr4平均值的一半,该片段经Hi-C互作分析结果支持。

注释及比较分析发现草海龙和绿海龙的性别决定基因均为amhr2的雄性特异性拷贝amhr2y,但两者的基因座不相同。系统发育分析表明,amhr2y起源于它们最近共同祖先的重复事件,而黄鲈amhr2y是从其谱系中的独立重复事件进化而来。研究发现amhr2y比amhr2受到的选择压力更强,其整体结构与amhr2相似。

草海龙与其他海龙科物种一样具有缺乏牙齿的管状吻。 研究表明,大部分富含P/Q的分泌型钙结合磷蛋白(SCPP)基因的缺失可能是导致syngnathids无牙的原因。 为了验证海龙科中因 假基因化丧失功能 这一点,作者使用CRISPR-Cas9技术构建了两个斑马鱼scpp5突变系,发现scpp5-/-突变体斑马鱼牙齿的数量减少且颌骨中存在用于附着牙齿的凹坑。

研究结论 该研究通过雌雄性海龙基因组的破译,结合 重测序分析、转录分析、比较基因组分析 等研究揭示了海龙科物种性别决定基因的产生和演化历程,为海洋鱼类的环境适应性进化研究提供了重要理论依据。

合作单位:浙江大学 发表期刊:Plant Biotechnology Journal 影响因子:9.801 发表时间:2021.08 研究材料:Denovo:Brassica juncea菜用芥菜T84-66、油用芥菜AU213; 个体重测序:12个油菜品种; 遗传进化:183份油用与菜用芥菜; 测序方案: Denovo:菜用芥菜分别146 Gb Illumina(~150X)+ 251 Gb PacBio( 200X)+Hi-C( 200X );油用芥菜147 Gb Illumina(~150X)+205 Gb PacBio( 200X)+Hi-C( 200X ) 个体重测序:~20X Nanopore 遗传进化与GWAS:~10X illumina

研究内容

在着丝粒附近的异染色质状态中具有相对较低的基因表达模式。

系统地鉴定了T84-66 和AU213的A和B亚基因组中的全基因组单核苷酸多态性(SNP)、插入/缺失(InDels)和存在/缺失变异(PAV)。在T84-66和AU213之间的A和B亚基因组中鉴定了24,768个PAV(> 100 bp), 其中3,634个PAV导致6,425个基因的变异。随机选择了几个PAV并使用PCR来确保这些PAV的保真度。其中一些基因组变异位于基因区域内,预计会影响T84-66和AU213作物中涉及生物和非生物胁迫的基因功能。

为了破译芥菜基因组菜用和油用品种之间SVs衍生的功能差异,作者基于Nanopore重测序技术,系统比较了菜用和油用芥菜群体基因组结构变异(structural variation,SV) ,挖掘到包括1, 354个高可信度的插入、缺失、重复、倒位、易位等变异。其中两个重要的基因位点TGA1和HSP20在ChrA06和ChrB08,可能与B.juncea基因组的菜用与油用品种之间对生物和生物应力的反应的自然变异有关。 这些变异研究为菜用芥和油用芥两个典型分化群体的演化提供了基因组变异基础。

使用T84-66作为参考基因组,对183份油用与菜用芥菜进行进化关系分析,并通过SGS-GWAS(scored genomic SNPs based GWAS)基因定位,在A02和A09中发现了两个参与控制芥菜硫苷(GSL)积累变异的关键遗传位,并首次发现A09中的MYB28与B. jucnea中GSL的积累有关。经过进一步研究并同过ONT验证发现,MYB28基因的拷贝数变异(copy number variations,CNVs)是导致芥菜种群中硫苷积累差异的原因,该基因的拷贝数变异在低硫苷芥菜群体中普遍存在。

研究小结 该研究将为多倍基因组进化研究和精确基因组选择研究提供重要研究信息,对芥菜风味品质和油脂质量的分子遗传改良具有重要科学和应用价值。

合作单位:华中农业大学 发表期刊:Molecular Biology And Evolution 影响因子:16.241 发表时间:2021.05 研究材料:基因组、Hi-C:圆叶棉G. rotundifolium(K2)、亚洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鲜叶片

测序方案 denovo:illumina K2、A2和D5分别108×, 118×, 132×;Nanopore K2、A2和D5分别124×, 131×, 167× Hi-C挂载:6碱基酶HindⅢ;K2、A2和D5分辨率分别为20kb、20kb、10kb Hi-C互作:4碱基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb

研究内容

利用Nanopore测序技术组装了圆叶棉( K2 )基因组,组装大小为2.44Gb(contigN50 = 5.33 Mb);提升了亚洲棉( A2 )和雷蒙德氏棉( D5 )的基因组,组装大小分别为1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C挂载率均超过99%,BUSCO结果分别为92.5%, 93.9%,及95.4%。

重复序列注释表明,相对于D5,K2和A2中棉种 特异的反转录转座子扩增是造成这三个基因组大小三倍变化的原因,特别是Gypsy和DIRS类型。全长转座子插入时间分析表明K2基因组中转座子插入最为古老,A2基因组有更多新的转座子。

比较基因组分析表明,A2和K2基因组在Chr01与Chr02染色体间存在一个大的易位;K2和D5基因组在Chr13与Chr05染色体间存在一个大的易位。三个棉种在57-71百万年前存在一次共同的全基因组复制事件,并在5.1-5.4百万年前发生物种分化,基因共线性分析表明每个基因组大约有15%特异的基因家族。

通过HiC染色质互作数据揭示三个棉种染色体大小的规律,A2与K2比D5多了约7000个基因,三个基因组中17%的共线性同源基因表现为A/B区室的染色质状态改变,这与活跃的转座子扩增相关。

K2与A2及与D5相比更多的倾向于A向B的转化。K2和A2中有更多的基因处于A compartment,D5中有更多的基因处于B compartment。

大约60%的拓扑结构域(TAD)在三个基因组中发生了重新组织,K2基因组中有更多特异的TAD。基于边界TE覆盖度,边界TE表达以及TE插入时间分析,发现K2不保守的TAD边界存在特异的和较新的转座子(物种分化后爆发的TE)插入。这些结果表明最近在K2和A2基因组中表达的TEs的扩增可能有助于在三个物种分化后形成谱系特异性TAD边界。基于这些结果,作者提出了三个棉种分化过程中,基因组扩张-转座子扩增介导的A/B区室转换和TAD重组的进化模型。

研究小结

本次研究首次公布了棉属中二倍体圆叶棉基因组,并对亚洲棉和雷蒙德氏棉基因组进行了升级,解析了转座子活动驱动的基因组大小进化特征,从转座子扩增和染色质空间结构角度为棉花物种进化提供新的见解,为植物中转座子活动介导的转录调控进化研究提供参考。

动植物基因组De novo测序分析也叫从头测序分析,指不依赖于任何参考序列信息就可对某动植物进行测序分析,使用最新的生物信息学方法进行序列拼接获得某物种的基因组序列图谱,并进行基因组结构注释、功能注释、比较基因组学分析等一系列的后续分析。三代测序技术(以PacBio和Nanopore为代表)具有读长长的特点,自2015年开始在动植物基因组De novo中初露锋芒,已延用至今。该类型测序分析结果可以广泛应用于农林鱼牧医药及海洋等各个方面的研究。图1 不同测序技术读长,准确性及基因组连续性评估三代测序技术原理PacBio测序原理采用边合成边测序的方式,以其中一条DNA链为模板,通过DNA聚合酶合成另外一条链,进一步将荧光信号转变为碱基信号。同时PacBio已升级了CCS测序模式以获得长读长的高保真(HiFi)15 kb reads,由此提升基因组组装的准确性。图2 三代PacBio测序原理Nanopore测序原理当单链DNA分子穿过纳米孔时,相对于每个核苷酸,都会获得不同的电流信号。记录每个孔的离子电流变化,并基于马尔可夫模型或递归神经网络的方法将其转换为碱基序列。除此之外,Ultra-long reads (ULRs) 是ONT平台的另一重要特征,并具有促进大型基因组组装的潜力。信息分析内容De novo研究 研究内容基因组组装 多软件组装、组装结果评估基因预测与注释 编码基因预测;重复序列注释和转座元件分类;非编码RNA注释;假基因注释等Hi-C辅助基因组组装 有效数据评估;Contig聚类、排序及定向分析;挂载结果评估   生物学问题解析   比较基因组学研究基因家族聚类;系统发育树的构建;基因家族扩张与收缩分析;物种分化时间推算;LTR形成时间估算;全基因组复制事件;选择压力分析特定生物学问题剖析 结合组学研究方法,深入对某物种生物学问题进行解析草莓基因家族聚类分析薏苡全基因组复制事件分析开心果系统进化树与基因家族收缩扩张分析陆地棉亚基因组共线性分析技术服务流程样品寄送建库测序数据分析出具报告售后答疑产品优势公司成立于2009年,深耕基因组测序领域11年之久,长久以来致力于成为精准的基因组组装专家;拥有世界在最主流的三代测序平台(PacBio测序全平台和Nanopore测序全平台),具有丰厚的双平台组装及上万种物种基因组组装经验。Hi-C染色质构象捕获技术文库有效数据比例高,挂载效率高达99%,多倍体物种研究经验丰富,与三代基因组组装相结合,获得染色体水平基因组的同事进一步提升基因组组装质量。拥有自主研发的领先的基因组测序和分析技术,目前已经获得23项发明专利,超过150多项核心软件著作权。项目经验示例合作文章案例案例1以更新的亚洲棉A基因组为基础的243份二倍体棉的重要农艺性状的研究RESEQUENCING OF 243 DIPLOID COTTON ACCESSIONS BASED ON AN UPDATED A GENOME IDENTIFIES THE GENETIC BASIS OF KEY AGRONOMIC TRAITS期刊:Nature Genetics影响因子:27.125发表单位:中国农业科学院棉花研究所、北京百迈客生物科技有限公司等发表年份:2018年5月研究背景:棉花是研究植物多倍化的有价值的资源。亚洲棉(Gossypium arboreum)和草棉(Gossypium herbaceum)的祖先是现代栽培异源四倍体棉花A亚基因组的供体。 本研究中,利用了三代PacBio和Hi-C技术,重新组装了高质量的亚洲棉基因组,分析了243份二倍体棉花种质的群体结构和基因组分化趋势,同时确定了一些有助于棉花皮棉产量遗传改良的候选基因位点。研究结果:1、亚洲棉三代基因组组装:利用三代测序和Hi-C相结合的方法进行亚洲棉基因组组装。共计获得了142.54 Gb ,组装1.71 Gb亚洲棉基因组,Contig N50=1.1 Mb,最长的Contig为12.37 Mb。利用Hi-C技术将组装的1573 Mb的数据定位到13条染色体上,与已经发表的基因组相比,当Hi-C数据比对到更新的基因组后,对角线外的不一致性明显减少(图1 a-b)图1 HI-C数据在两版亚洲棉基因组上的比对2、二倍体棉花群体遗传进化分析:对230份亚洲棉和13份草棉重测序,进行基因组比对、系统发育树、群体结构分析、PCA、LD和选择性清除分析得出亚洲棉和草棉(A)与雷蒙德氏棉同时进行了分化;亚洲棉起源于中国南部,随后被引入长江和黄河地区,大多数具有驯化相关特性的种质都经历了地理隔离(图2)。图2 二倍体棉群体进化和群体结构分析3、亚洲棉的全基因组关联分析(GWAS):对来自不同环境下的11个重要性状进行全基因组关联分析,鉴定了亚洲棉11个重要农艺性状的98个显著关联位点,GaKASIII的非同义替换(半胱氨酸/精氨酸替换)使得棉籽中的脂肪酸组成(C16:0和C16:1)发生了变化;发现棉花枯萎病抗性与GaGSTF9基因的表达激活相关。选择了亚洲棉种质中的158份有绒毛和57份无绒毛材料进行GWAS关联分析,发现与毛状体和纤维发育有关信息(图3)。图3 二倍体棉群体进化和群体结构分析研究结论:利用三代测序+Hi-C技术完成了亚洲棉基因组的重新组装,将基因组组装指标从72 Kb提升到1.1 Mb,为亚洲棉后续的群体遗传学等相关研究奠定了基础;通过群体遗传进化等相关分析,发现亚洲棉和草棉(A型)与雷蒙德氏棉(D型)同时进行了分化,并证明了亚洲棉起源于中国南部,随后被引入长江和黄河地区;整合GWAS与QTL等分析方法,对亚洲棉脂肪酸含量,抗病性及棉绒生长发育相关基因进行定位,并进行相关功能验证,促进了亚洲棉复杂农艺性状的改良。案例2、二倍体、野生和栽培四倍体花生比较基因组分析揭示亚基因组不对称进化和改良COMPARISON OF ARACHIS MONTICOLA WITH DIPLOID AND CULTIVATED TETRAPLOID GENOMES REVEALS ASYMMETRIC SUBGENOME EVOLUTION AND IMPROVEMENT OF PEANUT期刊:Advanced Science影响因子:15.804发表单位:河南农业大学、北京百迈客生物科技有限公司等发表年份:2019年11月研究背景:花生作为我国重要的经济作物,是提供重要的蛋白和油料的基础。花生属一共包括30个二倍体品种,1个异源四倍体野生花生(A. monticola)和1个栽培花生(A. hypogaea)。作为栽培花生农艺性状改良的重要野生资源供体,野生四倍体花生一直是国内外学者的研究热点。研究中对花生属唯一的野生异源四倍体花生Arachis monticola基因组进行了研究,

2014年6月,在线出版的《自然-遗传》杂志全面报道了中国科学家在解析亚洲棉基因组方面取得的最新进展。 中国科学家解析了全长1700兆碱基对的亚洲棉基因组,其中包含41330个蛋白编码基因,基因组大部分(68.5%)由重复序列组成,是到目前为止已测序的双子叶植物中重复序列比例最高的物种。通过与之前(Wang et al., 2012)由同一团队完成的雷蒙德氏棉基因组(D基因组)的比较,发现A和D基因组在距今约5百万年(2-13百万年)之前从同一祖先分化而来,二者的基因数目和基因序列都极为相近,染色体水平上也保留了高度的共线性,但由于A基因组发生过多次大规模的反转座子插入事件,导致其基因组膨胀至超过D基因组的两倍。上述研究结果将对人类认识棉花基因组的复杂性和棉属物种进化的多样性产生深远的影响。 通过转录组分析和大规模基因比较,研究团队首次在不同的棉花基因组中发现乙烯信号分子发挥了截然相反的作用。D基因组过多的乙烯合成抑制了棉纤维的发育,而A基因组乙烯的不足导致棉纤维不能充分伸长。抗病基因家族研究显示,相对于其近缘种可可,这些基因在对黄萎病有免疫力的D基因组中发生了显著扩张,在A基因组中却发生了显著收缩。此外,大量抗病基因只在D基因组中受黄萎病菌诱导迅速表达,导致A基因组不能在早期有效响应黄萎病菌侵染,几乎完全丧失抗病性。以上研究对于提高棉花产量和纤维品质,增强抗病性都有重要意义。

小鼠基因组研究论文

对于普通的转基因,表达的区域将取决于启动子。如果选择全身表达的启动子,如Rosa26, CAG等,将得到全身表达的转基因小鼠;如果选择一些组织特异性表达的基因的启动子,将得到组织特异性表达的转基因小鼠,如在AP2的promoter启 动下进行表达,会得到脂肪组织特异表达的转基因小鼠。需要特别说明的是,这种转基因的策略是将转基因片段直接注射到小鼠的受精卵中,转基因片段将会在小鼠基因组中进行随机插入,因为是完全随机的,有 可能会插入到一些抑制区导致转入的基因不表达,也有可能插入到一些增强区导致转入的基因高表达。通过原核注射的方法得到的第一代转基因小鼠称为 founder(首建鼠),由于上述随机性,每一只founder都是不一样的,以每一只founder起源的品系称为line,不同的line 之间的表达可能会有差异。

从简单地剪切致病基因,到开发出不再传播疾病的工程动物,基因编辑技术已经释放出巨大的潜力。随着研究的深入,科学界还发现,除了编辑具有遗传讯息的DNA片段,编辑RNA可以在不改变基因组的情况下,帮助调整基因表达方式,此外,RNA的寿命是相对短暂的,这也意味着它的变化是可以逆转的,从而避免基因工程中的巨大风险。

2017年10月,来自Broad研究所的张锋研究团队在《自然》期刊上发表了题为“RNA targeting with CRISPR-Cas13”的文章,首次将CRISPR-Cas13系统公之于众,证实了CRISPR-Cas13可以靶向哺乳动物细胞中的RNA。仅仅时隔三周,又一篇名为“RNA editing with CRISPR-Cas13”的力作发表于《科学》期刊。在该研究中,张锋研究团队再次展示了这一RNA编辑系统,能有效地对RNA中的腺嘌呤进行编辑。

在CRISPR出现之前,RNAi是调节基因表达的理想方法。但是Cas13a酶一大优势在于更强的特异性,而且这种本身来自细菌的系统对哺乳动物细胞来说,并不是内源性的,因此不太可能干扰细胞中天然的转录。相反,RNAi利用内源性机制进行基因敲除,对本身的影响较大。但CRISPR-Cas13系统还有一个重要的问题,Cas13a酶本质上是一种相对较大的蛋白质,因此很难被包装到靶组织中,这也可能成为RNA编辑技术临床应用的一大障碍。

2018年3月16日,一项发表在《细胞》期刊的重磅成果为RNA编辑技术带来一大步飞跃,来自美国Salk研究所的科学家利用全新的CRISPR家族酶扩展了RNA编辑能力,并将这个新系统命名为“CasRx”。

CasRx(品红色)在人类细胞核中靶向RNA(灰色),Salk研究所

“生物工程师就像自然界的侦探一样,在DNA模式中寻找线索来帮助解决遗传疾病。CRISPR彻底改变了基因工程,我们希望将编辑工具从DNA扩展到RNA。”研究领导者Patrick Hsu博士表示,“RNA信息是许多生物过程的关键介质。在许多疾病中,这些RNA信息失去了平衡,因此直接靶向RNA的技术将成为DNA编辑的重要补充。”

除了高效性且无明显脱靶效应,新系统的一个关键特征是其依赖于一种比以前研究中物理尺寸更小的酶。 这对RNA编辑技术至关重要,这使得该编辑工具能够更容易被包装到病毒载体,并进入细胞进行RNA编辑。来自东京大学的科学家Hiroshi Nishimasu并未参与这项研究,他表示:“在这项研究中,研究人员发现了一种较Cas13d更加‘紧凑’的酶CasRx。从基础研究到治疗应用,我认为CasRx将成为非常有用的工具。”

此外,在这项研究中,研究人员还展示了利用这种新型RNA编辑系统来纠正RNA过程的能力。他们将CasRx包装到病毒载体中,并将其递送到利用额颞叶痴呆(FTD)患者干细胞中培养的神经细胞,最终使tau蛋白水平恢复到健康水平上,有效率达到80%。

Patrick Hsu博士最后说道:“基因编辑技术通过对DNA的切割带来基因序列的改变。在经过基因编辑的细胞中,其效果是永久的。虽然基因编辑技术能够很好地将基因完全关闭,但对调节基因的表达上并不那么优秀。展望未来,这一最新工具将在RNA生物学研究中发挥重要作用,并有望在未来凭借该技术对RNA相关疾病进行治疗。”

该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合,通过尾静脉注射质粒的方式,将CasRx系统和靶向Pten基因的sgRNA导入到小鼠肝脏细胞中,成功在小鼠肝脏中实现了Pten的高效沉默。

3月18日,《蛋白质与细胞》期刊在线发表了《Cas13d介导的肝脏基因表达下调对代谢功能的调控》的研究论文,该研究由中科院脑科学与智能技术卓越创新中心(神经科学研究所)、上海脑科学与类脑研究中心、神经科学国家重点实验室杨辉研究组和上海科技大学生命科学与技术学院黄鹏羽研究组合作完成。该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合,通过尾静脉注射质粒的方式,将CasRx系统和靶向Pten基因的sgRNA导入到小鼠肝脏细胞中,成功在小鼠肝脏中实现了Pten的高效沉默,证实了CasRx系统在成体动物体内也具有靶向沉默RNA的活性,通过增强下游蛋白AKT的磷酸化,影响了糖脂代谢相关基因的表达。同时,利用AAV递送CasRx和靶向Pscsk9的sgRNA到小鼠肝脏,有效降低了肝脏中PCSK9的蛋白表达,以及小鼠血液中的胆固醇水平。这为治疗后天性的代谢疾病提供了新方案。

同时,杨辉研究组与上海交通大学医学院附属上海第一人民医院孙晓东研究组合作,也探究了CasRx预防严重的眼部疾病——年龄相关性黄斑变性(AMD)的可能性,研究人员发现在体内使用CasRx敲低Vegfa的mRNA可以显著减少AMD小鼠模型中脉络膜新血管形成(CNV)的面积,验证了将RNA靶向的CRISPR系统用于治疗应用的潜力。相关研究论文《CasRx介导的RNA靶向策略可防止年龄相关的黄斑变性的小鼠模型中的脉络膜新生血管形成》3月3日在《国家科学评论》在线发表。

近年来,CRISPR/Cas9技术因其强大且便捷的DNA编辑能力而受到广泛关注。2016年,张锋实验室发现了一种新的Cas蛋白Cas13a,可以靶向RNA进行切割。之后人们又陆续发现了靶向RNA的Cas13b, Cas13c。由于Cas13家族蛋白靶向RNA的特点,理论上在一些特定疾病的检测和治疗上具有独特优势,因而成为近年来的研究热点。2018年,加州大学伯克利分校Patrick Hsu实验室发现了Cas13d家族。他们发现与RNA干扰技术相比,Cas13d介导的基因沉默具有更高的特异性(与数百个shRNA脱靶相比,Cas13d没有脱靶)和敲除效率(Cas13d达到96%,shRNA达到65%)。而与Cas9介导的基因敲除技术相比,Cas13d介导的基因沉默不会改变基因组DNA,因此这种基因沉默是可逆的,从而对一些后天性疾病(如因不良生活习惯导致的高血脂等后天代谢性疾病)的治疗更有优势。其中Cas13d家族的CasRx蛋白由于体积小,效率高,被认为是在未来应用中最具有优势的Cas13蛋白。

此前的工作都在细胞水平证明了CasRx的高效性和特异性,杨辉研究组的这两篇文章则更进一步在动物体内证明了CasRx的活性,为临床提供了可能性。为证明CasRx在动物体内的活性,研究人员分别针对目的基因进行了sgRNA的体外筛选,然后采用尾静脉注射敲低Pten的质粒、尾静脉注射敲低Pcsk9的AAV8病毒、眼部注射敲低Vegfa的AAV病毒。对注射后的小鼠进行相应分析,分别得到Pten基因下调及其下游蛋白AKT的磷酸化上调,Pcsk9下调造成血清胆固醇下调;Vegfa下调显著减少AMD小鼠模型中脉络膜新血管形成(CNV)的面积。

2020年3月18日,《蛋白质与细胞》期刊在线发表了《Cas13d介导的肝脏基因表达下调对代谢功能的调控》的研究论文,该研究由中科院脑科学与智能技术卓越创新中心(神经科学研究所)、上海脑科学与类脑研究中心、神经科学国家重点实验室杨辉研究组和上海科技大学生命科学与技术学院黄鹏羽研究组合作完成。该研究探索了Cas13d家族蛋白CasRx敲低目的基因的最佳sgRNA组合,通过尾静脉注射质粒的方式,将CasRx系统和靶向 Pten 基因的sgRNA导入到小鼠肝脏细胞中,成功在小鼠肝脏中实现了 Pten 的高效沉默, 证实了CasRx系统在成体动物体内也具有靶向沉默RNA的活性, 通过增强下游蛋白AKT的磷酸化,影响了糖脂代谢相关基因的表达。同时,利用AAV递送CasRx和靶向 Pscsk9 的sgRNA到小鼠肝脏, 有效降低了肝脏中PCSK9的蛋白表达,以及小鼠血液中的胆固醇水平 。这为治疗后天性的代谢疾病提供了新方案。

同时,杨辉研究组与上海交通大学医学院附属上海第一人民医院孙晓东研究组合作,也 探究了CasRx预防严重的眼部疾病——年龄相关性黄斑变性(AMD)的可能性,研究人员发现在体内使用CasRx敲低 Vegfa的mRNA可以显著减少AMD小鼠模型中脉络膜新血管形成(CNV)的面积**,验证了将RNA靶向的CRISPR系统用于治疗应用的潜力。相关研究论文《CasRx介导的RNA靶向策略可防止年龄相关的黄斑变性的小鼠模型中的脉络膜新生血管形成》3月3日在《国家科学评论》在线发表。

近年来,CRISPR/Cas9技术因其强大且便捷的DNA编辑能力而受到广泛关注。2016年,张锋实验室发现了一种新的Cas蛋白Cas13a,可以靶向RNA进行切割。之后人们又陆续发现了靶向RNA的Cas13b, Cas13c。由于Cas13家族蛋白靶向RNA的特点,理论上在一些特定疾病的检测和治疗上具有独特优势,因而成为近年来的研究热点。2018年,加州大学伯克利分校Patrick Hsu实验室发现了Cas13d家族。他们发现与RNA干扰技术相比,Cas13d介导的基因沉默具有更高的特异性(与数百个shRNA脱靶相比, Cas13d没有脱靶)和敲除效率(Cas13d达到96% ,shRNA达到65%)。而与Cas9介导的基因敲除技术相比, Cas13d介导的基因沉默不会改变基因组DNA,因此这种基因沉默是可逆的 ,从而对一些后天性疾病(如因不良生活习惯导致的高血脂等后天代谢性疾病)的治疗更有优势。其中Cas13d家族的CasRx蛋白由于体积小,效率高,被认为是在未来应用中最具有优势的Cas13蛋白。

此前的工作都在细胞水平证明了CasRx的高效性和特异性,杨辉研究组的这两篇文章则更进一步在动物体内证明了CasRx的活性,为临床提供了可能性 。为证明CasRx在动物体内的活性,研究人员分别针对目的基因进行了sgRNA的体外筛选,然后采用尾静脉注射敲低 Pten 的质粒、尾静脉注射敲低 Pcsk9 的AAV8病毒、眼部注射敲低 Vegfa 的AAV病毒。对注射后的小鼠进行相应分析,分别得到 Pten 基因下调及其下游蛋白AKT的磷酸化上调, Pcsk9 下调造成血清胆固醇下调; Vegfa 下调显著减少AMD小鼠模型中脉络膜新血管形成(CNV)的面积。

图1 CasRx介导的 Pten 体内体外的下调( Protein & Cell )

A.质粒示意图;B.N2a细胞中 Pten 的下调;C.Western检测PTEN及AKT的表达; D.CasRx与shRNA脱靶比较;E.尾静脉注射质粒示意图;F.G.H.免疫荧光,qPCR,western分别检测 Pten 及p-AKT的表达

图2 血清胆固醇的调节以及 Pcsk9 的可逆调控( Protein & Cell )

A.针对 Pcsk9 的AAV8病毒注射示意图;B.肝组织中 Pcsk9 的表达量;C.血清 PCSK9 的表达量;D.血清胆固醇水平;E.F.血清ALT和AST的测定;G.可逆调节注射示意图; H. Pcsk9 的动态调控。

图3 AAV介导CasRx减少了AMD小鼠模型中CNV的面积(National Science Review)

A.小鼠和人序列比较以及sgRNA示意图;B.C.在293T和N2a细胞中敲低 Vegfa ;D.VEGFA蛋白的表达;E.AAV病毒质粒示意图;F.实验流程图;G.CasRx的mRNA表达水平;H.I.激光烧伤之前或之后7天的 Vegfa mRNA水平;J.CNV诱导3天后的VEGFA蛋白水平;K.激光烧伤7天后,用PBS或AAV-CasRx- Vegfa 注射的代表性CNV图像;L.M.CNV面积统计。

2020 年 4 月 8 日, Cell 期刊在线发表了题为 《Glia-to-Neuron Conversion by CRISPR-CasRx Alleviates Symptoms of Neurological Disease in Mice》 的研究论文,该研究由中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)、上海脑科学与类脑研究中心、神经科学国家重点实验室 杨辉 研究组完成。

该项研究通过运用最新开发的 RNA 靶向 CRISPR 系统 CasRx 特异性地在视网膜穆勒胶质细胞中敲低 Ptbp1 基因的表达,首次在成体中实现了视神经节细胞的再生,并且恢复了永久性视力损伤模型小鼠的视力。同时,该研究还证明了这项技术可以非常高效且特异地将纹状体内的星形胶质细胞转分化成多巴胺神经元,并且基本消除了帕金森疾病的症状。该研究将为未来众多神经退行性疾病的治疗提供一个新的途径。

人类的神经系统包含成百上千种不同类型的神经元细胞。在成熟的神经系统中,神经元一般不会再生,一旦死亡,就是永久性的。神经元的死亡会导致不同的神经退行性疾病,常见的有阿尔兹海默症和帕金森症。此类疾病的病因尚不明确且没有根治的方法,因此对人类的健康造成巨大威胁。据统计,目前全球大约有 1 亿多的人患有神经退行性疾病,而且随着老龄化的加剧,神经退行性疾病患者数量也将逐渐增多。

在常见的神经性疾病中,视神经节细胞死亡导致的永久性失明和多巴胺神经元死亡导致的帕金森疾病是尤为特殊的两类,它们都是由于特殊类型的神经元死亡导致。我们之所以能看到外界绚烂多彩的世界,是因为我们的眼睛和大脑中存在一套完整的视觉通路,而连接眼睛和大脑的神经元就是视神经节细胞。

作为眼睛和大脑的唯一一座桥梁,视神经节细胞对外界的不良刺激非常敏感。研究发现很多眼疾都可以导致视神经节细胞的死亡,急性的如缺血性视网膜病,慢性的如青光眼。视神经节细胞一旦死亡就会导致永久性失明。据统计,仅青光眼致盲的人数在全球就超过一千万人。

帕金森疾病是一种常见的老年神经退行性疾病。它的发生是由于脑内黑质区域中一种叫做多巴胺神经元的死亡,从而导致黑质多巴胺神经元不能通过黑质-纹状体通路将多巴胺运输到大脑的另一个区域纹状体。目前,全球有将近一千万人患有此病,我国尤为严重,占了大约一半的病人。 如何在成体中再生出以上两种特异类型的神经元,一直是全世界众多科学家努力的方向。

该研究中,研究人员首先在体外细胞系中筛选了高效抑制 Ptbp1 表达的 gRNA,设计了特异性标记穆勒胶质细胞和在穆勒胶质细胞中表达 CasRx 的系统。所有元件以双质粒系统的形式被包装在 AAV 中并且通过视网膜下注射,特异性地在成年小鼠的穆勒胶质细胞中下调 Ptbp1 基因的表达。

大约一个月后,研究人员在视网膜视神经节细胞层发现了由穆勒胶质细胞转分化而来的视神经节细胞,并且转分化而来的视神经节细胞可以像正常的细胞那样对光刺激产生相应的电信号。

研究人员进一步发现,转分化而来的视神经节细胞可以通过视神经和大脑中正确的脑区建立功能性的联系,并且将视觉信号传输到大脑。在视神经节细胞损伤的小鼠模型中,研究人员发现转分化的视神经细胞可以让永久性视力损伤的小鼠重新建立对光的敏感性。

为进一步发掘 Ptbp1 介导的胶质细胞向神经元转分化的治疗潜能,研究人员证明了该策略还能特异性地将纹状体中的星形胶质细胞非常高效的转分化为多巴胺神经元,并且证明了转分化而来的多巴胺神经元能够展现出和黑质中多巴胺神经元相似的特性。

在行为学测试中,研究人员发现这些转分化而来的多巴胺神经元可以弥补黑质中缺失的多巴胺神经元的功能,从而将帕金森模型小鼠的运动障碍逆转到接近正常小鼠的水平。

需要指出的是,虽然科学家们在实验室里取得了重要进展,但是要将研究成果真正应用于人类疾病的治疗,还有很多工作要做:人类的视神经节细胞能否再生?帕金森患者是否能通过该方法被治愈?这些问题有待全世界的科研工作者共同努力去寻找答案。

(上)CasRx 通过靶向的降解 Ptbp1 mRNA 从而实现 Ptbp1 基因表达的下调。

(中)视网膜下注射 AAV-GFAP-CasRx-Ptbp1 可以特异性的将视网膜穆勒胶质细胞转分化为视神经节细胞,转分化而来视神经节细胞可以和正确的脑区建立功能性的联系,并且提高永久性视力损伤模型小鼠的视力。

(下)在纹状体中注射 AAV-GFAP-CasRx-Ptbp1 可以特异性的将星形胶质细胞转分化为多巴胺神经元,从而基本消除了帕金森疾病模型小鼠的运动症状。

RNA-editing Cas13 enzymes have taken the CRISPR world by storm. Like RNA interference, these enzymes can knock down RNA without altering the genome , but Cas13s have higher on-target specificity. New work from Konermann et al. and Yan et al. describes new Cas13d enzymes that average only 2.8 kb in size and are easy to package in low-capacity vectors! These small, but mighty type VI-D enzymes are the latest tools in the transcriptome engineering toolbox.

Microbial CRISPR diversity is impressive, and researchers are just beginning to tap the wealth of CRISPR possibilities. To identify Cas13d, both groups used very general bioinformatic screens that looked for a CRISPR repeat array near a putative effector nuclease. The Cas13d proteins they identified have little sequence similarity to previously identified Cas13a-c orthologs, but they do include HEPN nuclease domains characteristic of the Cas13 superfamily. Yan et al. proceeded to study orthologs from Eubacterium siraeum (EsCas13d) and Ruminococcus sp. (RspCas13d), while Konermann et al. characterized orthologs from “Anaerobic digester metagenome” (AdmCas13d) and Ruminococcus flavefaciens (nicknamed CasRx), as well as EsCas13d.

Like other Cas13 enzymes, the Cas13d orthologs described in these papers can independently process their own CRISPR arrays into guide RNAs. crRNA cleavage is retained in dCas13d and is thus HEPN-independent. These enzymes also do not require a protospacer flanking sequence, so you can target virtually any RNA sequence ! In bacteria, Cas13d-mediated cleavage promotes collateral cleavage of other RNAs. As with other Cas13s, this collateral cleavage does not occur when Cas13d is expressed in a mammalian system.

Since Cas13d is functionally similar to previously discovered Cas13 enzymes - what makes these orthologs so special? The first property is size - Cas13d enzymes have a median length of ~930aa - making them 17-26% smaller than other Cas13s and a whopping 33% smaller than Cas9! Their small size makes then easy to package in low-capacity vectors like AAV, a popular vector due to its low immunogenicity. But these studies also identified other advantages, including Cas13d-specific regulatory proteins and high targeting efficiency, both of which are described below.

The majority of Type VI-D loci contain accessory proteins with WYL domains (named for the three conserved amino acids in the domain). Yan et al. from Arbor Biotechnologies found that RspCas13d accessory protein RspWYL1 increases both targeted and collateral RNA degradation by RspCas13d. RspWYL1 also increased EsCas13d activity, indicating that WYL domain-containing proteins may be broader regulators of Cas13d activity. This property makes WYL proteins an intriguing counterpart to anti-CRISPR proteins that negatively modulate the activity of Cas enzymes, some of which are also functional in multiple species (read Arbor Biotechnologies' press release about their Cas13d deposit here ).

Not all Cas13d proteins are functional in mammalian cells, but Konermann et al. saw great results with CasRx and AdmCas13d fused to a nuclear localization signal (NLS). In a HEK293 mCherry reporter assay, CasRx and AdmCas13d produced 92% and 87% mCherry protein knockdown measured by flow cytometry, respectively. Cas13d CRISPR array processing is robust, with CasRx and either an unprocessed or processed gRNA array (22 nt spacer with 30 nt direct repeat) mediating potent knockdown. Multiplexing from the CRISPR array yielded >90% knockdown by CasRx for each of four targets, including two mRNAs and two nuclear long non-coding RNAs.

One interesting twist to Cas13d enzymes is their cleavage pattern: EsCas13d produced very similar cleavage products even when guides were tiled across a target RNA, indicating that this enzyme does not cleave at a predictable distance from the targeted region. Konermann et al. show that EsCas13d favors cleavage at uracils, but a more detailed exploration of this cleavage pattern is necessary.

Konermann et al. compared CasRx to multiple RNA regulating methods: small hairpin RNA interference, dCas9-mediated transcriptional inhibition (CRISPRi), and Cas13a/Cas13b RNA knockdown. CasRx was the clear winner with median knockdown of 96% compared to 65% for shRNA, 53% for CRISPRi, and 66-80% for other Cas13a and Cas13b effectors. Like previously characterized Cas13 enzymes, CasRx also displays very high on-target efficiency; where shRNA treatment produced 500-900 significant off-targets, CasRx displayed zero. Unlike Cas9, for which efficiency varies widely across guide RNAs, each guide tested with CasRx yielded >80% knockdown. It seems that CasRx may make it possible to target essentially any RNA in a cell.

Since catalytically dead dCasRx maintains its RNA-binding properties, Konermann et al. tested its ability to manipulate RNA species through exon skipping. Previous CRISPR exon-skipping approaches used two guide RNAs to remove a given exon from the genome, and showed success in models of muscular dystrophy . In this case, Konermann et al. targeted MAPT , the gene encoding dementia-associated tau, delivering dCasRx and a 3-spacer array targeting the MAPT exon 10 splice acceptor and two putative splice enhancers. After AAV-mediated delivery to iPS-derived cortical neurons, dCasRx-mediated exon skipping improved the ratio of pathogenic to non-pathogenic tau by nearly 50%, showing proof-of-concept for pre-clinical and clinical applications of dCasRx.

The identification of Type VI Cas13d enzymes is another win for bioinformatic data mining. As we continue to harness the natural diversity of CRISPR systems, only time will tell how large the genome and transcriptome engineering toolbox will be. It is, however, certain that the impact of CRISPR scientific sharing will continue to grow, and we at Addgene appreciate our depositors for making their tools available to the broader community.

References

Konermann, Silvana, et al. “Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors.” Cell (2018) pii: S0092-8674(18)30207-1. PubMed PMID: 29551272

Yan, Winston X., et al. “Cas13d Is a Compact RNA-Targeting Type VI CRISPR Effector Positively Modulated by a WYL-Domain-Containing Accessory Protein.” Mol Cell. (2018) pii: S1097-2765(18)30173-4. PubMed PMID: 29551514

\1. Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors

\2. CRISPR genetic editing takes another big step forward, targeting RNA

\3. How Editing RNA—Not DNA—Could Cure Disease in the Future

[ https://www.obiosh.com/kyfw/zl/aav/209.html](

基因组学最新研究进展论文

历时22年,研究人员终于从头到尾破译了完整的人类基因组序列。

钛媒体App4月1日消息,据科技日报,全球顶级期刊《Science》(科学)杂志今天凌晨连发6篇论文报告,公布了人类基因组测序的最新进展:国家人类基因组研究中心(NHGRI)组成的端粒到端粒 (T2T) 联盟科学团队,通过新的技术研究出全球第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。

这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”,增加了之前整条染色体上隐藏的DNA片段,破译了缺失的大约2亿个DNA碱基对以及2000多个新基因——占人类基因组的8%。

这篇研究成果意义重大。科研人员揭示的完整人类基因组序列,是世界上最复杂的谜题之一,这一研究使得人类第一次看到最完整的、无间隙的DNA碱基基因序列,对于人类了解基因组变异的全谱,以及某些疾病的遗传贡献至关重要,将会推动与癌症、出生缺陷和衰老相关的研究与科学发展。

同时,这也是《Science》创刊141年来,首次在同一期杂志中连发6篇论文揭示人类基因组研究。

本论文作者,圣路易斯华盛顿大学医学院遗传学家Ting Wang(音译:王庭)表示,此次拥有完整的基因组,一定会改善生物医学研究。“毫无疑问,这是一项重要的成就。”

据中国科学报,人类基因组计划参与者、中国科学院北京基因组研究所研究员于军表示,假如把人类基因组序列比作一辆非常复杂的汽车,那么与20年前完成的人类基因组草图相比,完整的新序列非常于增添了更多零件。

“我们看到了以前从未阅读过的章节,”本论文通讯作者,华盛顿大学霍华德-休斯医学研究所(HHMI)研究员Evan Eichler(艾希勒)表示,这是全行业的一件大事。

Science封面图研究人员到底破译了什么?人类基因组由超过60亿个独立的DNA碱基、大约2-3万个蛋白质编码基因(整个基因仍未有统一答案)组成,与黑猩猩等其他灵长类动物的数量差不多,分布在23对染色体上。为了读取数以万计的基因组,科学家们首先将所有的DNA链切成几百到几千个单位长度的DNA片段。然后用测序机器读取每个片段中的各个碱基,科学家们试图按照正确的顺序组装这些片段,就像拼凑一个复杂的拼图。

2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。

然而,由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。

实际上,核心的挑战在于,基因组的某些区域反复重复相同的碱基。重复的区域包括着丝粒和核糖体DNA等,过去无法按照正确的顺序组装一些被切碎的片段。这就像拥有相同的拼图碎片一样,科学家们不知道哪块碎片在哪里,因此基因组图中留下了很大的空白。

而且大多数细胞包含两个基因组--一个来自父亲,一个来自母亲。当研究人员试图组装所有的片段时,来自父母双方的序列可能混合在一起,掩盖了个体基因组内的实际变异。

如今,研究人员通过新的纳米机器设备与核心技术,实现了新的无间隙版本T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。

这些候选基因大多数是失活的,但其中115个仍然可能表达。团队还在人类基因组中发现了大约200万个额外的变异,其中622个出现在与医学相关的基因中。此外,新序列还纠正了GRCh38中的数千个结构错误。

近端着丝粒染色体的显示图样(来源:论文)

具体而言,新序列填补的空白包括人类5条染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。其中包括在重要的染色体结构中及其周围发现的高度重复的DNA序列,如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。

此外,新序列还揭示了以前未被发现的节段重复,即在基因组中复制的长DNA片段,并揭示了关于着丝粒周围区域的前所未见的细节。这一区域内的变异性可能为人类祖先如何进化提供新证据。

值得一提的是,本研究成果的关键进展,其实是利用了新的技术设备——英国牛津纳米孔技术公司和太平洋生物科学公司制造的快速迭代的基因测序机器。

早在2017年,国家人类基因组研究中心(NHGRI)负责人Adam Phillippy(亚当-菲利皮),以及加州大学圣克鲁兹分校(UCSC)的凯伦-米加意识到,新的纳米孔机器实现了一次准确读取100万个DNA碱基的能力,可以为最终解决基因组难点打开了大门。

大约在同一时间,华盛顿大学霍华德-休斯医学研究所(HHMI)Evan Eichler(艾希勒)领导的科研团队已经证明,使用太平洋生物科学公司的设备技术,可以解决更复杂形式的遗传变异技术。

因此,三人一起创办了端粒到端粒(T2T)联盟,利用全球约100名科学家团队资源,使其加快了研究佳偶。

随后,该团队连续六个月不间断地利用快速迭代的纳米孔基因测序机器,并请来几十位科学家来组装这些基因片段并分析结果。最终利用设备、技术等,实现了长读数测序读数,并将长读测序与牛津纳米孔的数据相结合,准确率超过了99%,填补了全球基因学研究的空白。

一直到2020年夏天,该团队已经拼上了两条染色体。在新冠疫情爆发的期间,团队通过Slack等通讯工具进行远程工作,获得了另外21条染色体,将每个染色体从一端或端粒排序到另一端。而且,科研人员人员还试图组装基因组中最难的区域,即着丝粒中高度重复的DNA序列。

最终,通过长时间的研究与团队合作,该团队成功实现了对每个染色体进行了测序,包含了编码用于制造核糖体的RNA的基因的多个拷贝,总共400个。

2021年6月,这份研究成果首次发表在预印版平台bioRxiv上。经过同行评议等,如今一系列论文登上了《Science》(科学)杂志。

研究人员在会后采访中表示,下一阶段的研究将对不同人的基因组进行测序,以充分掌握人类基因的多样性、作用以及人类与近亲、其它灵长类动物的关系。

年增速超20%,中国百亿基因市场前景广阔

随着生物学技术的不断发展,新的行业层出不穷,本次研究成果所属的中国基因测序行业是一个百亿级市场,拥有广阔的发展前景。

根据千际投行的研究统计数据显示,早在2019年,基因测序所在的全球生物制品行业市场规模就达到了3172亿元,未来五年有望达到万亿级别。其中,2019年中国基因测序行业市场规模约为149亿元,年增速超20%。

近年来,基因测序行业得到迅速发展,吸引了大量资本和企业的进入。从产业上下游来看,基因测序产业链主要包括了上游仪器、中游服务提供商以及下游终端应用三个环节。涉及到的公司包括华大基因、达安基因、药明康德,以及互联网巨头苹果公司、亚马逊、谷歌、微软等。

整个产业看似简单,但上游的基因测序仪及配套试剂是整个产业链壁垒最高的部分,下游终端应用还涉及领域覆盖面非常广,既包括医疗领域的人体基因组、人体微生物基因组以及基础研究领域,还包括非医疗领域的环境治理、石油存储探测、农牧软文种等。

实际上,早在几十年前,医学界就对此有过尝试,将狒狒的心脏移植给了一个罹患先天性心脏病的孩子。如今,通过嵌合的方式,通过基因编辑的方式,甚至是通过合成生物学的方式,实现了猪心脏在人类身上的移植。

华大集团CEO尹烨曾表示,其实,今天人类进入了生命时代,我们关心的则是自身的基因和健康,以此就将去整合物理世界、信息世界和生命世界。

在应用场景不断拓宽,测序能力进一步加强的共同促进作用下,全球基因测序行业市场规模将不断增长,中国基因行业市场规模虽然与全球头部企业差距较大,但是在国内市场中仍然占据较大的优势,未来要想提高国际市场份额,还需进一步加强技术研发,未来发展具有巨大的想象空间。

今天,新的基因组序列研究成果,是科研人员必不可少的第一步,也是实现商业化的重要一步。

Evan Eichler(艾希勒)表示,“现在我们有了一块罗塞塔石碑(注:一块制作于公元前196年的花岗闪长岩石碑,解读出已经失传千余年的埃及象形文之意义与结构),可以在未来研究数十万个其他基因组的完整编译。”

科研人员揭示的完整人类基因组序列,是世界上最复杂的谜题之一,这一研究使得人类第一次看到最完整的、无间隙的DNA碱基基因序列,对于人类了解基因组变异的全谱,以及某些疾病的遗传贡献至关重要,将会推动与癌症、出生缺陷和衰老相关的研究与科学发展。

人类基因组计划明确的内容

题目:人类基因组计///作者///院系:///年级:///学号:摘要:人类基因组计划由美、英、日、中、德、法等国参加进行了人体基因作图,测定人体全部DNA序列创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。在揭示人类发展历史,基因治疗,农作物绿色革命,DNA鉴定方面具有深远影响。关键字:人类基因组计划正文:人类基因组计划人类基因组计划于20世纪80年代提出,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。其研究内容还包括创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。人类基因组计划在二十多年的时间里取得了较大进展。人类基因组计划最早在1985年由诺贝尔奖获得者,美国的杜尔贝克Renato Dulbecoo提出。最初目的是完成人类基因组全长约30亿个核苷酸的碱基序列测定,阐明所有人类基因并确定其在染色体上的位置,从而破译全部的人类遗传基因。1986年3月7日,杜尔贝克在《科学》杂志上发表了一篇题为“癌症研究的转折点——测定人类基因组序列”的文章,指出癌症和其它疾病的发生都与基因有关,并提出测定人类整个基因组序列的途径和重要意义。1988年美国能源部和国家卫生研究院率先在美国开展人类基因组计划,并经国会批准由政府给予资助。此后,成立了一个国际间的合作机构——人类基因组织(Human Genome Organization),由多个国家筹集资金和科研力量,积极参加这一国际性研究计划。1990年10月,国际人类基因组计划正式启动,预计用15年时间,投资30亿美元,完成30亿对碱基的测序,并对所有基因(当时预计为8万~10万个)进行绘图和排序。全球性人类基因组计划有美国、英国、日本、法国、德国和中国六个国家负责,其中美国承担了全部任务的54%,英国33%,日本7%,法国2.8%,德国2.2%,中国于1999年9月获准加入人类基因组计划并承担了1%的测序任务,即3号染色体断臂自D3S3610标志至端粒区段约3000万个碱基的全序列测定。中国1993年启动了相关研究项目,相继在上海和北京成立了国家人类基因组南、北两个中心,并承担人类基因组计划中1%的测序任务。经过多个国家的科学家的共同协作,人类终于在20世纪90年代完成了对自身基因组测序的初步工作。2003年6月,中、美、日、德、法、英等六国科学家宣布首次绘成人类基因组“工作框架图”。2003年4月14日,中、美、日、德、法、英等六国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。2004年,人类基因组完成测序;2005年,人类X染色体测序工作基本完成,并公布了该染色体基因草图。HGP的主要任务是人类的DNA测序,包括下图所示的四张谱图,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。1、遗传图谱(genetic map)又称连锁图谱(linkage map),这是根据基因或遗传标记之间的交换重组值来确定它们在染色体上的相对距离、位置的图谱。其图距单位是厘摩(coml),以纪念现代遗传学奠基人摩尔根。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。2、物理图谱(physical map)物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。用部分酶解法测定DNA物理图谱包括二个基本步骤:(1)完全降解 (2)部分降解3、序列图谱(sequence map)随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。4、基因图谱(DNA map)基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。原理基因图谱的意义在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。人类基因组计划的实施具有重大意义和影响。第一,揭示人类发展历史破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。同时,人类基因组图谱对揭示人类发展、进化的历史具有重要意义。对进化的研究,不再建立在假说的基础上,利用比较基因组学,通过研究古代DNA,可揭示生命进化的奥秘以及古今生物的联系,帮助人们更好地认识人类在自然界中的地位。第二,基因治疗获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。在不远的将来,根据每个人DNA序列的差异,可了解不同个体对疾病的抵抗力,依照每个人的“基因特点”对症下药,这便是21世纪的医学——个体化医学。更重要的是,通过基因治疗,不但可预防当事人日后发生疾病,还可预防其后代发生同样的疾病。第三,基因工程药物研究基因工程药物,是重组DNA的表达产物。广义的说,凡是在药物生产过程中涉及用基因工程的,都可以成为基因工程药物。基因技术应用于制药工业,可以生产出高效、高产、廉价、不再苦口的防治疾病的新药物,从而引起制药工业的革命性变革。对于肝炎、心血管疾病、肿瘤、艾滋病等目前尚无良药可治的重大疑难病,人们对生物工程寄予厚望,期待基因工程技术生产出有效地治疗药物。第四,农作物的绿色革命科学家们在利用基因工程技术改良农作物方面已取得重大进展,基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在开发可以生产出能够防病的疫苗和食品的农作物。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法,需要七、八年时间才能培育出一个新的植物品种,基因工程技术使研究人员可以将任何一种基因注入到一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。第五,DNA鉴定DNA鉴定已经给法医科学和犯罪司法系统带来了一场革命。DNA已经成为无数审判中的关键证据,帮助警察和法庭鉴别暴力犯罪中的罪犯,而且可信度非常高。它能够确定犯罪的人,同时也能够证明误判的人无罪。不仅如此,DNA鉴定还可以用于帮助寻找失踪的人、谋杀或事故中的受害者;还可以用于证明或否认父子关系。第六,转基因动物随着基因工程技术的飞速发展及其在动物上的应用,转基因动物的发展呈现出一片“大好形势”。比如基因育种能提供高产优质抗病的“超级动物”;基因工程疫苗为畜牧业节省了大笔开支;通过转基因动物进行器官移植。人类基因组的重要性由以上的事实我们可以看出,要想解开人类自身的秘密,就要从破解基因的密码做起。对人类基因的了解和掌控,也将对人类物种的进化、人类社会的进步产生强大推动作用。通过对人类基因已知和未知领域的探索,可以找到更好的基因更有利人类进步的基因,人类社会将从本质上发生突破性的飞越。因此我们可以说,这项耗资大耗时长的人类基因组计划确实是非常必要而且永世受益的。对于生物学界来说这可能是很小的一步,但对人类社会来说却是非常大的一步。尽管该计划已宣告完成,但该计划尚未得出令人满意的人类基因图谱,因此,科学工作者们对人类基因组的探索研究仍在紧张的进行中。希望在不久的将来,人类能解开基因的面纱,了解它掌控它,给人类社会带来无穷的财富。参考文献:1、章波《人类基因研究报告》重庆出版社 2006年版2、钱俊生、孔伟、卢大振《生命是什么》中共中央党校出版社2000年12月版3、C.丹尼斯、R.加拉格尔、J.D.沃森 序《人类基因组 我们的DNA》科学出版社2003年4月版4、杨业洲、陈廉《人类基因组计划》实用妇产科杂志2001年1月第17期 (Journal of Practical Obstetrics and Gynecology 2001 January Vol.17 No.1)5、参考资料:《科学》(Science)

基因组学研究技术及应用论文

李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时,引用《Scinence》上“第三次技术命革”中的一句话:“下一个传大时代将是基因组革命时代,它正处于初期阶段。”在当前的研究水平上,只要涉及生命体重要现象的课题,几乎离不开对基因及其作用的分析。2000年6月26日,英美两国首脑会同公私两大人基因组测序集团向世人正式宣告,人基因组的工作草图已绘制完成。科学家把这作为生命科学进入新时代的标志,即后基因组时代(post-genome era)。因此有必要对基因组及其研究内容和进展作一个了解。1基因组学及其研究内容基因组(GENOME)一词是1920年Winkles从GENes和chromosOMEs组成的,用于描述生物的全部基因和染色体组成的概念。1953年Watson和Crick发现DNA双螺旋结构,标志分子生物学的诞生,随着各学科的发展,当前生物学研究进入新的进代,在生物大分子水平上将不同的研究技术和手段有机的结合以攻克生物学难题。基因组研究可以理解为:(1)基因表达概况研究,即比较不同组织和不同发育阶段、正常状态与疾病状态,以及体外培养的细胞中基因表达模式的差异,技术包括传统的RTPCR,RNase保护试验,RNA印迹杂交,但是其不足是一次只能做一个。新的高通量表达分析方法包括微点阵(microarrary),基因表达序列分析(serial analysis of gene expression,SAGE),DNA芯片(DNA chip)等;(2)基因产物-蛋白质功能研究,包括单个基因的蛋白质体外表达方法,以及蛋白质组研究;(3)蛋白质与蛋白质相互作用的研究,利用酵母双杂交系统,单杂交系统(one-hybrid system),三杂交系统(thrdee-hybrid system)以及反向杂交系统(reverse hybrid system)等。1986年美国科学家Thomas Roderick提出了基因组学(Genomics),指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。随着1990年人类基因组计划(Human Genome Project,HGP)的实施并取得巨大成就,同时模式生物(model organisms)基因组计划也在进行,并先后完成了几个物种的序列分析,研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。第一个标志是功能基因组学的产生,第二个标志是蛋白质组学(proteome)的兴起。2 结构基因组学研究内容结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。根据使用的标志和手段不同,作图有三种类型,即构建生物体基因组高分辨率的遗传图谱、物理图谱、转录图谱。2.1遗传图谱通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性);80年代后出现的有STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性)分析。2.2物理图谱物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30 000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因的cDNA克隆,进行测序,确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作模板扩增;比较并纯化特异带;利用STS制备放射性探针与基因组进行原位杂交,使每隔100kb就有一个标志;二是在此基础上构建覆盖每条染色体的大片段:首先是构建数百kb的YAC(酵母人工染色体),对YAC进行作图,得到重叠的YAC连续克隆系,被称为低精度物理作图,然后在几十个kb的DNA片段水平上进行,将YAC随机切割后装入粘粒的作图称为高精度物理作图.2.3转录图谱利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分 cDNA的5'或3'端序列称为表达序列标签(EST),一般长300~500bp左右。一般说,mRNA的3' 端非翻译区(3'-UTR)是代表每个基因的比较特异的序列,将对应于3'-UTR的EST序列进行RH定位,即可构成由基因组成的STS图。截止到1998年12月底,在美国国家生物技术信息中心(NCBI)数据库中分布的植物EST的数目总和已达几万条,所测定的人基因组的EST达180万条以上。这些EST不仅为基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外,EST计划还为基因的鉴定提供了候选基因(candidantes)。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此,为了弥补EST计划的不足,必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。3功能基因组学研究功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。目前从模式生物基因组研究中得出一些规律:模式生物基因组一般比较小,但编码基因的比例较高,重复顺序和非编码顺序较少;其G+C%比较高;内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致;DNA 冗余,即重复;绝大多数的核心生物功能由相当数量的orthologous蛋白承担;Synteny连锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭示了人类疾病基因的功能,利用基因顺序上的同源性克隆人类疾病基因,利用模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂性状,加深对基因组结构的认识。 此外,可利用诱变技术测定未知基因,基因组多样性以及生物信息学(Bioinformatics)的应用。4蛋白质组学研究基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,它有自身的活动规律,因而仅仅从基因的角度来研究是远远不够的,必须研究由基因转录和翻译出蛋白质的过程,才能真正揭示生命的活动规律,由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科——蛋白质组学(proteomics)。蛋白质组(proteome)是由澳大利亚Macquarie大学的Wilkins和Williams于1994首先提出,并见于1995年7月的“Electrophonesis”上,指全部基因表达的全部蛋白质及其存在方式,是一个基因、一个细胞或组织所表达的全部蛋白质成分,蛋白质组学是对不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式、功能机理、调节控制以及蛋白质群体内相互作用,为临床诊断、病理研究、药物筛选、药物开发、新陈代谢途径等提供理论依据和基础。 蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式(修饰形式)、结构、功能和相互作用方式等。它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性,复杂性,低表达蛋白质难以检测等,应该明确其研究的艰难性。总体上研究可以分为两个方面:对蛋白质表达模式(或蛋白质组成)研究,对蛋白质功能模式(目前集中在蛋白质相互作用网络关系)研究。对蛋白质组研究可以提供如下信息:从基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后被修饰的程度等。由于蛋白质数目小于基因组中开放阅读框(ORF, open reading frame)数目,因此提出功能蛋白质组学(functional proteomics),功能蛋白质指在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质,只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次,是细胞内与某个功能有关或某种条件下的一群蛋白质。对蛋白质组成分析鉴定,要求对蛋白质进行表征化,即分离、鉴定图谱化,包括两个步骤:蛋白质分离和鉴定。双向凝胶电泳(2-DGE)和质谱(MS)是主要的技术。近年来,有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳(two-dimensional polyacrylamide gel electrophoresis,2-D PAGE);蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三大关键是:双向凝胶电泳技术、质谱鉴定、计算机图像数据处理与蛋白质数据库。5与基因组学相关学科诞生随着基因组学研究的不断深入,人类有望揭示生命物质世界的各种前所未知的规律,完全揭开生命之谜,进而驾驶生命,使之为人类的社会经济服务。基因组研究和其它学科研究交叉,促进一些学科诞生,如营养基因组学(nutritional genomics),环境基因组学(environmental genomics),药物基因组学(phamarcogenomics),病理基因组学(pathogenomics),生殖基因组学(reproductive genomics),群体基因组学(population genomics)等。其中,生物信息学正成为备受关注的新型产业的支撑点。生物信息学是以生物大分子为研究,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质,以计算机为工具,研究各种学科交叉的生物信息学的方法,找出其规律性,进而发展出适合它的各种软件,对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括:序列对比,基因识别和DNA序列分析,蛋白质结构预测,分子进化,数据库中知识发现(Knowledge Discovery in Database, KDD)。这一领域的重大科学问题有:继续进行数据库的建立和优化;研究数据库的新理论、新技术、新软件;进行若干重要算法的比较分析;进行人类基因组的信息结构分析;从生物信息数据出发开展遗传密码起源和生物进化研究;培养生物信息专业人员,建立国家生物医学数据库和服务系统[5]。20世纪末生物学数据的大量积累将导致新的理论发现或重大科学发现。生物信息学是基于数据库与知识发现的研究,对生命科学带来革命性的变化,对医药、卫生、食品、农业等产业产生巨大的影响。邹承鲁教授在谈论21世纪的生命科学时讲到,生物学在20世纪已取得巨大的发展,数理科学广泛而又深刻地深入生物学的结果在新的高度上揭示了生命的奥妙,全面改变了生物学的面貌。生物学不仅是当前自然科学发展的热点,进入21世纪后将仍然如此。科学家称21世纪是信息时代。生物科学和信息科学结合,无疑是多个学科发展的必然结果。

植物细胞工程技术以及应用论文

1 植物细胞工程基础研究

植物细胞工程是建立在工程技术与现代生物科学基础上的科学技术。它的发展依赖于植物学、分子生物学、植物生理学、遗传学、环境工程学、植物营养学等学科共同的发展和进步的,可为研究生物科学提供非常重要的技术。植物发育的生物学是当代植物科学研究的主要内容。离体培养的器官与培养体细胞胚及调控这种步骤已经建立了良好的实验体系,极大地将植物生物学的内容丰富了,而且还加速了发展。植物的薄层细胞培养已经成为了在离体条件下研究生理生化、植株再生、遗传转化的关键技术。并且应用离体培养的技术来探究花器官的发育,已经在多种植物上实现了开花和结实。原生质体培养为研究单细胞提供了较为良好的技术体系,已应用在植物激素的作用机理、植物细胞的分裂、细胞壁生物学、基因表达、物质跨膜运输等多个研究领域。

2 植物细胞工程技术及其应用

2. 1 加倍单倍体技术及应用

利用植物的组织来培养单倍体的植物材料从而获得单倍体植物,然后再通过自然方法或者人工加倍的方法从而获得双倍体植株的技术,被称为加倍单倍体技术。在这种技术中以使用花药和花粉来进行培养的应用最为广泛。利用这种技术来进行花药和花粉培养获得植株,目前已经在 250 多种植物上实验成功。目前,我国在培养花药和单倍体育种这两方面总体已经处于世界的前列,由多名研究者研制的 N6 培养基已经被大量应用在禾本科植物的花药和花粉培养上,现已被当做是国内外花培使用的通用培养基。而且利用花培技术,我国在多种农作物上都培养出了许多新的品种,例如水稻的中花系列的品种、小麦中的京花系列的品种、油菜中的华油一号等这些已经培育成功的品种的'推广,现已在社会和经济方面都取得了很好的效益。

在遗传上面,我们采用花培技术已获得染色体代的换系和附加系的方法,现在也被大量应用在小麦、大麦和一些茄科植物的身上,这种方法对远缘杂交育种的效率有着极大的提高。

植物存在的一种自然现象就是雌核发育。雌核发育就在离体的条件下通过培养一些没有受精过的子房和胚珠以产生单倍体植株,或者是在活体的条件下用不同种类的花粉或者是被物理方法处理过花粉授予其中,以诱导雌核的发育。目前这种培育方法已经在不下 10 种的植物上获得了成功。在离体条件下,诱导孤雌生殖来获得加倍单倍体的这一技术发展的时间很短,不过现在已经开始使用在构建遗传分析、作物的改良与转基因的受体材料。

2. 2 原生质体培养和体细胞杂交

植物细胞工程的核心技术是原生质体培养和体细胞杂交。

为了不出现植物远缘杂交不亲和性,新的种质资源不断创新,为了实现植物遗传转化和进行细胞学的基础研究提供了重要的科学研究基础。粮食作物、蔬菜、果树、花卉、林木等是获得的原生质体再生植株。农作物和经济作物主要是以原生质体培养,从一年生向多年生、从草本向木本、从高等向低等是近年来的植物发展趋势。原生质体培养、体细胞杂交、体细胞杂质种子评价和利用等是我国大量研究方面。世界前列的是第一次获得的原生质体植株种类数量,先进的成果适用主要是在原生质体培养体系的建立和完善、体细胞杂质种子鉴定、新种质的创制等方面。在植物细胞生理和遗传学、基因组学、蛋白质组学研究中的应用主要是以原生质体培养的技术。

2. 3 加强植物细胞工程基础研究

基础科学的进步与发展是植物细胞工程的发展主要平台。转基因植物、植物生物反应器的研究和应用的推进方面是加强研究基础植物代谢工程、植物细胞工程与植物基因工程的快速有机整合,结合分子标记辅助育种技术等。

3 结语

现代生物技术的发展是需要植物细胞工程的研究与应用来推动的。植物细胞工程作为一个很独立的学科和技术研究,为现代农业化高效率、优质性、可持续发展性做出了重大贡献。生命科学技术和工程技术的进步有力推动了植物细胞技术的发展,也大大有效地推进了现代生命科学技术的进一步发展。

加大对植物细胞工程的基础研究创新 ,将为植物细胞工程的进步提供更为广阔的发展平台,为社会主义现代农业科学技术的发展做出更大的贡献。

相关百科

热门百科

首页
发表服务