基本原理
CRISPR簇是一个广泛存在于细菌和古生菌基因组中的特殊DNA重复序列家族,其序列由一个前导区(Leader)、多个短而高度保守的重复序列区(Repeat)和多个间隔区(Spacer)组成。
前导区一般位于CRISPR簇上游,是富含AT长度为300~500bp的区域,被认为可能是CRISPR簇的启动子序列。重复序列区长度为21~48bp,含有回文序列,可形成发卡结构。
重复序列之间被长度为26~72bp的间隔区隔开。Spacer区域由俘获的外源DNA组成,类似免疫记忆,当含有同样序列的外源DNA入侵时,可被细菌机体识别,并进行剪切使之表达沉默,达到保护自身安全的目的。
工作原理
当细菌抵御噬菌体等外源DNA入侵时,在前导区的调控下,CRISPR被转录为长得RNA前体(Pre RISPR RNA,pre-crRNA),然后加工成一系列短的含有保守重复序列和间隔区的成熟crRNA,最终识别并结合到与其互补的外源DNA序列上发挥剪切作用。
目前发现的CRISPR/Cas系统有三种不同类型即I型、II型和III型,它们存在于大约40%已测序的真细菌和90%已测序的古细菌中。其中II型的组成较为简单,以Cas9蛋白以及向导RNA(gRNA)为核心组成,也是目前研究中最深入的类型。
CRISPR技术是一种简单而强大的基因组编辑工具。它使研究人员能够很容易地改变DNA序列和修改基因功能。它的许多潜在应用包括纠正遗传缺陷、治疗和防止疾病传播以及改良作物。然而,它的承诺也引起了伦理问题。
在流行用法中,“CRISPR”(发音为“crisper”)是“CRISPR-Cas9”的缩写。CRISPRs是DNA的特殊延伸。蛋白质Cas9(或“CRISPR相关”)是一种类似于一对分子剪刀的酶,能够切割DNA链。
CRISPR技术是根据细菌和古细菌(单细胞微生物领域)的自然防御机制改编而成的。这些生物体利用CRISPR衍生的RNA和各种Cas蛋白(包括Cas9)来抵御病毒和其他异物的攻击。他们这样做主要是通过切割和破坏外国侵略者的DNA。当这些成分被转移到其他更复杂的有机体中时,它允许对基因进行操作或“编辑”。
直到2017年,没有人真正知道这个过程是什么样子的。在2017年11月10日发表在《自然通讯》杂志上的一篇论文中,由金泽大学的Shibata Mikihiro和东京大学的Hiroshi Nishimasu领导的一个研究小组展示了CRISPR第一次运行时的样子。[一个惊人的新GIF显示CRISPR咀嚼DNA]
CRISPRs:“CRISPR”代表“有规律间隔的短回文重复序列簇”。它是DNA的一个特殊区域,具有两个明显的特征:核苷酸重复序列和间隔序列的存在。核苷酸的重复序列——DNA的组成部分——分布在CRISPR区域。间隔序列是散布在这些重复序列中的DNA片段。
对于细菌来说,间隔序列是从先前攻击有机体的病毒中提取的。它们作为一个记忆库,使细菌能够识别病毒并抵御未来的攻击。
这是由食品配料公司Danisco的Rodolphe Barrangou和一组研究人员首次通过实验证明的。在2007年发表在《科学》杂志上的一篇论文中,研究人员以酸奶和其他乳制品培养物中常见的嗜热链球菌为模型。他们观察到,病毒攻击后,新的间隔蛋白被整合到CRISPR区域。此外,这些间隔区的DNA序列与病毒基因组的部分序列相同。他们还通过取出或放入新的病毒DNA序列来操纵间隔区。通过这种方式,他们能够改变细菌对特定病毒攻击的抵抗力。因此,研究人员证实了CRISPR在调节细菌免疫中的作用。
CRISPR RNA(crRNA):一旦一个间隔基被结合并且病毒再次攻击,CRISPR的一部分被转录并加工成crisprrna或“crRNA”。CRISPR的核苷酸序列作为模板产生互补的单链RNA序列。根据Jennifer Doudna和Emmanuelle Charpentier在2014年发表在《科学》杂志上的一篇评论,每个crRNA由一个核苷酸重复序列和一个间隔部分组成。
Cas9:Cas9蛋白是一种切割外来DNA的酶。
该蛋白通常与两个RNA分子结合:crRNA和另一个称为tracrRNA(或“反式激活crRNA”)。两人随后将Cas9引导至目标地点,在那里进行切割。这片DNA是对crRNA的20个核苷酸延伸的补充。
使用两个独立的区域,或其结构上的“域”,Cas9切割DNA双螺旋的两条链,使所谓的“双链断裂”,根据2014年的科学文章。
有一个内置的安全机制,它确保Cas9不会在基因组中的任何地方被切断。已知短DNA序列s-PAMs(“邻近原间隔基序”)作为标记,与目标DNA序列相邻。如果Cas9复合物的目标DNA序列旁边没有PAM,它就不会被切割。根据《自然生物技术》(Nature Biotechnology)2014年发表的一篇评论,这可能是Cas9从未攻击细菌CRISPR区的一个原因。
不同生物体的基因组在其DNA序列中编码一系列信息和指令。基因组编辑包括改变这些序列,从而改变信息。这可以通过在DNA中插入一个切口或一个断裂,并诱骗细胞的自然DNA修复机制来引入人们想要的改变来实现。CRISPR-Cas9提供了一种方法。
在2012年,两篇关键的研究论文发表在《科学》和《国家科学院学报》上,这两篇论文帮助细菌CRISPR-Cas9转化为一个简单的、可编程的基因组编辑工具。
这项研究由不同的小组进行,结论:Cas9可以直接切割DNA的任何区域。这可以通过简单地改变crRNA的核苷酸序列来实现,crRNA与互补的DNA靶点结合。在2012年的《科学》文章中,Martin Jinek和他的同事们进一步简化了这个系统,将crRNA和tracrRNA融合在一起形成一个单一的“导向RNA”。因此,基因组编辑只需要两个组成部分:导向RNA和Cas9蛋白。
,哈佛医学院遗传学教授乔治·丘奇说:“你设计了一段20个核苷酸碱基对,它们与你想要编辑的基因相匹配。”。构建了与这20对碱基互补的RNA分子。丘奇强调了确保核苷酸序列只在目标基因中发现,而在基因组中没有其他发现的重要性。”然后,RNA加上蛋白质[Cas9]会像剪刀一样在那个位置切割DNA,理想情况下是在别的地方,“他解释道,”一旦DNA被切割,细胞的自然修复机制就会启动,并将突变或其他变化引入基因组。这有两种可能发生的方式。根据斯坦福大学的亨廷顿外展项目,一种修复方法是将两个切口粘在一起。这种被称为“非同源末端连接”的方法容易引入错误。核苷酸意外插入或删除,导致突变,从而破坏基因。在第二种方法中,通过用核苷酸序列填充间隙来固定断裂。为了做到这一点,细胞使用短链DNA作为模板。科学家可以提供他们选择的DNA模板,从而写入他们想要的任何基因,或纠正突变。
CRISPR-Cas9近年来变得流行起来。Church指出,这项技术易于使用,其效率大约是之前最好的基因组编辑工具(称为TALENS)的四倍,美国麻省理工学院和哈佛大学博德研究所的丘奇和张峰实验室的研究人员首次发表了在实验环境中使用CRISPR-Cas9编辑人体细胞的报告。利用人类疾病的体外(实验室)和动物模型进行的研究表明,该技术可以有效地纠正遗传缺陷。根据《自然生物技术》杂志2016年发表的一篇评论文章,此类疾病的例子包括囊性纤维化、白内障和范科尼贫血。这些研究为人类的治疗应用铺平了道路。
“我认为公众对CRISPR的认识非常集中于临床上使用基因编辑治疗疾病的想法,”纽约基因组中心的内维尔·桑贾纳和纽约大学生物、神经科学和生理学助理教授说这无疑是一个令人兴奋的可能性,但这只是一小部分。
CRISPR技术也被应用于食品和农业工业,以设计益生菌培养物和疫苗食用工业培养物(例如酸奶)以防病毒。它还被用于提高作物的产量、耐旱性和营养特性。
另一个潜在的应用是创造基因驱动。这些是遗传系统,它增加了一个特殊的性状从父母传给后代的机会。最终,根据Wyss研究所的研究,这种特性会在几代人中传播到整个群体。根据2016年《自然生物技术》的文章,基因驱动可以通过增强疾病载体(雌性冈比亚按蚊)的不育性来帮助控制疟疾等疾病的传播。此外,根据Kenh Oye及其同事在2014年发表在《科学》杂志上的一篇文章,基因驱动也可用于根除入侵物种,逆转对杀虫剂和除草剂的抗性,Church告诉Live Science:“CRISPR-Cas9并非没有缺点,
“我认为CRISPR最大的局限是它没有百分之百的效率。”。此外,基因组编辑效率可能会有所不同。根据Doudna和Charpentier在2014年发表的一篇科学文章,在一项在水稻上进行的研究中,接受Cas9 RNA复合物的细胞中,近50%发生了基因编辑。然而,其他的分析表明,根据目标,编辑效率可以达到80%或更高。
也有“目标外效应”的现象,即DNA在目标以外的位置被切割。这可能导致意外突变的引入。此外,丘奇还指出,即使系统按目标进行了削减,也有可能得不到精确的编辑。他称之为“基因组破坏”。
CRISPR技术的许多潜在应用提出了关于篡改基因组的伦理价值和后果的问题。
在2014年的科学文章中,Oye和同事们指出了使用基因驱动器的潜在生态影响。一个引进的性状可以通过杂交从目标群体传播到其他有机体。基因驱动也会降低目标群体的遗传多样性。
对人类胚胎和生殖细胞(如 *** 和卵子)进行基因修饰被称为生殖系编辑。由于这些细胞的变化可以遗传给下一代,使用CRISPR技术进行生殖系编辑已经引起了许多伦理问题。
的可变功效、偏离目标的效果和不精确的编辑都会带来安全风险。此外,还有许多科学界尚不清楚的问题。在2015年发表在《科学》杂志上的一篇文章中,大卫巴尔的摩和一组科学家、伦理学家和法律专家指出,生殖系编辑增加了对后代产生意外后果的可能性,“因为我们对人类遗传学、基因与环境相互作用的知识有限,以及疾病的途径(包括一种疾病与同一病人的其他情况或疾病之间的相互作用)。
其他伦理问题更为微妙。我们是否应该在未经后代同意的情况下,做出可能从根本上影响后代的改变?如果使用生殖系编辑从一种治疗工具转变为一种增强工具,以适应各种人类特征,会怎么样?
为了解决这些问题,国家科学、工程和医学院编写了一份全面的报告,其中包括基因组编辑的指导方针和建议。
尽管国家科学院敦促谨慎从事生殖系编辑,他们强调“谨慎并不意味着禁止”,他们建议只在导致严重疾病的基因上进行生殖系编辑,并且只有在没有其他合理的治疗方法的情况下才进行。在其他标准中,他们强调需要有关于健康风险和益处的数据,以及在临床试验期间需要持续监督。他们也推荐
最近有许多基于CRISPR的研究项目生物化学家和CRISPR专家萨姆·斯特恩伯格(Sam Sternberg)说:“由于CRISPR,基础研究发现的速度已经爆炸了。”他是加利福尼亚州伯克利市Caribou Biosciences Inc.的技术开发小组负责人,该公司正在开发基于CRISPR的医药、农业解决方案,以及生物研究。
这里是一些最新的发现:
“Live Science contributor Alina Bradford的附加报告”
附加资源
CRISPR-Cas9是继ZFN、TALENs等基因编辑技术推出后的第三代基因编辑技术,短短几年内,CRISPR-Cas9技术风靡全球, 成为现有基因编辑和基因修饰里面效率最高、最简便、成本最低、最容易上手的技术之一,成为当今最主流的基因编辑系统。
一、什么是CRISPR-Cas系统
CRISPR-Cas系统是原核生物的一种天然免疫系统 。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的DNA切断而使之失效。
C RISPR-Cas系统包含CRISPR基因座和Cas基因(CRISPR关联基因)两部分。
1、CRISPR(/'krɪspər/)是原核生物基因组内的一段重复序列 。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats(成簇的规律性间隔的短回文重复序列)。分布在40%的已测序细菌和90%的已测序古细菌当中。 (注:生活在深海的火山口、陆地的热泉以及盐碱湖等极端环境中,有一些独特结构的细菌,称为古细菌)
CRISPR基因序列主要由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成 。
①前导序列 :富含AT碱基,位于CRISPR基因上游, 被认为是CRISPR序列的启动子 。
②重复序列 :长度约20–50 bp碱基且包含5–7 bp回文序列,转录产物可以形成发卡结构, 稳定RNA的整体二级结构 。
③间隔序列 : 是被细菌俘获的外源DNA序列 。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。
2、Cas基因位于CRISPR基因附近或分散于基因组其他地方,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因( CRISPR associated,Cas )。
Cas基因编码的Cas蛋白在防御过程中至关重要,目前已经发现了Cas1-Cas10等多种类型的Cas基因。
依据Cas蛋白在细菌免疫防御过程中参与的角色,目前将CRISPR-Cas系统分为两大类。
第一大类 :它们切割外源核酸的效应因子为多个Cas蛋白形成的复合物,包括Ⅰ型、Ⅲ型和Ⅳ型。
第二大类 :它们的作用因子是比较单一的Cas蛋白,比如Ⅱ型的Cas9蛋白和Ⅴ型的Cpf蛋白。
目前,被最为广泛应用的CRISPR系统是II型CRISPR-Cas系统,也就是CRISPR-Cas9系统。
二、CRISPR-Cas9的作用原理
对于CRISPR-Cas9的作用机理可以分为三个阶段来理解。
1、第一阶段:CRISPR 的高度可变的间隔区的获得 ( 俘获外源DNA,登记“黑名单” )
CRISPR 的高度可变的间隔区获得,其实就是指外来入侵的噬菌体或是质粒DNA 的一小段DNA 序列被整合到宿主菌的基因组,整合的位置位于CRRSPR 的5' 端的两个重复序列之间。因此,CRISPR 基因座中的间隔序列从5' 到3' 的排列也记录了外源遗传物质入侵的时间顺序。
新间隔序列的获得可能分为三步:
第1步:Cas1和Cas2编码的蛋白将扫描入侵的DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原型间隔序列。
第2步:Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。
第3步:DNA会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR序列之中。
2、第二阶段:CRIPSR 基因座的表达(包括转录和转录后的成熟加工)
CRISPR序列在前导区的调控下转录产生pre-crRNA( crRNA的前体 ),同时与pre-crRNA序列互补的tracrRNA( 反式激活crRNA )也被转录出来。pre-crRNA通过碱基互补配对与tracrRNA形成双链RNA并与Cas9编码的蛋白组装成一个复合体。它将根据入侵者的类型,选取对应的“身份证号码”( 间隔序列RNA ),并在核糖核酸酶Ⅲ( RNaseⅢ )的协助下对这段“身份证”进行剪切,最终形成一段短小的crRNA( 包含单一种类的间隔序列RNA以及部分重复序列区 )。
crRNA,Cas9以及tracrRNA组成最终的复合物,为下一步剪切做好准备。
3、第三阶段:CRISPR/Cas 系统活性的发挥(靶向干扰)
crRNA,Cas9以及tracrRNA组成最终的复合物就像是一枚制导导弹,可以对入侵者的DNA进行精确的打击。这个复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。这时,复合物将定位到PAM/原间隔序列的区域,DNA双链将被解开,形成R-Loop。crRNA将与互补链杂交,而另一条链则保持游离状态。
随后,Cas9蛋白精确的平端切割位点位于PAM上游3个核苷酸位置,形成平末端产物。Cas9蛋白的HNH结构域负责切割与crRNA互补配对的那一条DNA链,而RuvC结构域负责切割另外一条非互补DNA链。最终在Cas9的作用下DNA双链断裂(DSB),外源DNA的表达被沉默,入侵者被一举歼灭。
三、 CRISPR-Cas9基因编辑技术及应用…
tracrRNA-crRNA在被融合为单链向导RNA(sgRNA)时也可以发挥指导Cas9的作用。
CRISPR-Cas9基因编辑技术就是通过人工设计的 sgRNA(guide RNA)来识别目的基因组序列,并引导 Cas9 蛋白酶进行有效切割 DNA 双链,形成双链断裂,损伤后修复会造成基因敲除或敲入等,最终达到对基因组DNA 进行修饰的目的。
CRISPR-Cas9的广泛应用
1、基因敲除(Knock-out)
Cas9可以对靶基因组进行剪切,形成DNA的双链断裂。在通常情况下,细胞会采用高效的 非同源末端连接 方式(NHEJ)对断裂的DNA进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,( 移码突变 :是指DNA分子由于某位点碱基的缺失或插入,引起阅读框架变化,造成下游的一系列密码改变,使原来编码某种肽链的基因变成编码另一种完全不同的肽链序列。)使靶标基因失去功能,从而实现基因敲除。为了提高CRISPR系统的特异性,可将Cas9的一个结构域进行突变,形成只能对DNA单链进行切割造成DNA缺口的Cas9 nickase核酸酶。因此想要形成双链断裂的效果可以设计两条sgRNA序列,分别靶向DNA互补的两条链,这样两条sgRNA特异性的结合靶标序列,即可形成DNA断裂,并在修复过程中通过移码突变实现基因敲除
2、基因敲入(Knock-in)
当DNA双链断裂后,如果有DNA修复模板进入到细胞中,基因组断裂部分会依据修复模板进行 同源重组修复 (HDR),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。DNA修复模板可以是线性/双链脱氧核苷酸链,也可以是双链DNA质粒。HDR修复模式在细胞中发生率较低,通常小于10%。为了增加基因敲入的成功率,目前有很多科学家致力于提高HDR效率,将编辑的细胞同步至HDR最活跃的细胞分裂时期,促进修复方式以HDR进行;或者利用化学方法抑制基因进行NHEJ,提高HDR的效率
3、基因抑制、基因激活(Repression or Activation)
Cas9的特点是能够自主结合和切割目的基因,通过点突变的方式使Cas9的两个结构域RuvC-和HNH-失去活性,形成的dCas9只能在sgRNA的介导下结合靶基因,而不具备剪切DNA的功能。因此,将dCas9结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将dCas9结合到基因的启动子区域也可以结合转录抑制/活化物,使下游靶基因转录受到抑制或激活。因此dCas9与Cas9、Cas9 nickase的不同之处在于,dCas9造成的激活或者抑制是可逆的,并不会对基因组DNA造成永久性的改变。
4、多重编辑(Multiplex Editing)
将多个sgRNA质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双Cas9nickases提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建2~7个不同的sgRNA进行多重CRISPR基因编辑。
5、功能基因组筛选
利用CRISPR-Cas9进行基因编辑可以产生大量的基因突变细胞,因此利用这些突变细胞可以确认表型的变化是否是由基因或者遗传因素导致的。基因组筛选的传统方法是shRNA技术,但是shRNA有其局限性:具有很高的脱靶效应以及无法抑制全部基因而形成假阴性的结果。CRISRP-Cas9系统的基因组筛选功能具有高特异性和不可逆性的优势,在基因组筛选中得到了广泛的应用。目前CRISPR的基因组筛选功能应用于筛选对表型有调节作用的相关基因,如对化疗药物或者毒素产生抑制的基因、影响肿瘤迁移的基因以及构建病毒筛选文库对潜在基因进行大范围筛选等。
CRISPR是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,简单说就是病毒能把自己的基因整合到细菌,利用细菌的细胞工具为自己的基因复制服务,细菌为了将病毒的外来入侵基因清除,进化出CRISPR系统,利用这个系统,细菌可以不动声色地把病毒基因从自己的染色体上切除,这是细菌特有的免疫系统。微生物学家10年前就掌握了细菌拥有多种切除外来病毒基因的免疫功能,其中比较典型的模式是依靠一个复合物,该复合物能在一段RNA指导下,定向寻找目标DNA序列,然后将该序列进行切除。许多细菌免疫复合物都相对复杂,其中科学家掌握了对一种蛋白Cas9的操作技术,并先后对多种目标细胞DNA进行切除。这种技术被称为CRISPR/Cas9基因编辑系统,迅速称为生命科学最热门的技术。