首页

> 论文发表知识库

首页 论文发表知识库 问题

预测蛋白质结构研究生论文题目

发布时间:

预测蛋白质结构研究生论文题目

我不知道你们的论文是什么要求,但可以给你些建议:论文应先写摘要,再写正文。从目的、方法、结果、结论这几方面写。具体的可参考范文,以下为蛋白质的结构,希望对你有所帮助。蛋白质一级结构(primary structure) 是指多肽链的氨基酸残基的排列顺序,也是蛋白质最基本的结构。它是由基因上遗传密码的排列顺序所决定的,各种氨基酸按遗传密码的顺序通过肽键连接起来。每一种蛋白质分子都有自己特有的氨基酸的组成和排列顺序即一级结构,由这种氨基酸排列顺序决定它的特定的空间结构,也就是蛋白质的一级结构决定了蛋白质的二级三级等高级结构。胰岛素(Insulin)由51个氨基酸残基组成,分为A、B两条链。A链21个氨基酸残基,B链30个氨基酸残基。A、B两条链之间通过两个二硫键联结在一起,A链另有一个链内二硫键。 蛋白质二级结构(secondary structure)二级结构是指多肽链借助于氢键沿一维方向排列成具有周期性的结构的构象,是多肽链局部的空间结构(构象),主要有α-螺旋、β-折叠、β-转角等几种形式,它们是构成蛋白质高级结构的基本要素。 α-螺旋(α-helix)是蛋白质中最常见最典型含量最丰富的二级结构元件.在α螺旋中,每 个螺旋周期包含 个氨基酸残基,残基侧链伸向外侧,同一肽链上的每个残基的酰胺氢原子和位于它后面的第4个残基上的羰基氧原子之间形成氢键。这种氢键大致与螺旋轴平行。一条多肽链呈α-螺旋构象的推动力就是所有肽键上的酰胺氢和羰基氧之间形成的链内氢键。在水环境中,肽键上的酰胺氢和羰基氧既能形成内部(α-螺旋内)的氢键,也能与水分子形成氢键。如果后者发生,多肽链呈现类似变性蛋白质那样的伸展构象。疏水环境对于氢键的形成 没有影响,因此,更可能促进α-螺旋结构的形成。β-折叠(β-sheet)也是一种重复性的结构,可分为平行式和反平行式两种类型,它们是通过肽链间或肽段间的氢键维系。可以把它们想象为由折叠的条状纸片侧向并排而成,每条纸片可看成是一条肽链, 称为β折叠股或β股(β-strand),肽主链沿纸条形成锯齿状,处于最伸展的构象,氢键主要在股间而不是股内。α-碳原子位于折叠线上,由于其四面体性质,连续的酰氨平面排列成折叠形式。需要注意的是在折叠片上的侧链都垂直于折叠片的平面,并交替的从平面上下二侧伸出。平行折叠片比反平行折叠片更规则且一般是大结构而反平行折叠片可以少到仅由两个β股组成。β-转角(β-turn)是种简单的非重复性结构。在β-转角中第一个残基的C=O与第四个残基的N-H氢键键合形成一个紧密的环,使β-转角成为比较稳定的结构,多处在蛋白质分子的表面,在这里改变多肽链方向的阻力比较小。β-转角的特定构象在一定程度上取决与他的组成氨基酸,某些氨基酸如脯氨酸和甘氨酸经常存在其中,由于甘氨酸缺少侧链(只有一个H),在β-转角中能很好的调整其他残基的空间阻碍,因此使立体化学上最合适的氨基酸;而脯氨酸具有换装结构和固定的角,因此在一定程度上迫使β-转角形成,促使多台自身回折且这些回折有助于反平行β折叠片的形成。蛋白质三级结构(tertiary structure)三级结构主要针对球状蛋白质而言的是指整条多肽链由二级结构元件构建成的总三维结构,包括一级结构中相距远的肽段之间的几何相互关系,骨架和侧链在内的所有原子的空间排列。在球状蛋白质中,侧链基团的定位是根据它们的极性安排的。蛋白质特定的空间构象是由氢键、离子键、偶极与偶极间的相互作用、疏水作用等作用力维持的,疏水作用是主要的作用力。有些蛋白质还涉及到二硫键。如果蛋白质分子仅由一条多肽链组成,三级结构就是它的最高结构层次。蛋白质四级结构(quaternary structure)四级结构是指在亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间结构。四级结构的蛋白质中每个球状蛋白质称为亚基,亚基通常由一条多肽链组成,有时含两条以上的多肽链,单独存在时一般没有生物活性。亚基有时也称为单体(monomer),仅由一个亚基组成的并因此无四级结构的蛋白质如核糖核酸酶称为单体蛋白质,由两个或两个以上亚基组成的蛋白质统称为寡聚蛋白质,多聚蛋白质或多亚基蛋白质。多聚蛋白质可以是由单一类型的亚基组成,称为同多聚蛋白质或由几种不同类型的亚基组成称为杂多聚蛋白质。对称的寡居蛋白质分子可视为由两个或多个不对称的相同结构成分组成,这种相同结构成分称为原聚体或原体(protomer)。在同多聚体中原体就是亚基,但在杂聚体中原体是由两种或多种不同的亚基组成。蛋白质的四级结构涉及亚基种类和数目以及各亚基或原聚体在整个分子中的空间排布,包括亚基间的接触位点(结构互补)和作用力(主要是非共价相互作用)。大多数寡聚蛋白质分子中亚基数目为偶数,尤以2和4为多;个别为奇数,如荧光素酶分子含3个亚基。亚基的种类一般是一种或两种,少数的多于两种。稳定四级结构的作用力与稳定三级结构的没有本质区别。亚基的二聚作用伴随着有利的相互作用包括范徳华力,氢键,离子键和疏水作用还有亚基间的二硫键。亚基缔合的驱动力主要是疏水作用,因亚基间紧密接触的界面存在极性相互作用和疏水作用,相互作用的表面具有极性基团和疏水基团的互补排列;而亚基缔合的专一性则由相互作用的表面上的极性基团之间的氢键和离子键提供。

浅谈蛋白质折叠的有关问题 [关键字]生物 大分子 分子伴侣 蛋白质的折叠 识别 结合 生物大分子的结构与功能的研究是了解分子水平的先象的基础。没有对生物大分子的结构与功能的认识,就没有分子生物学。正如没有DNA双螺旋结构的发现,就没有遗传传达传递的中心法则,也就没有今天的分子生物学。结构分子以由第一分子进入对复和物乃至多亚基,多分子复和体结构研究。同时,过去难以研究的分子水平上的生命运动情况也随着研究的深入和技术手段的发展而逐渐由难点变为热点。蛋白质晶体学研究已从生物大分子静态(时间统计)的结构分析开始进入动态(时间分辨)的结构分析及动力学分析。第十三届国际生物物理大会的25个专题讨论会中有一半以上涉及蛋白质的结构与功能,而“结构与功能”又强调“动力学(Dynamics)”,即动态的结构或结构的运动与蛋白质分子功能的关系,以及对大分子相互作用的贡献。 蛋白质折叠问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。从一级序列预测蛋白质分子的三级结构并进一步预测其功能,是极富挑战性的工作。研究蛋白质折叠,尤其是折叠早期过程,即新生肽段的折叠过程是全面的最终阐明中心法则的一个根本问题,在这一领域中,近年来的新发现对新生肽段能够自发进行折叠的传统概念做了根本的修正。这其中,X射线晶体衍射和各种波谱技术以及电子显微镜技术等发挥了极其重要的作用。第十三届国际生物物理大会上,Nobel奖获得者Ernst在报告中强调指出,NMR用于研究蛋白质的一个主要优点在于它能极为详细的研究蛋白质分子的动力学,即动态的结构或结构的运动与蛋白质分子功能的关系。目前的NMR技术已经能够在秒到皮秒的时间域上观察蛋白质结构的运动过程,其中包括主链和侧链的运动,以及在各种不同的温度和压力下蛋白质的折叠和去折叠过程。蛋白质大分子的结构分析也不仅仅只是解出某个具体的结构,而是更加关注结构的涨落和运动。例如,运输小分子的酶和蛋白质通常存在着两种构象,结合配体的和未结合配体的。一种构象内的结构涨落是构象转变所必需的前奏,因此需要把光谱学,波谱学和X射线结构分析结合起来研究结构涨落的平衡,构象改变和改变过程中形成的多种中间态,又如,为了了解蛋白质是如何折叠的,就必须知道折叠时几个基本过程的时间尺度和机制,包括二级结构(螺旋和折叠)的形成,卷曲,长程相互作用以及未折叠肽段的全面崩溃。多种技术用于研究次过程,如快速核磁共振,快速光谱技术(荧光,远紫外和近紫外圆二色)。 一、新生肽段折叠研究中的新观点 长期以来关于蛋白质折叠,形成了自组装(self-assembly)的主导学说,因此,在研究新生肽段的折叠时,就很自然的把在体外蛋白质折叠研究中得到的规律推广到体内,用变性蛋白的复性作为新生肽段折叠的模型,并认为细胞中新合成的多肽链,不需要别的分子的帮助,不需要额外能量的补充,就应该能够自发的折叠而形成它的功能状态。 1988年,邹承鲁明确指出,新生肽段的折叠在合成早期业已开始,而不是合成完后才开始进行,随着肽段的延伸同时折叠,又不断进行构象的调整,先形成的结构会作用于后合成的肽段的折叠,而后合成的结构又会影响前面已形成的结构的调整。因此,在肽段延伸过程中形成的结构往往不一定是最终功能蛋白中的结构。这样,三维结构的形成是一个同时进行着的,协调的动态过程。九十年代一类具有新的生物功能的蛋白,分子伴侣(Molecularchaperone)的发现,以及在更广泛意义上说的帮助蛋白质折叠的辅助蛋白(Accessoryprotein)的提出,说明细胞内新生肽段的折叠一般意义上说是需要帮助的,而不是自发进行的。 二、蛋白质分子的折叠和分子伴侣的作用 蛋白质分子的三维结构,除了共价的肽键和二硫键,还靠大量极其复杂的弱次级键共同作用。因此新生肽段在一边合成一边折叠过程中有可能暂时形成在最终成熟蛋白中不存在不该有的结构,他们常常是一些疏水表面,它们之间很可能发生本不应该有的错误的相互作用而形成的非功能的分子,甚至造成分子的聚集和沉淀。按照自组装学说,每一步折叠都是正确的,充分的,必要的。实际上折叠过程是一个正确途径和错误途径相互竞争的过程,为了提高蛋白质生物合成的效率的,应该有帮助正确途径的竞争机制,分子伴侣就是这样通过进化应运而生的。它们的功能是识别新生肽段折叠过程中暂时暴露的错误结构的,与之结合,生成复和物,从而防止这些表面之间过早的相互作用,阻止不正确的非功能的折叠途径,抑制不可逆聚合物产生,这样必然促进折叠向正确方向进行。(从哲学的观点说,似乎很容易驳斥自组装学说,它违背了矛盾的普遍性原理,试想,如果蛋白质的每一步折叠均是正确的,充分的,必要的,岂不是在无任何矛盾的前提下,完成了复杂的最稳定构象的形成,即完成了由量变到质变的伟大飞跃,从无活性的肽链变成有活性的功能蛋白,这显然是违背哲学基本原理的。换一个角度想,生物进化的过程本来就充满着不定向的变异,这些变异中有适应环境的,也有不适应环境的,“物竞天择”,自然的选择淘汰了那些不适应的,保留了那些适应的。蛋白质分子的折叠不也与此类似吗?我想,蛋白质的一级结构只是肽链折叠并形成功能蛋白的特定三维结构的内因,实际上,多肽链在形成活性蛋白的每一步,都有潜在的可能形成“不正确”的折叠,如果没有象分子伴侣或其它帮助蛋白等外部因素的作用,多肽链也永远不能折叠成为活性蛋百。) 三,分子伴侣的作用机制 分子伴侣的作用机制实际上就是它如何与靶蛋白识别,结合,又解离的机制。有的分子伴侣具高度专一性,如一些分子内分子伴侣,还有细菌Pseudomonascepacia的酯酶,有它自己的“私有分子伴侣”。它是由基因limA编码的,与酯酶的基因LipA只隔3个碱基,可能是进化过程中发生的基因分裂造成的。而一般的分子伴侣识别特异性不高,它是怎样识别需要它帮助的对象的呢?现在只能说分子伴侣识别非天然构象,而不去理会天然的构象。由于在天然分子中,疏水残基多半位于分子的内部而形成疏水核,去折叠后就可能暴露出来,或者在新生肽段的折叠过程中,会暂时形成在天然构象中本应该存在于分子内部的疏水表面,因此认为分子伴侣最有可能是与疏水表面相结合,如硫氰酸酶(Rhodanese)分子α-helix的疏水侧面。但是只有β-sheet结构的蛋白质才可为分子伴侣识别。 最近关于识别机制有较大的进展。Bip是内质网管腔内的分子伴侣,用一种affinitypanning的方法检查Bip与有随机序列的十二肽结合的特异性,结果发现,Hy-(W/X)-Hy-X-Hy-X-Hymotif与Bipj结合最强,Hy最多的是Trp、Leu、Phe,即较大的疏水残基。一般来说,2-4个疏水残基就足够进行结合。还有一种较普遍的说法是分子伴侣识别所谓熔球体结构(moltenglobule)。另一方面,分子伴侣本身与肽结合部位的结构分析最近也有些进展。譬如,PapD的晶体结构表明,多肽结合在它的β-sheet区。GroEL中,约40kD的153-531结构域是核苷酸的结合区。 分子伴侣作用的第二步是与靶蛋白形成复合物。非常盛行的一种模型认为分子伴侣常常以多聚`体形式而形成中心空洞的结构,用电子显微镜已经观察到由二圈层圆面包圈形组成的十四体GroEL分子和一个一层圆面包圈的七体GroES分子协同作用形成中空的非对称笼状结构(cagemodel),推测靶蛋白可以在与周围环境隔离的中间空腔内不受干扰的进一步折叠。但是不久前一个日本实验室发现GroEL的一个亚基,甚至其N端去除78个氨基酸残基的50kD片段,已经不能再组装成十四体结构,都有确定的分子伴侣功能。由此,我想:也许环状分子伴侣并非每个部位都是有效的结合部位,也就是说,该二层圆面包圈组成的十四体GroEL分子只有一个或若干个部位能够与疏水残基或所谓的熔球体结构结合,而其余部位起识别作用,就像一个探测器一样,整个十四体GroEL分子以圈层或笼状结构”包裹”在多肽链的主链上,以旋进方式再多肽链的链体上运动,一旦环状多聚体的某一识别部位发现疏水结构或所谓的熔球体结构等新生肽链折叠过程中暂时暴露的错误结构,经信号转导,多聚体的结合部位便与之结合,生成复合物,抑制不正确的折叠。以上完全是我个人的猜想,是基于上述两个试验现象的矛盾而试图作一番解释。至于为什么假设以旋进方式在多肽链上运动,我并没有相应的根据,只是觉得这应该是一个动态过程,因此作了一番狂妄的假想,另外,我觉得也许可以用X射线衍射来探测一下分子伴侣GroEL和GroES组成的笼状结构,看看它的a×b×c是否足以容纳多肽链的某一段,或者它的内部和外部的疏水性质和其他一些物化性质如何,也许可以找到支持或驳斥上述假设的证据。 以上谈的都是蛋白质的分子伴侣。不久前又出现了一个新名词“DNAchaperones”,DNA分子伴侣,这种分子伴侣是与DNA相结合并帮助DNA折叠的。在这种复合物中,DNA分子包围在蛋白质分子的表面,既是高度有序的,又是在一定程度上结构已有所改变的。DNA与蛋白的这种相互作用对DNA的转录,复制以及重组都十分重要;或如在核小体中,对DNA的包装是必须的。DNA在溶液中的结构有相当的刚性,必须克服一个能障才能转变成它的蛋白复合物中的结构,分子伴侣的作用就是帮助DNA分子进行折叠和扭曲,从而把DNA稳定在一个适合于和蛋白结构的特定构型中。这种结合是协同的,可逆的在形成复合物之后便解离下来。因此,不论是DNA分子伴侣还是蛋白分子伴侣,都与DNA和蛋白的相互作用有关,与基因调控有关,看来,分子伴侣确实与最终阐明中心法则当前主要问题有密切关系。 四、分子伴侣和酶的区别 与分子伴侣不同,以确定为帮助蛋白质折叠的酶目前只有两个,一个是蛋白质二硫键异构酶(proteindisulfideisomerase,PDI);另一个是肽基脯氨酸顺反异构酶(peptidylprolylcis-transisomerase,PPI)。以PDI为例,众所周知,蛋白质分子中的二硫键与新生肽段的折叠密切相关,对维系蛋白质分子的结构稳定性和功能发挥也有重要作用。PDI定位在内质网管腔内,含量丰富,催化蛋白质分子内巯基与二硫键之间的交换反应。同时,它是目前发现的最为突出的多功能蛋白,除了二硫键的异构酶的基本功能外,它还是脯氨酸-4-羟化酶的α亚基;又是微粒体内甘油三酯转移蛋白复合物的小亚基,还是一种糖基化位点结合蛋白(gkycisylationsitebindingprotein)等。其中,最引人注目的还是它有与多肽结合的能力,可以结合具有不同序列,长度和电荷分布的肽,特异性较低,主要是与肽的主链相作用,但对巯基尚有一些偏爱。按照分子伴侣的定义,一般认为PDI和分子伴侣是两类不同的帮助蛋白,但是我国上海生物物理研究所最近提出不同的看法,认为蛋白质二硫键异构酶也具有分子伴侣的功能。 蛋白质分子中天然二硫键的形成要求这些在肽链上往往处于不相邻位置的巯基,首先通过肽链一定程度的折叠,才能相互接近到可以正确形成二硫键的位置。肽链的自身折叠是一个慢过程,而蛋白质二硫键异构酶催化蛋白质天然二硫键的形成却是一个快过程。另一方面,蛋白质二硫键异构酶具有低特异性的与各种不同肽链相结合的能力,在内质网中以极高的浓度存在,又是是一个钙结合蛋白,是一个能被磷酸化的蛋白,这些都已经符合了分子伴侣的条件。因此他们推测蛋白质二硫键异构酶很可能首先通过它与伸展的,或部分折叠的肽段的结合,阻止错误的折叠途径,促进正确的中间物生成,帮助肽链折叠是相应的巯基配对,从而是正确的二硫键得以形成;然后催化巯基的氧化或二硫键的异构而形成天然二硫键。他们认为蛋白质二硫键异构酶的酶活性与它的分子伴侣功能不是相互排斥,而是密切相关,协调统一的。分子伴侣与帮助新生肽链折叠的酶之间,大概不应该,也不能够划一条绝对的分界线。我想:酶的最主要特性就是催化生化反应,分子伴侣的主要作用是与新生肽段的错误构象结合,从而阻止肽链不正确的非功能的折叠途径,促使其向正确的折叠方向反应,这难道不可以理解成间接的催化肽链的折叠吗?从表观上看,抑制不正确的折叠途径等于加快了正确反应的速度。所以,我本人也很赞成他们的观点。最近的试验已经为这一假说提供了很好的证据。PDI明显抑制变性的甘油醛-3-磷酸脱氢酶在复性股过程中的严重聚合,有效的提高它的复性效率,与典型的分子伴侣GroE系统对甘油醛3-磷酸脱氢酶复性的效应极其相似。 五、分子伴侣的结构 目前唯一解出晶体结构的分子伴侣是的PapD,帮助鞭毛蛋白折叠的分子伴侣。还有HSP70的N端结构域,即ATP结合域也以有晶体结构。用电子显微镜已经清楚的看到了GroEL的十四聚体和GroEL的七聚体的四级结构,象两个圆形中空的面包圈叠在一起,用NMR以及各种溶液构象变化是研究分子伴侣作用机制的有效手段。 六、分子伴侣研究的实际应用 分子伴侣的研究成果必然会大大加深我们对生命现象的认识,同时也一定会增加我们与自然斗争的能力和自身生存的能力。由于分子伴侣在生命活动的各个层次都具有重要作用,它的突变和损伤也必定会引起疾病,因此可以期望运用分子伴侣的知识来治疗所谓的”分子伴侣病”。另一方面,利用对分子伴侣的研究成果从根本上提高基因工程和蛋白工程的成功率,也必将对大幅度提高人类生活水平起重要作用。 [参考书目] 1.李宝健主编,面向21世纪生命科学发展前沿,广东科技出版社,1996年11月第一版:93-104页 2.郝柏林刘寄星主编,理论物理与生命科学,上海科学技术出版社,1997年12月第一版:29-58页 3.中国生物物理代表团,从第十三届国际生物物理大会看生物物理学研究的现状和趋势,生物物理学报,1999年第十五卷第四期:826-827页

蛋白质(protein)是生命的物质基础,没有蛋白质就没有生命。因此,它是与生命及与各种形式的生命活动紧密联系在一起的物质。机体中的每一个细胞和所有重要组成部分都有蛋白质参与。蛋白质占人体重量的,即一个60kg重的成年人其体内约有蛋白质。人体内蛋白质的种类很多,性质、功能各异,但都是由20多种氨基酸按不同比例组合而成的,并在体内不断进行代谢与更新。被食入的蛋白质在体内经过消化分解成氨基酸,吸收后在体内主要用于重新按一定比例组合成人体蛋白质,同时新的蛋白质又在不断代谢与分解,时刻处于动态平衡中。因此,食物蛋白质的质和量、各种氨基酸的比例,关系到人体蛋白质合成的量,尤其是青少年的生长发育、孕产妇的优生优育、老年人的健康长寿,都与膳食中蛋白质的量有着密切的关系[编辑本段]蛋白质的生理功能1、构造人的身体:蛋白质是一切生命的物质基础,是肌体细胞的重要组成部分,是人体组织更新和修补的主要原料。人体的每个组织:毛发、皮肤、肌肉、骨骼、内脏、大脑、血液、神经、内分泌等都是由蛋白质组成,所以说饮食造就人本身。蛋白质对人的生长发育非常重要。比如大脑发育的特点是一次性完成细胞增殖,人的大脑细胞的增长有二个高峰期。第一个是胎儿三个月的时候;第二个是出生后到一岁,特别是0---6个月的婴儿是大脑细胞猛烈增长的时期。到一岁大脑细胞增殖基本完成,其数量已达成人的9/10。所以0到1岁儿童对蛋白质的摄入要求很有特色,对儿童的智力发展尤关重要。2、修补人体组织:人的身体由百兆亿个细胞组成,细胞可以说是生命的最小单位,它们处于永不停息的衰老、死亡、新生的新陈代谢过程中。例如年轻人的表皮28天更新一次,而胃黏膜两三天就要全部更新。所以一个人如果蛋白质的摄入、吸收、利用都很好,那么皮肤就是光泽而又有弹性的。反之,人则经常处于亚健康状态。组织受损后,包括外伤,不能得到及时和高质量的修补,便会加速机体衰退。3、维持肌体正常的新陈代谢和各类物质在体内的输送。载体蛋白对维持人体的正常生命活动是至关重要的。可以在体内运载各种物质。比如血红蛋白—输送氧(红血球更新速率250万/秒)、脂蛋白—输送脂肪、细胞膜上的受体还有转运蛋白等。4、白蛋白:维持机体内的渗透压的平衡及体液平衡。5、维持体液的酸碱平衡。6、免疫细胞和免疫蛋白:有白细胞、淋巴细胞、巨噬细胞、抗体(免疫球蛋白)、补体、干扰素等。七天更新一次。当蛋白质充足时,这个部队就很强,在需要时,数小时内可以增加100倍。7、构成人体必需的催化和调节功能的各种酶。我们身体有数千种酶,每一种只能参与一种生化反应。人体细胞里每分钟要进行一百多次生化反应。酶有促进食物的消化、吸收、利用的作用。相应的酶充足,反应就会顺利、快捷的进行,我们就会精力充沛,不易生病。否则,反应就变慢或者被阻断。8、激素的主要原料。具有调节体内各器官的生理活性。胰岛素是由51个氨基酸分子合成。生长素是由191个氨基酸分子合成。7、构成神经递质乙酰胆碱、五羟色氨等。维持神经系统的正常功能:味觉、视觉和记忆。8、胶原蛋白:占身体蛋白质的1/3,生成结缔组织,构成身体骨架。如骨骼、血管、韧带等,决定了皮肤的弹性,保护大脑(在大脑脑细胞中,很大一部分是胶原细胞,并且形成血脑屏障保护大脑)9、提供热能。[编辑本段]蛋白质的作用蛋白质在细胞和生物体的生命活动过程中,起着十分重要的作用。生物的结构和性状都与蛋白质有关。蛋白质还参与基因表达的调节,以及细胞中氧化还原、电子传递、神经传递乃至学习和记忆等多种生命活动过程。在细胞和生物体内各种生物化学反应中起催化作用的酶主要也是蛋白质。许多重要的激素,如胰岛素和胸腺激素等也都是蛋白质。此外,多种蛋白质,如植物种子(豆、花生、小麦等)中的蛋白质和动物蛋白、奶酪等都是供生物营养生长之用的蛋白质。有些蛋白质如蛇毒、蜂毒等是动物攻防的武器。蛋白质和健康蛋白质是荷兰科学家格里特在1838年发现的。他观察到有生命的东西离开了蛋白质就不能生存。蛋白质是生物体内一种极重要的高分子有机物,占人体干重的54%。蛋白质主要由氨基酸组成,因氨基酸的组合排列不同而组成各种类型的蛋白质。人体中估计有10万种以上的蛋白质。生命是物质运动的高级形式,这种运动方式是通过蛋白质来实现的,所以蛋白质有极其重要的生物学意义。人体的生长、发育、运动、遗传、繁殖等一切生命活动都离不开蛋白质。生命运动需要蛋白质,也离不开蛋白质。球状蛋白质(三级结构)人体内的一些生理活性物质如胺类、神经递质、多肽类激素、抗体、酶、核蛋白以及细胞膜上、血液中起“载体”作用的蛋白都离不开蛋白质,它对调节生理功能,维持新陈代谢起着极其重要的作用。人体运动系统中肌肉的成分以及肌肉在收缩、作功、完成动作过程中的代谢无不与蛋白质有关,离开了蛋白质,体育锻炼就无从谈起。在生物学中,蛋白质被解释为是由氨基酸借肽键联接起来形成的多肽,然后由多肽连接起来形成的物质。通俗易懂些说,它就是构成人体组织器官的支架和主要物质,在人体生命活动中,起着重要作用,可以说没有蛋白质就没有生命活动的存在。每天的饮食中蛋白质主要存在于瘦肉、蛋类、豆类及鱼类中。蛋白质缺乏:成年人:肌肉消瘦、肌体免疫力下降、贫血,严重者将产生水肿。未成年人:生长发育停滞、贫血、智力发育差,视觉差。蛋白质过量:蛋白质在体内不能贮存,多了肌体无法吸收,过量摄入蛋白质,将会因代谢障碍产生蛋白质中毒甚至于死亡。[编辑本段]必需氨基酸和非必需氨基酸纤维状蛋白质(二级结构)食物中的蛋白质必须经过肠胃道消化,分解成氨基酸才能被人体吸收利用,人体对蛋白质的需要实际就是对氨基酸的需要。吸收后的氨基酸只有在数量和种类上都能满足人体需要身体才能利用它们合成自身的蛋白质。营养学上将氨基酸分为必需氨基酸和非必需氨基酸两类。必需氨基酸指的是人体自身不能合成或合成速度不能满足人体需要,必须从食物中摄取的氨基酸。对成人来说,这类氨基酸有8种,包括赖氨酸、蛋氨酸、亮氨酸、异亮氨酸、苏氨酸、缬氨酸、色氨酸、苯丙氨酸。对婴儿来说,组氨酸和精氨酸也是必需氨基酸。非必需氨基酸并不是说人体不需要这些氨基酸,而是说人体可以自身合成或由其它氨基酸转化而得到,不一定非从食物直接摄取不可。这类氨基酸包括谷氨酸、丙氨酸、甘氨酸、天门冬氨酸、胱氨酸、脯氨酸、丝氨酸和酪氨酸等。有些非必需氨基酸如胱氨酸和酪氨酸如果供给充裕还可以节省必需氨基酸中蛋氨酸和苯丙氨酸的需要量。

蛋白质的预测折叠研究论文题目

去年年末,人工智能研究实验室DeepMind的AlphaFold在国际蛋白质结构预测竞赛(CASP)上一骑绝尘,首次将蛋白三维结构预测的分数提升至90分。不到8个月后,DeepMind又为生物学界带来了两个重磅消息。7月15日,他们在《自然》杂志上发布了关于AlphaFold算法的新论文,实现了原子层面上的蛋白质结构精确预测。仅仅一周之后,他们又和欧洲生物信息学研究所(EMBL-EBI)合作发表了一篇《自然》论文。这次,他们想要完成的是一个更大的目标——破解人类蛋白组中所有蛋白质的三维结构。

从人类首次解析出构成蛋白质的氨基酸序列,到如今可以模拟和解析人体蛋白组中绝大多数蛋白的三维结果,科学家已努力了超过70年。1949年,英国生物化学家弗雷德里克·桑格(Frederick Sanger)通过水解胰岛素,首次确定了组成牛胰岛素的氨基酸序列,这也是人类确定的首个蛋白质的氨基酸序列。这些氨基酸序列是牛胰岛素的一级结构,如果我们只按照这个序列合成胰岛素,得到的产物不会有活性。氨基酸序列需要通过数步折叠过程,形成复杂的3级结构后,才能成为具有功能的蛋白质。

1965年,中国科学家首次解析出胰岛素的精确结构,人工合成出了具有活性的胰岛素。在人类的蛋白组中,胰岛素是一种结构简单的小型蛋白质,它含有两条肽链,有51个氨基酸。对人类等真核生物来说,一个蛋白质中平均含有400多个氨基酸残基,其中绝大部分蛋白质的空间结构远比胰岛素复杂。

人类基因组草图公布后,科学界对蛋白质的研究进入了快车道。经过数十年的努力,研究人员通过解析蛋白质的氨基酸序列、提取纯净和高质量的蛋白质,再加上冷冻电子显微镜的应用,至今已经解析出了超过5万个人源蛋白质的三维结构。无疑,我们获得蛋白三维结构的速度正在不断变快。

不过,实验解析蛋白质也受到诸多限制。由于这一过程过于繁琐,且稍有不慎就无法获得较好的蛋白质空间结构,因此仍有大量人源蛋白质结构有待破解。与此同时,一些科学家开始尝试另一种工具——借助人工智能(AI)技术来预测蛋白的空间结构。

1994年,计算生物学家约翰·莫尔特(John Moult)等人创立了CASP比赛,让AI加入到蛋白质三维结构的研究中。不过在此之后的20多年中,各个AI实验室在这项比赛中的始终缺乏实质性突破。直到DeepMind的加入,彻底改变了这一局面。

2020年,DeepMind开发的一款蛋白质三维结构预测算法“AlphaFold”一举夺得了当年CASP比赛的最高分(GDT分数为90分),比第二名的分数高出了15%。GDT分数主要用来评估算法预测三维结构中氨基酸的位置与实际空间结构的差距,分数越高,预测越准。当时AlphaFold就像是一枚投在生物学界的炸弹,当时《自然》《科学》等相继发文,强调了这是人工智能的一次重大胜利。

在细胞中,蛋白质的折叠过程需要分子蛋白或辅助蛋白的帮助。而我们能看到的是,一些氨基酸序列通过一系列变化,形成了一个具有三维结构和活性的蛋白质。在蛋白质中,具有相同特性的氨基酸通过特殊的共价键(例如二硫键)聚集到一起,形成一些特定的螺旋结构,比化学键更加微弱的分子间作用力维系着蛋白质的三维结构。

但是,依靠这些理论还远远不足以准确预测蛋白质的三维结构,这也是很多参与CASP比赛的算法分数不高的原因。在今年7月15日一项公布于《自然》的论文中,DeepMind的研究团队详细介绍了AlphaFold成功的原因。这一算法采取了多序列比对和一种新型的神经网络架构,将重点放在一些关键的氨基酸上。此外,这一算法还纳入了结构模块(Structure Module),用于评估预测的蛋白质结构的每个氨基酸残基与其真实位点的差异。DeepMind的研究团队还强调,AlphaFold是首个在不知道相似蛋白的结构时,也可以在原子层面上精确预测蛋白质结构的算法。

昨日,在发表于《自然》期刊的一项研究中,他们和EMBL-EBI合作利用AlphaFold做出了一项更有突破性和实用性的研究—— 直接对人类蛋白组中的蛋白质完整三维的结构进行了预测 。根据他们的估计,虽然蛋白质资料库(PDB)中公布的人源蛋白质三维结构占到了目前人类蛋白组的35%,但是很多蛋白质的空间结构并不完整。实际上,完整的三维蛋白质结构只占17%。

类似于CASP比赛中的GDT分数,研究人员也为AlphaFold设置了一个可以评估预测可信度的数值—— pLDDT (每个残基位点的可信度测评,per-residue confidence metric)。当pLDDT值大于90,表示对蛋白质中某个氨基酸残基位置的预测具有很高的可信度;当pLDDT值大于70,表明预测结果是基本准确的。

在对人体蛋白质组三维结构的预测中, AlphaFold精确预测了的氨基酸残基的位点,基本准确地预测了的氨基酸的位点。 在蛋白质水平上,这一算法也能较为准确地预测人类蛋白组中的蛋白质至少3/4序列的空间结构。在1290个没有没有参考结构的蛋白质中,AlphaFold能较为准确预测每个蛋白中近200个氨基酸残基的空间结构(pLDDT 70)。

在这次实验中,AlphaFold还 准确预测出由于许多和药物靶点相关的酶和膜蛋白的三维结构 。由于膜蛋白的结构复杂,一直以来,通过实验方法来解析这类蛋白的结构都极具挑战性。除此之外,AlphaFold还能较为准确地预测出此前没有接受过训练或不熟悉的蛋白质的三维结构。

除了人源的蛋白质,他们还利用AlphaFold对其他20种模式生物(包括小鼠、玉米和疟原虫)蛋白组中的蛋白进行了预测。根据《自然》官网的消息,这些预测的蛋白质三维结构数据已通过EMBL-EBI托管的 公用数据库 免费向公众开放, 目前有近万个蛋白质结构已在该数据库中发布 ,而到今年年底,这一数值有望增长到亿。DeepMind和EMBL-EBI的研究人员强调,目前这部分工作还只是一个开始。他们想要进一步验证这些预测的结果,更重要的是,将它们应用到迄今为止不可能实现的实验中。

近70年来,解析蛋白质的空间结构一直是一项极具科学意义的难题。如果基因组是一个“指令官”,那么蛋白质就是基因功能的“执行者”,可以说蛋白质几乎参与人体内所有的生理过程和疾病过程。如果我们能掌握蛋白质的精确结构,就像解析了一把精密的锁的内部结构。对于人类来说,也更容易开发出一把甚至多把能打开这些“锁”的钥匙,而这将会改变我们在分子水平上对自身的认知,治疗现今绝大多数的人类疾病。

DeepMind联合创始人兼首席执行官杰米斯·哈萨比斯(Demis Hassabis)认为,这是人工智能系统迄今为止对推进科学发展作出的最大贡献。此外,对于一些AlphaFold无法准确预测的蛋白结构,一些科学家也发表了自己的见解。一部分人认为,在人类等真核生物中,相当一部分蛋白质区域本身就是无序的,这或许是为了与其他的蛋白分子相互作用,也可能还有一些我们还不知道的作用。

值得一提的是,在《自然》于上周发表AlphaFold论文的次日,《科学》杂志也公布了另一项蛋白质预测算法——RoseTTAFold。这个算法由华盛顿大学医学院蛋白质设计研究所和哈佛大学、剑桥大学等机构联合开发。它采用和AlphaFold2不同的深度学习算法,但具有AlphaFold2可媲美的超高准确率,而且速度更快、对计算机处理能力的需求也较少,能在短短的10分钟内计算出一个蛋白的结构。目前,研究人员正在用这一算法研究一些和人类 健康 直接相关的蛋白质的结构。

这两项算法的出现无疑标志着在结构生物学领域,AI的时代已经到来。

撰文 | 石云雷

审校 | 吴非

参考链接:

生态 的蛋白质我肯定好的

我是复制的,希望对楼主能有所帮助※ Multiplexing:一种同时采用多种样品的测序方法,能够大大提高测序速度。 ※ 突变(Mutation):DNA序列上任一种可以被遗传的变易。 ※ 核苷酸(Nucleotide):DNA和RNA的基本组成部分,通常包含一分子核糖,一分子磷酸和一分子碱基。多个核苷酸通过磷酸二酯键连接成一条链状。 ※ 细胞核(Nucleos):真核细胞中的一种细胞器,内含遗传物质。 癌基因(Oncogene):一种能够导致癌症的基因。许多致癌基因都直接或间接地控制细胞的成长速度。 ※ 噬菌体(phage):一种以细菌为宿主细胞的病毒。 ※ 物理图谱(Physics Map):物理图谱描绘DNA上可以识别的标记的位置和相互之间的距离(以碱基对的数目为衡量单位),这些可以识别的标记包括限制性内切酶的酶切位点,基因等。物理图谱不考虑两个标记共同遗传的概率等信息。对于人类基因组来说,最粗的物理图谱是染色体的条带染色模式,最精细的图谱是测出DNA的完整碱基序列。 ※ 质粒(Plasmid):质粒是细菌的染色体外能够自我复制的环状DNA分子。它能够和细胞核中的染色体明显地区别开来,而且并不是细胞生存的必要物质。一些质粒适宜于引入到宿主细胞中去,并利用宿主细胞的DNA大量繁殖,因此我们常常采用质粒作为外源DNA的载体,外源DNA借助于质粒在宿主细胞中大量繁殖。 ※ 多基因病(Polygenic Disorder):有多个基因位点共同决定的遗传病(如心脏病、糖尿病、一些癌症等)。这类疾病的遗传由多个基因位点共同控制,因而比单基因病的遗传更为复杂。 ※ 多聚酶链式反应(PCR):一种体外扩增DNA的方法。PCR使用一种耐热的多聚酶,以及两个含有20个碱基的单链引物。经过高温变性将模板DNA分离成两条链,低温退火使得引物和一条模板单链结合,然后是中温延伸,反应液的游离核苷酸紧接着引物从5‘端到3’端合成一条互补的新链。而新合成的DNA又可以继续进行上述循环,因此DNA的数目不断倍增。 ※ 多聚酶(Polymerase):多聚酶具有催化作用,能够加快游离的核苷酸和DNA模板结合形成新链的反应速度。 ※ 多态性(Polymorphism):多个个体之间DNA的差异称为多态性。DNA变异概率超过1%的变异,比较适宜作为绘制连接图谱的证据。 ※ 引物(Primer):预先制备的比较短的核苷酸链,在新链合成过程中作为引物,游离的核苷酸在引物之后按顺序和模板上的碱基结合,形成新链。 ※ 原核生物(Prokaryote):原核生物没有细胞膜,结构清晰的核以及其他细胞器。细菌是原核生物。 ※ 探针(Probe):是一条DNA单链或者一条RNA链,具有特定的序列,并且使用放射性元素或者免疫特性物质进行标记。探针和克隆库中的某条互补片段结合成一条双链结构,我们可以借助于探针的检测来获知与其互补的链的位置。 ※ 启动子(Promoter):DNA上的一个特定位点,RNA聚合酶在此和DNA结合,并由此开始转录过程。 ※ 蛋白质(Protein):一种由一条或者多条肽链构成的大分子。每条肽链上核苷酸的顺序是由基因外显子部分的碱基序列决定的。蛋白质是细胞、组织和器官的重要组成部分,每种蛋白质都具有特定的功能。酶、抗体和激素等都是蛋白质。 ※ 嘌呤(Purine):一种含氮的单环结构物。是核苷酸的重要组成部分,有腺嘌呤A和鸟嘌呤G两种。 ※ 嘧啶(Pyrimidine):一种含氮的双环结构,是核苷酸的重要组成部分。分为胞嘧啶C,胸腺嘧啶T和尿嘧啶U三种。 ※ 重组克隆(Recombinant Clone):将不同来源的DNA片段合成在一个DNA分子中,这种技术称为重组,得到的分子为重组克隆。 ※ DNA重组技术(Recombinant DNA Technology):在细胞体外将两个DNA片段连接成一个DNA分子的技术。在适宜的条件下,一个重组DNA分子能够被引入到宿主细胞中并在宿主细胞中大量繁殖。 ※ 调控序列(regulatory regions and sequence):一段控制基因表达的DNA片段。 ※ 限制性内切酶(Restriction enzyme, endonuclease):这种酶能够识别出DNA上特定的碱基序列,并在这个位点将DNA酶切。细菌中有400中限制性内切酶,能够识别出100中DNA序列。 ※ 酶切位点(Restriction Enzyme cutting site):DNA上一段碱基的特定序列,限制性内切酶能够识别出这个序列并在此将DNA酶切成两段。 ※ 限制性长度多态性(Restriction fragment length polymorphsm):从不同个体制备的DNA,使用同一种限制性内切酶酶切,切得的片段长度各不相同。酶切片段的长度可以作为物理图谱或者连接图谱中的标记子。通常是在酶切位点处发生突变而引发的。 ※ 核糖核酸RNA(Ribonucleic acid):从细胞的细胞核和细胞质部分分离出来的化学物质。在蛋白质合成和其他生化反应中起着重要作用,RNA的结构和DNA的结构类似,都是有核苷酸按照一定顺序排列成的长链。RNA可以分为信使RNA、转运RNA、核糖体RNA以及其他类型的RNA。 ※ 核糖体RNA(Ribonsomal RNA rRNA):存在于核糖体中的RNA。 ※ 核糖体(Ribonsome):细胞质中含有rRNA和相关蛋白质的细胞器,是蛋白质的合成场所。 序列位置标签(Sequence Tagged Site, STS):一段短的DNA序列(200-500个碱基对),这种序列在染色体上只出现一次,其位置和碱基顺序都是已知的。在PCR反应中可以检测处STS来,STS适宜于作为人类基因组的一种地标,据此可以判定DNA的方向和特定序列的相对位置。ETS是cDNA上的STS。 ※ 性染色体(Sex Chromosome):在人类细胞中是X或者Y染色体,性染色体决定了个体的性别。雌性细胞中含有两个X染色体,而雄性细胞中含有1个X染色体和1个Y染色体。 ※ 鸟枪法(Shotgun method):使用基因组中的随机产生的片段作为模板进行克隆的方法。 ※ 单基因病(Single Gene Disorder):一个基因的等位基因之间发生了突变造成的疾病。 ※ 体细胞(Somatic Cells):个体中除了生殖细胞及其母细胞之外的细胞,都是体细胞。 ※ 串联重复序列(Tandem repeat sequences):在染色体上一段序列的多次重复,称为串联重复序列。常用来作为物理图谱中的标记子。 ※ 端粒(Telomere):是染色体的末端部分,这一特殊结构区域对于线型染色体的结构和稳定起重要作用。 ※ 转录(Transcription):以某一DNA链为模板,按照碱基互补原则形成一条新的RNA链的过程,是基因表达的第一步。 ※ 转运RNA(tRNA):转运RNA具有特殊的结构,其一端包含3个特定的核苷酸序列,能和信使RNA上的密码子按照碱基配对原则进行结合。另一端则带有一个氨基酸。因此转运RNA能够同细胞质中游离的氨基酸结合并运到核糖体上,核糖体按mRNA上的遗传信息将氨基酸装配成蛋白质。 ※ 转化(Transformation):将外源DNA整合到某一细胞基因组中的过程。。 ※ 翻译(Translation):mRNA上携带的遗传信息指导蛋白质的合成过程,称为翻译。 ※ 病毒(Virus):一种不具备细胞结构的生物体。只能寄生在宿主细胞中才能生存。病毒一般包含核酸以及外壳蛋白,有些动物的病毒的外面也偶尔覆盖一层细胞膜。病毒进入宿主细胞之后,利用宿主的合成机制复制出大量的后代。。 ※ 酵母菌人工合成染色体(Yeast Artificial Chromosome):一种能够克隆长达400Kb的DNA片段的载体,含有酵母细胞中必需的端粒、着丝点和复制起始序列。 (卜东波、伍树明翻译整理) 生物信息名词 §§§ BLAST (Basic Local Alignment Search Tool),基本的基于局部对准的搜索工具;一种快速查找与给定序列具有连续相同片断的序列的技术。 §§§ Entrez 美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。 §§§ NCBI 美国国立生物技术信息中心(National Center for Biotechnology Information),1988年设立,为美国国家医学图书馆(NLM)和国家健康协会(NIH)下属部门之一。提供生物医学领域的信息学服务,如世界三大核酸数据库之一的GenBank数据库,PubMed医学文献检索数据库等。 §§§ Conserved sequence 保守序列。演化过程中基本上不变的DNA中的碱基序列或蛋白质中的氨基酸序列。 §§§ Domain 功能域。蛋白质中具有某种特定功能的部分,它在序列上未必是连续的。某蛋白质中所有功能域组合其起来决定着该蛋白质的全部功能。 §§§ EBI 欧洲生物信息学研究所(European Bioinformatics Institute)。 The National Center for Biotechnology Information (NCBI) at the NationalLibrary of Medicine (NLM), National Institutes of Health (NIH) §§§ EMBL 欧洲分子生物学实验室(uropean Molecular Biology Laboratory)。 §§§ GenBank 由美国国家生物技术信息中心提供的核酸序列数据库。 §§§ Gene 基因。遗传的基本的物理和功能单位。一个基因就是位于某条染色体的某个位置上的核苷酸序列,其中蕴含着某种特定功能产物(如蛋白质或RNA分子)的编码。 §§§ DUST A program for filtering low complexity regions from nucleic acid sequences. §§§ Gene expression 基因表达。基因中的编码信息被转换成行使特定功能的结构产物的过程。 §§§ Gene family 基因家族。一组密切相关的编码相似产物的基因。 §§§ Gene mapping 基因作图。对DNA分子(染色体或质粒)中基因的相对位置和距离进行确定的过程。 §§§ Genetic code 遗传密码。以三联体密码子的形式编码于mRNA中的核苷酸序列,决定着所合成蛋白质中的氨基酸序列。 Genome 基因组。某一物种的一套完整染色体组中的所有遗传物质。其大小一般以其碱基对总数表示。 §§§ Genomics 基因组学。从事基因组的序列测定和表征描述,以及基因活性与细胞功能关系的研究。 §§§ HGMP 英国剑桥的人类基因组绘图计划(Human Genome Mapping Project)。 §§§ Informatics 信息学。研究计算机和统计学技术在信息处理中的应用的学科。在基因组计划中,信息学的内容包括快速搜索数据库方法的开发、DNA序列信息分析方法的开发和从DNA序列数据中预测蛋白质序列和结构方法的开发。 §§§ Physical map 物理图谱。不考虑遗传,DNA中可识别的界标(如限制性酶切位点和基因等)的位置图。界标之间的距离用碱基对度量。对人类基因组而言,最低分辨率的物理图谱是染色体上的条带图谱;最高分辨率的物理图谱是染色体中完整的核苷酸序列。 §§§ Promoter 启动子。DNA中被RNA聚合酶结合并从此起始转录的位点。 §§§ Proteome 蛋白质组。一个基因组的全部蛋白产物及其表达情况。 §§§ Regulatory region or sequence 调控区或调控序列。控制基因表达的DNA碱基序列。 §§§ Ribosomal RNA 核糖体RNA。简写为rRNA。是一组存在于核糖体中的RNA分子。 §§§ Sequence tagged site 序列示踪位点,简写为STS。在人类基因组中只出现一次的位置和序列已知的长约200到500bp的短DNA序列片断。由于可以通过PCR检测到,STS在将来源于许多不同实验室的基因图谱和测序数据进行定位和定向时非常有用,并且STS在人类基因组的物理图谱中也具有界标的作用。表达的序列标签(ESTs)就是那些得自cDNAs的STSs。 §§§ Single-gene disorder 单基因病。由单个基因的等位基因的突变所导致的遗传病(如杜兴肌营养不良和成视网膜细胞瘤等)。 §§§ UniGene 美国国家生物技术信息中心提供的公用数据库,该数据库将GenBank中属于同一条基因的所有片断拼接成完整的基因进行收录。 §§§ 非蛋白质编码区(“Junk”DNA)占据了人类基因组的大部分,研究表明“Junk”是许多对生命过程富有活力的不同类型的DNA的复合体,它们至少包括以下类型的DNA成份或由其表达的RNA成分:内含子(intron)、卫星(Satellite)DNA、小卫星(minisatellite)DNA、微卫星(microsatellite)DNA、非均一核RNA(hmRNA)、短散置元(short interspersed elements)、长散置元(long interspersed elements)、伪基因(pseudogenes)等。除此之外,顺式调控元件,如启动子、增强子等也属于非编码序列。 双重序列对比 两序列间的对比分析。最常见的方法为Needle-Wunsch方法。能够利用的软件如BLAST、FASTA等。 §§§ Autosome 常染色体。与性别决定无关的染色体,人双倍体染色体组含有46条染色体,其中22对常染色体,一对与性别决定有关的性染色体(X和Y染色体)。 sex chromosome. 包括序列(核酸与蛋白)搜索,结构比较,结构预测,蛋白质域,模体(Motif ),测序,发育与进化分析,双向电泳成像分析,质谱蛋白质鉴定,三维蛋白结构模建与成像,基因组图谱比较,基因预测,非编码区功能位点识别,基因组重叠群集装,后基因组功能分析,结构基因组学以及药物基因组学等等。 在,新版中启用了gapped BLAST、PSI-BLAST 和PHI-BLAST。gapped BLAST是比原BLAST 更灵敏更快的局部相似联配(俗称局部同源)搜索法;PSI- BLAST用迭代型的剖面打分算法,每次迭代所费时间与前者相同,它可检索弱同源的目标;PHI-BLAST 98年刚出台,是模体(Motif )构造与搜索软件,是更灵敏的同源搜索软件。例如线虫§§§ 的CED4是apoptosis 的调控蛋白,含有涉及磷酸结合的P 环模体,在各种ATP 酶和GTP 酶中可发现。在用gapped BLAST搜索NR数据库时,CED4仅跟人凋亡调控蛋白Apaf-1显著同源或相似(其中含有P-loop保守区)。但PHI- BLAST搜索,另有一个显著同源(E= )目标,是植物抗病蛋白Arabidopsis thaliana ,证实此动物与植物蛋白确实在apoptosis 中有相似的功能。另有,按PHI- BLAST搜索在MutL DNA修复蛋白中的ATP 酶域,II型拓扑异构酶,组氨酸激酶和HS90家族蛋白,发现一个新的真核蛋白族,共有HS90型ATP 酶域。再有在古核tRNA核苷酸转移酶中发现核苷酸转移酶域,在细菌DNA 引物酶的古核同源体中发现螺旋酶超家族II的模体VI。用以往的搜索法这些是得不到的。 深层事项: 后基因组时期的主要任务:Data mining ,即从完全测序的基因组中预测功能。 1 、序列、结构和功能 自分子生物学产生以来,均相信序列决定结构,结构决定功能。随着基因组学的发展,对此理解已有长足的深化。同源序列(具有共同祖先)未必具有相同的功能;相同功能未必源自同源序列。相异序列可能有相似的结构;序列与结构不相似的蛋白可能会有相似的功能。现在发现存在不相似(在序列与结构水平上)酶催化相同的生化反应。当然亦存在甚至结构水平上很相似的酶催化不同的生化反应。例如人与鼠的3?- 羟甾类脱氢酶,1AHH和1RAL;前者是Rossmann折叠,而后者是TIM-桶。肯定,这些相似酶不是共同祖先趋异的结果,而是不同祖先趋同的结果。如结构决定功能还是合理的,那么至少在功能活性位点具有相似结构特征(即3D- 功能模体)。属于今后研究的课题,对了解酶催化机制与功能蛋白的小分子模拟具有很大价值。 何谓功能?功能有层次的:表型的,细胞的和分子的。 目前开始高层功能预测,分子相互作用、代谢途径和调控网络。目前,已从结构基因组学,功能基因组学和蛋白质组学多种角度研究基因组功能。 2 、结构基因组学中的生物信息学 希望大通量地测定和模建完全测序基因组的全部蛋白三维结构。生物信息学可以发挥作用,一方面规划好测定的对象,另一方面可靠地模建结构。 3 、功能基因组学中的生物信息学 美国HGP 已编制1998-2003 的新五年计划。提出八项目标:其中目标7 特指生物信息学和计算生物学,其实几乎每项目标都要生物信息学,例如目标4 功能基因组学中的非编码区功能位点预测,基因表达分析(如DNA Chip)以及蛋白质全局分析(如蛋白质组学)。 §§§ 蛋 白 质 组 学(Proteomics) 1.蛋白质组学研究的目的和任务 20世纪中期以来,随着DNA双螺旋结构的提出和蛋白质空间结构的X射线解析,开始了分子生物学时代,对遗传信息载体DNA和生命功能的主要体现者蛋白质的研究,成为生命科学研究的主要内容。90年代初期,美国生物学家提出并实施了人类基因组计划,预计用15年的时间,30亿美元的资助,对人类基因组的全部DNA序列进行测定,希望在分子水平上破译人类所有的遗传信息,即测定大约30亿碱基对的DNA序列和识别其中所有的基因(基因组中转录表达的功能单位)。经过各国科学家8年多的努力,人类基因组计划已经取得了巨大的成绩,一些低等生物的DNA全序列已被阐明,人类3%左右DNA的序列也已测定,迄今已测定的表达序列标志(EST)已大体涵盖人类的所有基因。在这样的形势下,科学家们认为,生命科学已经入了后基因组时代。在后基因组时代,生物学家们的研究重心已经从解释生命的所有遗传信息转移到在整体水平上对生物功能的研究。这种转向的第一个标志就是产生了一门成为功能基因组学(Functional Genomics)的新学科。它采用一些新的技术,如SAGE、DNA芯片,对成千上万的基因表达进行分析和比较,力图从基因组整体水平上对基因的活动规律进行阐述。但是,由于生物功能的主要体现者是蛋白质,而蛋白质有其自身特有的活动规律,仅仅从基因的角度来研究是远远不够的。例如蛋白质的修饰加工、转运定位、结构变化、蛋白质与蛋白质的相互作用、蛋白质与其它生物分子的相互作用等活动,均无法在基因组水平上获知。正是因为基因组学(Genomics)有这样的局限性,于90年代中期,在人类基因组计划研究发展及功能基因组学的基础上,国际上萌发产生了一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科——蛋白质组学(Proteomics),它以蛋白质组(Proteome)为研究对象。蛋白质组是指“由一个细胞或一个组织的基因组所表达的全部相应的蛋白质”。测定一个有机体的基因组所表达的全部蛋白质的设想,萌发在1975年双向凝胶电泳发明之时。1994年Williams正式提出了这个问题,而“蛋白质组”的名词则是由Wilkins创造的,发表在1995年7月的Electrophoresis杂志上。蛋白质组与基因组相对应,但二者又有根本不同之处:一个有机体只有一个确定的基因组,组成该有机体的所有不同细胞斗拱享用一个确定的基因组;而蛋白质组则是一个动态的概念,她不仅在同一个机体的不同组织和细胞中不同,在同一机体的不同发育阶段,在不同的生理状态下,乃至在不同的外界环境下都是不同的。正是这种复杂的基因表达模式,表现了各种复杂的生命活动,每一种生命运动形式,都是特定蛋白质群体在不同时间和空间出现,并发挥功能的不同组合的结果。基因DNA的序列并不能提供这些信息,再加上由于基因剪接,蛋白质翻译后修饰和蛋白质剪接,基因遗传信息的表现规律就更加复杂,不再是经典的一个基因一个蛋白的对应关系,一个基因可以表达的蛋白质数目可能远大于一。对细菌,可能为~;对酵母则为3;而对人,可高达10。后基因组和蛋白质组研究,是为阐明生命活动本质所不可缺少的基因组研究的远为复杂的后续部分,无疑将成为21世纪生命科学研究的主要任务。

你看下(微生物前沿)上的文献吧,

蛋白质结构分析论文

浅谈蛋白质折叠的有关问题 [关键字]生物 大分子 分子伴侣 蛋白质的折叠 识别 结合 生物大分子的结构与功能的研究是了解分子水平的先象的基础。没有对生物大分子的结构与功能的认识,就没有分子生物学。正如没有DNA双螺旋结构的发现,就没有遗传传达传递的中心法则,也就没有今天的分子生物学。结构分子以由第一分子进入对复和物乃至多亚基,多分子复和体结构研究。同时,过去难以研究的分子水平上的生命运动情况也随着研究的深入和技术手段的发展而逐渐由难点变为热点。蛋白质晶体学研究已从生物大分子静态(时间统计)的结构分析开始进入动态(时间分辨)的结构分析及动力学分析。第十三届国际生物物理大会的25个专题讨论会中有一半以上涉及蛋白质的结构与功能,而“结构与功能”又强调“动力学(Dynamics)”,即动态的结构或结构的运动与蛋白质分子功能的关系,以及对大分子相互作用的贡献。 蛋白质折叠问题被列为“21世纪的生物物理学”的重要课题,它是分子生物学中心法则尚未解决的一个重大生物学问题。从一级序列预测蛋白质分子的三级结构并进一步预测其功能,是极富挑战性的工作。研究蛋白质折叠,尤其是折叠早期过程,即新生肽段的折叠过程是全面的最终阐明中心法则的一个根本问题,在这一领域中,近年来的新发现对新生肽段能够自发进行折叠的传统概念做了根本的修正。这其中,X射线晶体衍射和各种波谱技术以及电子显微镜技术等发挥了极其重要的作用。第十三届国际生物物理大会上,Nobel奖获得者Ernst在报告中强调指出,NMR用于研究蛋白质的一个主要优点在于它能极为详细的研究蛋白质分子的动力学,即动态的结构或结构的运动与蛋白质分子功能的关系。目前的NMR技术已经能够在秒到皮秒的时间域上观察蛋白质结构的运动过程,其中包括主链和侧链的运动,以及在各种不同的温度和压力下蛋白质的折叠和去折叠过程。蛋白质大分子的结构分析也不仅仅只是解出某个具体的结构,而是更加关注结构的涨落和运动。例如,运输小分子的酶和蛋白质通常存在着两种构象,结合配体的和未结合配体的。一种构象内的结构涨落是构象转变所必需的前奏,因此需要把光谱学,波谱学和X射线结构分析结合起来研究结构涨落的平衡,构象改变和改变过程中形成的多种中间态,又如,为了了解蛋白质是如何折叠的,就必须知道折叠时几个基本过程的时间尺度和机制,包括二级结构(螺旋和折叠)的形成,卷曲,长程相互作用以及未折叠肽段的全面崩溃。多种技术用于研究次过程,如快速核磁共振,快速光谱技术(荧光,远紫外和近紫外圆二色)。 一、新生肽段折叠研究中的新观点 长期以来关于蛋白质折叠,形成了自组装(self-assembly)的主导学说,因此,在研究新生肽段的折叠时,就很自然的把在体外蛋白质折叠研究中得到的规律推广到体内,用变性蛋白的复性作为新生肽段折叠的模型,并认为细胞中新合成的多肽链,不需要别的分子的帮助,不需要额外能量的补充,就应该能够自发的折叠而形成它的功能状态。 1988年,邹承鲁明确指出,新生肽段的折叠在合成早期业已开始,而不是合成完后才开始进行,随着肽段的延伸同时折叠,又不断进行构象的调整,先形成的结构会作用于后合成的肽段的折叠,而后合成的结构又会影响前面已形成的结构的调整。因此,在肽段延伸过程中形成的结构往往不一定是最终功能蛋白中的结构。这样,三维结构的形成是一个同时进行着的,协调的动态过程。九十年代一类具有新的生物功能的蛋白,分子伴侣(Molecularchaperone)的发现,以及在更广泛意义上说的帮助蛋白质折叠的辅助蛋白(Accessoryprotein)的提出,说明细胞内新生肽段的折叠一般意义上说是需要帮助的,而不是自发进行的。 二、蛋白质分子的折叠和分子伴侣的作用 蛋白质分子的三维结构,除了共价的肽键和二硫键,还靠大量极其复杂的弱次级键共同作用。因此新生肽段在一边合成一边折叠过程中有可能暂时形成在最终成熟蛋白中不存在不该有的结构,他们常常是一些疏水表面,它们之间很可能发生本不应该有的错误的相互作用而形成的非功能的分子,甚至造成分子的聚集和沉淀。按照自组装学说,每一步折叠都是正确的,充分的,必要的。实际上折叠过程是一个正确途径和错误途径相互竞争的过程,为了提高蛋白质生物合成的效率的,应该有帮助正确途径的竞争机制,分子伴侣就是这样通过进化应运而生的。它们的功能是识别新生肽段折叠过程中暂时暴露的错误结构的,与之结合,生成复和物,从而防止这些表面之间过早的相互作用,阻止不正确的非功能的折叠途径,抑制不可逆聚合物产生,这样必然促进折叠向正确方向进行。(从哲学的观点说,似乎很容易驳斥自组装学说,它违背了矛盾的普遍性原理,试想,如果蛋白质的每一步折叠均是正确的,充分的,必要的,岂不是在无任何矛盾的前提下,完成了复杂的最稳定构象的形成,即完成了由量变到质变的伟大飞跃,从无活性的肽链变成有活性的功能蛋白,这显然是违背哲学基本原理的。换一个角度想,生物进化的过程本来就充满着不定向的变异,这些变异中有适应环境的,也有不适应环境的,“物竞天择”,自然的选择淘汰了那些不适应的,保留了那些适应的。蛋白质分子的折叠不也与此类似吗?我想,蛋白质的一级结构只是肽链折叠并形成功能蛋白的特定三维结构的内因,实际上,多肽链在形成活性蛋白的每一步,都有潜在的可能形成“不正确”的折叠,如果没有象分子伴侣或其它帮助蛋白等外部因素的作用,多肽链也永远不能折叠成为活性蛋百。) 三,分子伴侣的作用机制 分子伴侣的作用机制实际上就是它如何与靶蛋白识别,结合,又解离的机制。有的分子伴侣具高度专一性,如一些分子内分子伴侣,还有细菌Pseudomonascepacia的酯酶,有它自己的“私有分子伴侣”。它是由基因limA编码的,与酯酶的基因LipA只隔3个碱基,可能是进化过程中发生的基因分裂造成的。而一般的分子伴侣识别特异性不高,它是怎样识别需要它帮助的对象的呢?现在只能说分子伴侣识别非天然构象,而不去理会天然的构象。由于在天然分子中,疏水残基多半位于分子的内部而形成疏水核,去折叠后就可能暴露出来,或者在新生肽段的折叠过程中,会暂时形成在天然构象中本应该存在于分子内部的疏水表面,因此认为分子伴侣最有可能是与疏水表面相结合,如硫氰酸酶(Rhodanese)分子α-helix的疏水侧面。但是只有β-sheet结构的蛋白质才可为分子伴侣识别。 最近关于识别机制有较大的进展。Bip是内质网管腔内的分子伴侣,用一种affinitypanning的方法检查Bip与有随机序列的十二肽结合的特异性,结果发现,Hy-(W/X)-Hy-X-Hy-X-Hymotif与Bipj结合最强,Hy最多的是Trp、Leu、Phe,即较大的疏水残基。一般来说,2-4个疏水残基就足够进行结合。还有一种较普遍的说法是分子伴侣识别所谓熔球体结构(moltenglobule)。另一方面,分子伴侣本身与肽结合部位的结构分析最近也有些进展。譬如,PapD的晶体结构表明,多肽结合在它的β-sheet区。GroEL中,约40kD的153-531结构域是核苷酸的结合区。 分子伴侣作用的第二步是与靶蛋白形成复合物。非常盛行的一种模型认为分子伴侣常常以多聚`体形式而形成中心空洞的结构,用电子显微镜已经观察到由二圈层圆面包圈形组成的十四体GroEL分子和一个一层圆面包圈的七体GroES分子协同作用形成中空的非对称笼状结构(cagemodel),推测靶蛋白可以在与周围环境隔离的中间空腔内不受干扰的进一步折叠。但是不久前一个日本实验室发现GroEL的一个亚基,甚至其N端去除78个氨基酸残基的50kD片段,已经不能再组装成十四体结构,都有确定的分子伴侣功能。由此,我想:也许环状分子伴侣并非每个部位都是有效的结合部位,也就是说,该二层圆面包圈组成的十四体GroEL分子只有一个或若干个部位能够与疏水残基或所谓的熔球体结构结合,而其余部位起识别作用,就像一个探测器一样,整个十四体GroEL分子以圈层或笼状结构”包裹”在多肽链的主链上,以旋进方式再多肽链的链体上运动,一旦环状多聚体的某一识别部位发现疏水结构或所谓的熔球体结构等新生肽链折叠过程中暂时暴露的错误结构,经信号转导,多聚体的结合部位便与之结合,生成复合物,抑制不正确的折叠。以上完全是我个人的猜想,是基于上述两个试验现象的矛盾而试图作一番解释。至于为什么假设以旋进方式在多肽链上运动,我并没有相应的根据,只是觉得这应该是一个动态过程,因此作了一番狂妄的假想,另外,我觉得也许可以用X射线衍射来探测一下分子伴侣GroEL和GroES组成的笼状结构,看看它的a×b×c是否足以容纳多肽链的某一段,或者它的内部和外部的疏水性质和其他一些物化性质如何,也许可以找到支持或驳斥上述假设的证据。 以上谈的都是蛋白质的分子伴侣。不久前又出现了一个新名词“DNAchaperones”,DNA分子伴侣,这种分子伴侣是与DNA相结合并帮助DNA折叠的。在这种复合物中,DNA分子包围在蛋白质分子的表面,既是高度有序的,又是在一定程度上结构已有所改变的。DNA与蛋白的这种相互作用对DNA的转录,复制以及重组都十分重要;或如在核小体中,对DNA的包装是必须的。DNA在溶液中的结构有相当的刚性,必须克服一个能障才能转变成它的蛋白复合物中的结构,分子伴侣的作用就是帮助DNA分子进行折叠和扭曲,从而把DNA稳定在一个适合于和蛋白结构的特定构型中。这种结合是协同的,可逆的在形成复合物之后便解离下来。因此,不论是DNA分子伴侣还是蛋白分子伴侣,都与DNA和蛋白的相互作用有关,与基因调控有关,看来,分子伴侣确实与最终阐明中心法则当前主要问题有密切关系。 四、分子伴侣和酶的区别 与分子伴侣不同,以确定为帮助蛋白质折叠的酶目前只有两个,一个是蛋白质二硫键异构酶(proteindisulfideisomerase,PDI);另一个是肽基脯氨酸顺反异构酶(peptidylprolylcis-transisomerase,PPI)。以PDI为例,众所周知,蛋白质分子中的二硫键与新生肽段的折叠密切相关,对维系蛋白质分子的结构稳定性和功能发挥也有重要作用。PDI定位在内质网管腔内,含量丰富,催化蛋白质分子内巯基与二硫键之间的交换反应。同时,它是目前发现的最为突出的多功能蛋白,除了二硫键的异构酶的基本功能外,它还是脯氨酸-4-羟化酶的α亚基;又是微粒体内甘油三酯转移蛋白复合物的小亚基,还是一种糖基化位点结合蛋白(gkycisylationsitebindingprotein)等。其中,最引人注目的还是它有与多肽结合的能力,可以结合具有不同序列,长度和电荷分布的肽,特异性较低,主要是与肽的主链相作用,但对巯基尚有一些偏爱。按照分子伴侣的定义,一般认为PDI和分子伴侣是两类不同的帮助蛋白,但是我国上海生物物理研究所最近提出不同的看法,认为蛋白质二硫键异构酶也具有分子伴侣的功能。 蛋白质分子中天然二硫键的形成要求这些在肽链上往往处于不相邻位置的巯基,首先通过肽链一定程度的折叠,才能相互接近到可以正确形成二硫键的位置。肽链的自身折叠是一个慢过程,而蛋白质二硫键异构酶催化蛋白质天然二硫键的形成却是一个快过程。另一方面,蛋白质二硫键异构酶具有低特异性的与各种不同肽链相结合的能力,在内质网中以极高的浓度存在,又是是一个钙结合蛋白,是一个能被磷酸化的蛋白,这些都已经符合了分子伴侣的条件。因此他们推测蛋白质二硫键异构酶很可能首先通过它与伸展的,或部分折叠的肽段的结合,阻止错误的折叠途径,促进正确的中间物生成,帮助肽链折叠是相应的巯基配对,从而是正确的二硫键得以形成;然后催化巯基的氧化或二硫键的异构而形成天然二硫键。他们认为蛋白质二硫键异构酶的酶活性与它的分子伴侣功能不是相互排斥,而是密切相关,协调统一的。分子伴侣与帮助新生肽链折叠的酶之间,大概不应该,也不能够划一条绝对的分界线。我想:酶的最主要特性就是催化生化反应,分子伴侣的主要作用是与新生肽段的错误构象结合,从而阻止肽链不正确的非功能的折叠途径,促使其向正确的折叠方向反应,这难道不可以理解成间接的催化肽链的折叠吗?从表观上看,抑制不正确的折叠途径等于加快了正确反应的速度。所以,我本人也很赞成他们的观点。最近的试验已经为这一假说提供了很好的证据。PDI明显抑制变性的甘油醛-3-磷酸脱氢酶在复性股过程中的严重聚合,有效的提高它的复性效率,与典型的分子伴侣GroE系统对甘油醛3-磷酸脱氢酶复性的效应极其相似。 五、分子伴侣的结构 目前唯一解出晶体结构的分子伴侣是的PapD,帮助鞭毛蛋白折叠的分子伴侣。还有HSP70的N端结构域,即ATP结合域也以有晶体结构。用电子显微镜已经清楚的看到了GroEL的十四聚体和GroEL的七聚体的四级结构,象两个圆形中空的面包圈叠在一起,用NMR以及各种溶液构象变化是研究分子伴侣作用机制的有效手段。 六、分子伴侣研究的实际应用 分子伴侣的研究成果必然会大大加深我们对生命现象的认识,同时也一定会增加我们与自然斗争的能力和自身生存的能力。由于分子伴侣在生命活动的各个层次都具有重要作用,它的突变和损伤也必定会引起疾病,因此可以期望运用分子伴侣的知识来治疗所谓的”分子伴侣病”。另一方面,利用对分子伴侣的研究成果从根本上提高基因工程和蛋白工程的成功率,也必将对大幅度提高人类生活水平起重要作用。 [参考书目] 1.李宝健主编,面向21世纪生命科学发展前沿,广东科技出版社,1996年11月第一版:93-104页 2.郝柏林刘寄星主编,理论物理与生命科学,上海科学技术出版社,1997年12月第一版:29-58页 3.中国生物物理代表团,从第十三届国际生物物理大会看生物物理学研究的现状和趋势,生物物理学报,1999年第十五卷第四期:826-827页

excel与origin结合起来。选择文本存储,excel 进行数据处理,origin 作图,很好有用。如有疑问,请追问~希望可以帮到你~ O(∩_∩)O谢谢~

你看下(微生物前沿)上的文献吧,

如何采用Origin拟合红外光谱进行蛋白质二级结构分析 excel与origin结合起来。选择文本存储,excel 进行数据处理,origin 作图,很好有用。如有疑问,请追问~希望可以帮到你~ O(∩_∩)O谢谢~

膜蛋白结构研究论文

穿着随意、说话随心、做事率性、洒脱率真、活泼快乐的颜宁,很难让人把她与“清华大学教授”、“国际青年科学家”这些字眼联系到一起。 2007年10月,不满30岁的她被聘为清华大学的教授、博导。2012年1月,她从全球18个国家和地区的760名申请者中脱颖而出,成为28位霍华德·休斯首届国际青年科学家奖得主之一。 走上科学之路 走上科学之路,对颜宁来说多少有点阴差阳错:上高中时文理兼好的她更喜欢文科,文理分班时她选了文科。但她的班主任关仪老师认为,成绩全年级第一的学生当然要学“数理化”,就把她拉到理科。 在清华,她度过了最为丰富多彩的4年:担任过生物系学生会主席,组织过许多课外活动,学国标舞、打乒乓球、学游泳……同时还要保持课业的优秀,忙得不亦乐乎。 决定颜宁未来人生道路的,是从2000年8月起,她在美国普林斯顿大学的7年留学生涯开始的。 “普林斯顿真是太美了!”颜宁说,“那里保留了大片的森林,还有一条运河。秋日的黄昏凭窗望去,周围是红色、金色、紫色的树,夕阳下的湖面波光闪闪,成群的野鸭在暮色中飞翔……” 除了自然之美,颜宁更领略了科学之美。“给我们上课的大都是成就卓著的科学家,他们能把每个科学发现讲得像历史故事一样引人入胜,会让你觉得:哇!原来生物科学这么好玩!” 让颜宁难以忘怀的,还有普林斯顿大学的一对教授夫妇,他们都是美国科学院院士,丈夫还是1995年的诺贝尔奖得主。 “我是个夜猫子,很多时候晚上11点了,还能看见他们夫妇在各自的实验室里观察显微镜下的果蝇,那种淡定从容、简单执著让人感动。我觉得自己将来就是要这个样子,很简单地做自己喜欢的研究。”颜宁说。 在3个实验室轮转一年之后,颜宁到施一公的实验室做博士论文,先是从事抗肿瘤方面的研究;2005年继续做博士后,转而从事膜蛋白研究。“一公常常说:‘不要整天想着柴米油盐,只要你现在努力做到最好,未来的路就会越走越宽,根本不用为找工作发愁。’实验上遇到苦恼,和他谈过之后,我就会觉得自己好像很行,肯定能成功。最后还真的没有失败。”颜宁说。 在施一公的指导下,颜宁做得顺风顺水。2004年12月,她顺利通过博士论文答辩,并获得2005年度《科学》杂志和通用电气医疗评选的北美地区“青年科学家奖”;2006年10月,她带着师弟师妹仅用一年多的时间,就做出了实验室的第一个膜蛋白结构。 探寻膜蛋白的生理奥秘 2007年10月,受清华大学医学院创办者赵南明教授之邀,结束博士后研究的颜宁回到母校,建立了自己的实验室,带领几名本科生和低年级博士生,向膜蛋白这个充满挑战的前沿领域进发。 “刚开始建实验室的时候,我都快疯掉了。”颜宁笑着说。那时候真是“白手起家”:安装实验台、订购仪器试剂、手把手教学生做实验……其曲折之多、进展之慢,让急性子的她抓狂。她说:“大约有半年的时间我都异常焦虑,后来一切步入正轨后,就顺畅多了,感觉在国内做实验跟国外没什么区别。” 自2007年至今,颜宁的实验室或独立或合作,在《自然》《科学》《细胞》3大顶尖学术刊物上发表论文5篇,解析了5个新型的膜蛋白结构,初步揭示了它们的功能机理,取得了一系列突破性进展。其速度之快、水平之高,令国内外同行刮目相看。2009年,她与施一公实验室合作,在《自然》杂志发表论文,阐述了甲酸盐转运蛋白的三维结构,发现了类似水通道的膜蛋白存在形式。 同年,她在《自然》子刊上发表了关于植物激素脱落酸受体PYL蛋白的结构和生物学机制的论文。这一发现与同年欧美、日本的同行研究成果一起,入选《科学》杂志评选的“2009年科学十大进展”。 2010年和2011年,颜宁领导的科研小组在《自然》发表两篇论文,分别揭示岩藻糖和尿嘧啶两种营养物质的转运蛋白的晶体结构,为质子共转运蛋白的结构和机理研究做出了重要突破。 2012年1月,颜宁与施一公、美国普渡大学朱健康教授合作,在《科学》杂志发表论文,揭示了转录激活因子样效应蛋白(TALE)特异识别DNA的分子机理。 “这一发现让人非常激动!”颜宁的兴奋之情溢于言表,“之前我们一直在做非常基础层面的研究,距离实际应用比较远,但这次的发现具有广阔的应用前景。” 2010年8月,清华大学聘请国际同行对其生物医学研究方向进行评估,年轻教授颜宁给他们留下了深刻印象:“无论以哪个标准衡量,她已位居世界最优秀的年轻结构生物学家之列。未来5年到10年,她将是杰出青年女性科学家的榜样。” 颜宁说,每天除了回家吃饭、睡觉,她差不多有14个小时“宅”在实验室里,到了紧张的攻坚阶段,干脆不分昼夜连轴转,“宅”在实验室里不出来。 “别人老问我苦不苦,其实只要是你着迷的事情,怎么会觉得苦?”她说,“所谓苦,就是不得已做你不想做的事。别人可能会觉得做实验、写论文很枯燥,但我自己乐在其中。就像有些人打游戏上瘾似的,着迷嘛。” 在颜宁看来,做科研跟艺术创作一样,是很美妙、很激动人心的事:“当你把细胞里那些只有几到几十纳米大小的'蛋白质分子解析出其原子分辨率的结构、在电脑上放大几亿倍之后,清清楚楚地看到这些美丽的构造如何行使复杂的功能时,你总忍不住要感叹大自然的神奇!很多时候,它的精妙设计远远超出了我们的想象!而你是世界上第一个揭示出这些大自然奥秘的人,那种成就感和满足感是难以言喻的。” 让颜宁着迷的另一个原因,就是做科研时的简单、轻松、自由,她说:“做科研会让人身心都很轻松,喜怒哀乐都变得特别简单。在实验室里我很轻松,不用去想任何其他的东西。我会感觉到,这个世界就是我的,没有其他任何限制,就看人的思维有多广阔,能走到哪个地方。总之,是一种挺美好的感觉。” 至于未来的奋斗目标,她的答案是:“现在我正带领实验室成员,研究与人类健康有更密切关系的哺乳动物膜蛋白。虽然做真核膜蛋白,技术上的难度更大,很有挑战性,但是对于疾病研究、制药等有更直接的帮助……这几年我基本上是与国际同行赛跑。什么时候我能自己开辟一个新领域,不跟人‘撞车’了,就说明我真的是独树一帜、遥遥领先了。”

如何利用脂质体研究膜蛋白与atp酶为例研究论文:该研究以特征明确的AcrB为原型,提出了一种方便的工作流程,用于对嵌入脂质体中的膜蛋白进行冷冻-EM结构分析。结合优化的蛋白脂质体分离,冷冻样品制备和有效的颗粒选择策略,以的分辨率获得了嵌入脂质体中的AcrB的三维(3D)重建。该研究方法可广泛应用于具有独特可溶域的膜蛋白的冷冻EM分析,为功能受跨膜电化学梯度或膜曲率影响的整体或外围膜蛋白的冷冻EM分析奠定了基础。生物膜包围着拓扑隔离的隔室,包括细胞和细胞器,并为各种完整的和外围的膜蛋白(MP)提供了栖息地。这些物理屏障使生命必需的电化学梯度得以生成和维持,这是由于离子和化学物质在整个不可渗透膜上的不对称分布所致。各种生理过程都取决于这些梯度,例如由质子梯度(质子动力)驱动的三磷酸腺苷(ATP)合成和依赖跨膜电场存在的动作电位。因此,许多膜蛋白,例如电压门控离子通道(VGIC)以及一级和二级活性转运蛋白,都依赖于跨膜电化学梯度来执行其生物学功能。

一提到颜宁,许多光环天然地向她“靠拢”:《自然》“中国十大科学之星”之一、国际最出色的女科学家之一、塞克勒国际生物物理奖、国际蛋白质学会青年科学家奖、首届国际青年科学家奖获得者,清华大学最年轻博导……

坚持从1985年GLUT1的基因序列被鉴定出来之后,获取它的三维结构成为膜蛋白研究领域最受瞩目课题之一,不少国际一流实验室为攻克它争分夺秒,颜宁团队也不例外。

如果不是刻意提及,颜宁不会主动透露,她可以连续工作48个小时而不觉疲惫。攻关期间,从上午开始,除去用餐,她能一直连续工作到次日凌晨五六点,在办公室的沙发上眯一会儿又爬起来继续工作。

时间花在哪里是看得到的。”颜宁说。在她看来,科学发现犹如上帝打开了一扇窗,是神迹,也是对你独一份的奖励。而这种奖励的吸引力来自纯粹、微小、简单的快乐:创造知识带来的智力兴奋,接受挑战、终于,2014年6月,这项困扰学术界近半个世纪之久的无解难题,颜宁团队仅用6个月便攻坚成功。从此,人类可清楚看到:葡萄糖进入人体细胞的那扇“门”究竟长什么样。

蛋白质结构与功能研究发展论文

随着分子生物学的飞速发展,最为世人瞩目的人类基因组计划即将提前完成。人类将向了解自己的生命奥秘这一目标迈进一大步。但是,由于基因是遗传信息的携带者,而生命活动的执行者却是蛋白质,即基因的表达产物。因此,即使得到人类全部基因序列,也只是解决了遗传信息库的问题。人类揭示整个生命活动的规律,就必须研究基因的物产——蛋白质。相对于基因组而言,后者称为蛋白质组。1 蛋白质组概述及其相关研究技术和方法鉴于基因组研究的局限性,1994年澳大利亚Macquaie 大学的Wilkins和Williams等在意大利的一次科学会议上首次提出了蛋白质组(Proteome)这个概念。定义为“蛋白质组指的是一个基因组所表达的蛋白质”,即“PROTEOME”是由蛋白质的”PROTE”和基因组的“OME”字母拼接而成[1].这个新术语很快得到了国际生物学界的认可。目前对蛋白质组的分析工作大两个方面。一方面,通过二维胶电泳等技术得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱,相关数据将作为待测机体、组织或细胞的二维参考图谱和数据库。另一方面是比较分析在变化了生理条件下蛋白质组所发生的变化。目前蛋白质组研究技术常用以下手段:(1)用于蛋白质分离技术方面的如双向凝胶电泳(2-DE)、双向“高效”柱层析等。(2)用于蛋白质鉴定的技术如质谱技术、凝胶图像分析、蛋白质和多肽的N端、C端测序及氨基酸组成分析等。(3)用于蛋白质相互作用及作用方式研究的双杂交系统。(4)用于分析大量数据的生物工程信息学等[2].。2 蛋白质组在医学研究中的现状和前景自蛋白质组概念提出以来,已发表相关论文及论著数篇。并于是1997年举行了第一届国际性的“蛋白质组学”会议。同年出版式了第一部蛋白质组学的专著。目前蛋白质组在医学方面的研究重点在于对人类疾病的发病机制、早期诊断及治疗,对致病微生物的致病机理、耐药性及发现新的抗生素为主。现将这两方面的进展情况综述如下。 人类疾病的蛋白质组研究 直肠癌 直肠癌的发生是因多个基因的突变,导致肿瘤抑制基因失能所致,但确切机制仍不清楚。为探讨其发病机制,Sanchez等对15例结肠癌和13例正常人的结肠上皮进行2-DE,每个多肽模式用Melanie I12-DE分析软件进行分析。据此建立了包括882和861个斑点的结肠癌及正常人结肠粘膜的标准胶图。结果发现在分子量为13kD和pI值为处的蛋白质仅出现在结肠癌的组织中。15例结肠癌患者中13/蛋白有13例(87%)。此外,发现13/蛋白不仅在中度、低度分化的结肠癌及有24年病史的溃疡性结肠炎过度表达,而且出现在7例分化程度不同的腺瘤的癌前病灶。但对照组则极少出现。这表明该蛋白的出现对检测早期直肠癌有很强提示。通过对该蛋白HPLC及测序等分析后,发现与钙粒蛋白B(calgranulin B)及钙卫蛋白(calprotectin)有很大关系[3]。 肝癌 醛糖还原酶(aldose reductase, )是醛酮还原酶超家族中的一个成员。它催化葡萄糖还原为山梨醇,通过减少内源或外源性代谢产物而起到解毒作用。Peter R等在用N-甲基-N-亚基脲诱导(N-methly-N-nitrosourea-induced)的小鼠肝癌中,用2-DE及氨基酸微型测序可分辩出一种肝癌诱导的醛糖还原酶样的蛋白质(35Kd/)。而在小鼠的晶状体中,则发现一种醛糖还原的同工酶,该酶与已知的小鼠醛糖还原酶有98%的同源性,而与肝癌诱导的醛糖还原酶样的蛋白质截然不同。这表明两种蛋白质是由相关的两条基因编码,在小鼠不同的器官中表达不同。肝癌诱导的醛糖还原酶蛋白质优先表达在肝癌及胎肝中,它们均受到纤维细胞生长因子的刺激,但随小鼠鼠器官的生理及病理环境而表现不同的形式。经免疫组化证实,肝癌诱导的醛糖还原酶样的蛋白质在成人肝脏中不表达,但在小鼠的肝癌 中又重新表达。同时发现该蛋白在癌前病变及肝癌中表达强烈,而在肝脏周围的正常组织不表达[4]。表明该蛋白可能与肝癌的发病有很大关系。 扩张型心肌病 扩张型心肌病是一种严重的可导致心衰的心脏病,大多数患者需行心脏移植术。目前其发病机理不明,推测可能为多种因素所致。1990年已有两组人员进行该病的蛋白质组分析。其后不久心肌的2-DE数据库建成,并进入国际互联网络。Knecht等采用2-DE取得了3300个心肌蛋白条带,通过氨基酸序列分析、Edman降解法及基质辅助的激光解吸离子化质谱(MALDI-MS)等分析了其中150条。经活检及术后病理证实,有12条为扩张性心肌病特有的蛋白。但具体资料尚在进一步分析之中[5]。Arnott D等对新福林诱导的肥大心肌细胞进行蛋白质组分析,同对照相比亦发现有8种蛋白质的表达水平发现了变化[6]。 膀胱癌 IFN-γ除抗病毒外,还有一项重要的功能即抗肿瘤作用。目前其抗肿瘤作用机制不明。有资料表明,IFN-γ可能通过在相关细胞中增强或抑制有关基因而发挥抗肿瘤作用。重组IFN-γ和IL-2已开始应用于膀胱癌的治疗中。为探明其作用机制,George等将四种分级程度不同的人膀胱癌新鲜活检标本,用50U/ml IFN-γ作用20个小时后,采用2-DE、微型序列分析、等电聚集、蛋白质印迹等方法,对标本进行蛋白质组分析。结果表明有五种蛋白质(色按酸-tRNA合成酶、IFN-γ诱导的r3,超氧化物歧化酶及两种分子量为和的未知蛋白)的表达量增加了75%,而醛糖还原酶表达量则下降。为研究IFN-γ对治疗膀胱癌的作用机制提供了一种方法[7]。此外,由于缺乏对膀胱鳞状细胞癌客观可靠的组织学分级标准,因而很其进行早期诊断。为此,Morten等对150例膀胱癌进行双盲法2-DE,并结合了蛋白质印迹法、微型序列分析及质谱等技术,建立了新鲜膀胱癌标本的2-DE数据库,且发现角蛋白10、14及银屑病相关的脂肪酸结合蛋白(psoriasis-associated fatty acid-binding protein,PA-FABP)等可以作为膀胱癌不同分化程度的标记物[8]。为早期诊断提供了一种新的手段。[ 本帖最后由 snow_white 于 2007-7-20 16:32 编辑 ]查看完整版本请点击这里:蛋白质组学研究〔综述〕05我也来说两句 查看全部回复 最新回复snow_white (2007-7-20 16:31:50) 其它 目前人的各种组织、器官、细胞乃至各种细胞器已被广泛研究。以期为疾病诊治及了解发病机制提供新的手段。在一项利用蛋白质组研究技术进行的酒精对人体毒性的研究中发现,乙醇 会改变血清蛋白糖基化作用,导致许多糖蛋白的糖基缺乏,如转铁蛋白[9]。Jagathpala等对免疫所致的不孕症的男性精子蛋白质进行蛋白质组分析,发现了导致不孕症的6种自体及异体抗 精子抗体[10]。在对肾癌的研究中,发现有4种蛋白质存在于正常肾组织而在肾癌细胞中缺失。其中两种分别是辅酶Q蛋白色素还原酶和线粒体乏醌氧化还原复合物I。这提示线粒体功能低下可能在肿瘤发生过程中起重要作用[11]。Ekkehard Brockstedt等利用2-DE、Edman微型序列法、MALDI-MS等对人BL60-2伯基特淋巴瘤细胞系进行了细胞凋亡机制的研究,结果发现RNA聚合酶转录因子3a(BTF3a)和/或BTF3b与抗IgM抗体介导(anti-IgM antibody-mediated)的细胞凋亡有很大关系[12]。 致病微生物的蛋白质组研究 近年来,WHO越来越重视感染性疾病对人类健康的影响。除结核、多重耐药链球菌感染及机会致病菌外,出现了一些新的感染因素如HIV、博氏疏螺旋体及埃博拉病毒等。因此这些致病微生物的蛋白质组分析,对于了解其毒性因子、抗原及疫苗的制备非常重要,此外对疾病的诊断、治疗和预防也同样重要。现已获得18种微生物的全部基因组序列,另有60余种的基因序列正在研究之中。这些工作的开展为蛋白质组的研究提供了有利条件。 检测博氏疏螺旋体与免疫有关的蛋白质 博氏疏螺旋体(Borrelia burgdorferi)是莱姆病的主要病因,表现为环形红斑及流感样症状,大约有50%的未治患者发展为神经系统及关节系统疾病。该螺旋体可分为3种类型: sensu stricto,, 。其诊断需依靠血清学检查,但存在敏感性及特异性变化的缺点。为获得更可靠的血清学检查,Peter等用2-DE从得到217个银染的蛋白斑点。从中国兔多克隆抗体鉴别出6个已知的讥原。将不同临床表现莱姆病患者的血浆用 2-DE图杂交。用抗IgM及抗IgG作为第二抗体,在10例有游走性红斑的患者血浆中,检测出60~80个抗原。同时发现在有关节炎的患者血浆中,包含有抗15种抗原的IgM抗体及抗76种不同抗原的IgG抗体。而晚期有神经系统症状的患者血浆中,则包含有抗33种抗原的IgM抗体及抗76种抗原的IgG抗体。上述3种类型患者的血浆中均包含有抗6种已知抗原的抗体,且被SDSPAGE杂交所证实。这些抗原均是潜在的具有特异性诊断的标志物。 弓形体抗原的检测 弓形体病是由鼠弓形体虫引起的寄生虫病。全球人口大约有30%是携带者,在欧洲是最常见的寄生虫病。如果妊娠者感染,该虫可通过胎盘引起胎儿的感染。且随着妊娠时间的增加,感染的机会也增加。大约50%母体的感染可引起新生儿先天性疾病。因此诊断及治疗越早越好。目前要依靠血清学及PCR,而单独采用血清学如用IgG,IgM,或IgA抗体对疾病活动期敏感性不够,尤其对于妊娠或有免疫抑制的患者。潜在感染常发生在有免疫抑制的患者中。对AIDS患者来说,鼠弓形体虫是最主要的致命性脑损伤的病因。因此,能否早期诊断对治疗来说尤为关键。Jungblut等将鼠弓形体虫RH株在人羊膜细胞系FL521中传代后,用2-DE得到300个银染的斑点。再将其与以下3种患者的血浆进行免疫杂交:(1)患有急性弓形体病的妊娠女性(n=11); (2)患急性弓形体病的非妊娠者(n=6)(3)有潜在感染的患者(n=9)。结果有9个斑点对各阶段的弓形体感染均反应,这9种斑点被用来当作弓形体感染的标记。其中7种标记可用作区别疾病的不同阶段。但对区别急性期与潜在期仍需联合应用多种抗原[4]。 白色念珠菌 芽管结构是白色念珠菌向菌丝体转变的早期阶段,该结构能增强白色念珠菌对宿主细胞的粘附力、穿透力及破坏性。目前通过蛋白质组分析方法如2-DE、质谱等已检测出在芽管结构所表达的一组特异蛋白如DNA结合蛋白等,为致病提高了一些参考指标[13]。Monkt等发现,在conA反应后的SDS-PAGE图中,在芽管结构的膜上,分子量为80kD复合糖处,出现很淡的考马斯亮蓝染色,而在孢子时则未出现。提示膜的整合、出现未与ConA结合的80kD复合糖可能与芽管结构的发生及生长有关。粘附素(adhesin)是白色念珠菌表面的组成部分,介导其与宿主的结合,是侵入宿主所需的重要蛋白,包含多种成分如白色念珠菌胞壁上的疏水蛋白等,通过增强菌株的粘附性而在其致病机制中发挥一定作用。但由于这些蛋白有很大同源性、多种糖基化作用及与胞壁或胞浆膜上其它成分形成共价结合,故提纯及分析很难。现通过等电聚集、2-DE及洗脱电泳等方法,可使这些蛋白得到很好的纯化、分离及分析[14]。抗真菌药通过改变真菌胞壁组分的生物合成和重组胞壁相关酶的结合位置而发挥作用。抗真菌药远少于抗细菌药就在于对真菌细胞壁蛋白分析了解太少。现在临床上用于抗真菌的药物多为咪唑类(咪康唑、酮康唑)及三唑类(氟康唑、伊曲康唑),但有很多患者出现耐药现象。在白色念珠菌中,目前发现至少有8种CDR家族的基因可产生耐药株的表现型。且有55种基因分别表达ABC及MFS蛋白(菌内药物输出泵)[]。但这些基因、蛋白与耐药之间的关系仍未清楚。应用2-DE、免疫检测蛋白质等技术,对这些蛋白在菌内的表达量进行分析,发现Cdrlp及CaMdrlp蛋白在耐咪唑类菌株中过量表达。在对咪唑类每感及去除CDR1基因的白色念珠菌株CA114中,提取并检测耐氟康唑突变子(FL3)的表达。结果发现FL3对氟康唑的耐是去除CDR1的基因的白色念珠菌株CA114的500倍 ,是CA114的250倍。且CDR1 mRNA在FL3的量是Ca114的8倍[17]。同时,对敏感性及耐药株蛋白质的2-DE图分析发现,在耐中有25种蛋白质增加,有76种蛋白质减少。推测白色念株菌是通过改变染色体数目或染色体重组来调节基因的表达量,进而产生耐药性[18]。随着蛋白质组技术成熟完善,将对真菌壁及耐药基因分泌的各种蛋白组成分析带来重大突破,并对抗真菌的研制提供重要资料。虽然蛋白质组学还处在一个初期发展研段,但我们相信随着其不断地深入发展,蛋白质组(学)研究在提示诸如生长、发育和代谢调控等生命活动的规律上将会有所突破,对探讨重大疾病的机理、疾病诊断、疾病防治和新药开发将提供重要的理论基础。[ 本帖最后由 snow_white 于 2007-7-20 16:33 编辑 ]snow_white (2007-7-20 16:34:25)二、蛋白质组学的研究进展蛋白质组学强调的是针对蛋白质的一个整体思路。从整体的角度看,蛋白质组研究大致可分为两种类型:一种是针对细胞或组织的全部蛋白质,也就是着眼点是整个蛋白质组;而另一种是以与一个特定的生物学机制或机制相关的全部蛋白质为着眼点,在这里整体是局部性的。针对细胞蛋白质组的完整分析的工作已经比较全面地展开,不仅如大肠杆菌、酵母等低等模式生物的蛋白质组数据库在建立之中,高等生物如水稻和小鼠等的蛋白质研究也已开展,人类一些正常和病变细胞的蛋白质数据库也已在建立之中。与此同时,更多的蛋白质组研究工作则是将着眼点放在蛋白质组的变化或差异上,也就是通过对蛋白质组的比较分析。首先发现并去鉴定在不同生理条件下或不同外界条件下蛋白质组中有差异的蛋白质组分。限于篇幅,本文不对这方面的工作做进一步论述。本文接下来重点介绍近期发表的关于蛋白质组学的几个工作,从中可以看到蛋白质组学的思想方法在蛋白质整体(或局部整体)水平上是如何解决生理学的一些重要问题的。1999年11月《Nature》杂志发表了一篇用蛋白质组学方法研究蛋白质折叠的研究论文[10]。在这篇文章中,Houry等报道了在大肠杆菌胞质中的2500种新生多肽链种只有近300种以GroEL作为分子伴侣来帮助其折叠成正确构象。在以往的相关研究中,通常只是针对某个或某些特定的蛋白质,观察它(们)在折叠过程中是否需要诸如GroEL等分子伴侣的帮助。而在这个工作中,研究是从一个整体的思路出发,首先通过免疫共沉淀的方法获得所有与GroEL结合的肽链,再通过二维电泳和数据库比较等蛋白质研究的手段对这些肽链进行分析鉴定,从而实现了对大肠杆菌近2500条新生多肽链与分子伴侣GroEL的关系的全面分析。在这个工作中,研究者还通过对其中50种与GroEL作用的肽链的鉴定,进一步揭示了决定这些蛋白质能与GroEL相互作用的关键结构特征。应该说,这个工作很好地体现了蛋白质组学的思想方法和技术手段的运用。过去在细胞生物学领域还没有得到过一个主要亚细胞结构的完整的分子图。核孔复合体是一个巨大的跨核膜的八角形结构,是控制大分子在胞质和核质间运输的通道。多年来,很多方法被用来分析这一复合体的组成成分。虽然这些工作取得了很大的进展,但究竟在多大程度上反映了这一复合体的分子原貌仍然是一个未知数。最近通过使用蛋白质组学的手段,Rout等[11]鉴定了完整的酵母核孔复合体所有能检测到的多肽,并系统地对每种可能的蛋白质组分在细胞中定位,结合免疫电镜的方法将各组分在复合体内定位并定量,从而揭示了酵母核孔复合体的完整分子构造,并在此基础上揭示了其工作原理。这个工作可以说是蛋白质组学解决构造生物学问题的一个典范,为揭示其他巨大分子机器的"构造"和工作原理指出了一条新路[12]。通过分析一个蛋白质是否跟功能已知的蛋白质相互作用可得到揭示其功能的线索。因为经验告诉我们,如果两个蛋白质相互作用,那么它们一般参与相同或相关的细胞活动[13]。从近期国际上蛋白质组学研究的发展动向可以看出,揭示蛋白质之间的相互作用关系,建立相互作用关系的网络图,已成为揭示蛋白质组复杂体系与蛋白质功能模式的先导,业已成为蛋白质组学领域的研究热点。2000年初,《Science》登载了一篇应用蛋白质组学的大规模双杂交技术研究线虫生殖器发育的文章[14]。在这个工作中,Walhout等以线虫的生殖发育过程作为研究对象,从已知的27个与线虫发育的蛋白质出发,构造了一个大规模的酵母双杂交系统,得到了100多个相互作用的结果,初步建立了与线虫生殖发育相关的蛋白质相互作用图谱,从而为深入研究和揭示线虫发育的机制等提供了丰富的线索。这个工作不同于一般的应用酵母双杂交进行研究的地方在于,它出于对一个生物学问题的整体思考,尽可能地从所有已知的蛋白质而不只是个别的蛋白质为出发点。这一个工作为以前专注于信号转导过程中单个蛋白质作用的科学家们提供了一个新的思路,即将整个途径的相关蛋白质一起考虑。那么,能否通过酵母双杂交系统来分析一种细胞或特定组织的所有可能的蛋白质之间的相互作用呢?在今年初,《Nature》发表了一篇通过大规模双杂交技术研究酵母近6000个蛋白质之间相互作用的论文[15]。啤酒酵母基因组DNA的全序列业已测定,这为通过双杂交技术来鉴定酵母基因组编码的全部6000种左右的蛋白质间的可能相互作用提供了非常有利的条件。在这个工作中,研究人员采用了两种不同的策略对酵母的蛋白质间的相互作用作了全面分析。一是所谓的列阵筛选法(array screening)。在此方法中,6000株表达不同"猎物"蛋白的酵母单克隆分别加在微滴定板上,带有不同的"诱饵"蛋白的酵母株与前面6000株细胞一一接合形成二倍体细胞,"猎物"蛋白与"诱饵"蛋白的相互作用通过报道基因的表达而被鉴定。这篇文章中报道了192种不同的"诱饵"蛋白与近6000种"猎物"蛋白的相互作用的结果。另一种方法是文库筛选法。该方法与前一种方法的区别是,将表达6000种不同"猎物"蛋白的酵母细胞混在一起构成文库,再将这个文库分别与6000株表达不同"诱饵"蛋白的酵母细胞接合,再进一步筛选鉴定阳性克隆,即"诱饵"与"猎物"发生相互作用的克隆。根据这篇报告,上述两种策略得到了不同的结果,相比之下阵列筛选法更为有效,而文库筛选法的长处是通量大。这一工作的重要意义在于我们已经看到,在基因组序列被了解的基础上,可以利用大规模双杂交技术全面地,当然也是初步地,分析其物种或其细胞、组织的所有蛋白质之间的相互作用关系。相信类似的工作将很快针对其他物种开展,特别是基因组序列已被揭示的物种。由此可见,蛋白质组学已经开始从建立数据库走向解决生命科学的重大问题,成为研究生物学问题或机制的强有力手段。snow_white (2007-7-20 16:37:32)三、蛋白质组学研究进展与趋势曾 嵘 夏其昌(中国科学院上海生命科学研究院生物化学与细胞生物学研究所蛋白质组学研究分析中心 上海 200031)如果在五年前提到蛋白质组学(Proteomics),恐怕知之者甚少,而在略知一二者中,部分人还抱有怀疑态度。但是,2001年的Science杂志已把蛋白质组学列为六大研究热点之一,其“热度”仅次于干细胞研究,名列第二。蛋白质组学的受关注程度如今已令人刮目相看。1.蛋白质组学研究的研究意义和背景随着人类基因组计划的实施和推进,生命科学研究已进入了后基因组时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组中所采用的策略,如基因芯片、基因表达序列分析(Serial analysis of gene expression, SAGE)等,都是从细胞中mRNA的角度来考虑的,其前提是细胞中mRNA的水平反映了蛋白质表达的水平。但事实并不完全如此,从DNA mRNA 蛋白质,存在三个层次的调控,即转录水平调控(Transcriptional control ),翻译水平调控(Translational control),翻译后水平调控(Post-translational control )。从mRNA角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。更重要的是,蛋白质复杂的翻译后修饰、蛋白质的亚细胞定位或迁移、蛋白质-蛋白质相互作用等则几乎无法从mRNA水平来判断。毋庸置疑,蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制。蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。虽然蛋白质的可变性和多样性等特殊性质导致了蛋白质研究技术远远比核酸技术要复杂和困难得多,但正是这些特性参与和影响着整个生命过程。传统的对单个蛋白质进行研究的方式已无法满足后基因组时代的要求。这是因为:(1) 生命现象的发生往往是多因素影响的,必然涉及到多个蛋白质。(2) 多个蛋白质的参与是交织成网络的,或平行发生,或呈级联因果。(3) 在执行生理功能时蛋白质的表现是多样的、动态的,并不象基因组那样基本固定不变。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究。因此在上世纪90年代中期,国际上产生了一门新兴学科-蛋白质组学(Proteomics),它是以细胞内全部蛋白质的存在及其活动方式为研究对象。可以说蛋白质组研究的开展不仅是生命科学研究进入后基因组时代的里程碑,也是后基因组时代生命科学研究的核心内容之一。虽然第一次提出蛋白质组概念是在1994年,但相关研究可以追溯到上世纪90年代中期甚至更早,尤其是80年代初,在基因组计划提出之前,就有人提出过类似的蛋白质组计划,当时称为Human Protein Index计划,旨在分析细胞内的所有蛋白质。但由于种种原因,这一计划被搁浅。90年代初期,各种技术已比较成熟,在这样的背景下,经过各国科学家的讨论,才提出蛋白质组这一概念。国际上蛋白质组研究进展十分迅速,不论基础理论还是技术方法,都在不断进步和完善。相当多种细胞的蛋白质组数据库已经建立,相应的国际互联网站也层出不穷。1996年,澳大利亚建立了世界上第一个蛋白质组研究中心:Australia Proteome Analysis Facility ( APAF )。丹麦、加拿大、日本也先后成立了蛋白质组研究中心。在美国,各大药厂和公司在巨大财力的支持下,也纷纷加入蛋白质组的研究阵容。去年在瑞士成立的GeneProt公司,是由以蛋白质组数据库“SWISSPROT” 著称的蛋白质组研究人员成立的,以应用蛋白质组技术开发新药物靶标为目的,建立了配备有上百台质谱仪的高通量技术平台。而当年提出Human Protein Index 的美国科学家Normsn G. Anderson也成立了类似的蛋白质组学公司,继续其多年未实现的梦想。2001年4月,在美国成立了国际人类蛋白质组研究组织(Human Proteome Organization, HUPO),随后欧洲、亚太地区都成立了区域性蛋白质组研究组织,试图通过合作的方式,融合各方面的力量,完成人类蛋白质组计划(Human Proteome Project)。snow_white (2007-7-20 16:37:49)2.蛋白质组学研究的策略和范围蛋白质组学一经出现,就有两种研究策略。一种可称为“竭泽法”,即采用高通量的蛋白质组研究技术分析生物体内尽可能多乃至接近所有的蛋白质,这种观点从大规模、系统性的角度来看待蛋白质组学,也更符合蛋白质组学的本质。但是,由于蛋白质表达随空间和时间不断变化,要分析生物体内所有的蛋白质是一个难以实现的目标。另一种策略可称为“功能法”,即研究不同时期细胞蛋白质组成的变化,如蛋白质在不同环境下的差异表达,以发现有差异的蛋白质种类为主要目标。这种观点更倾向于把蛋白质组学作为研究生命现象的手段和方法。早期蛋白质组学的研究范围主要是指蛋白质的表达模式(Expression profile), 随着学科的发展,蛋白质组学的研究范围也在不断完善和扩充。蛋白质翻译后修饰研究已成为蛋白质组研究中的重要部分和巨大挑战。蛋白质-蛋白质相互作用的研究也已被纳入蛋白质组学的研究范畴。而蛋白质高级结构的解析即传统的结构生物学,虽也有人试图将其纳入蛋白质组学研究范围,但目前仍独树一帜。

字数可能有点超,你自己截取吧~~ 分子生物学(molecular biology) 在分子水平上研究生命现象的科学。研究生物大分子(核酸、蛋白质)的结 构、功能和生物合成等方面来阐明各种生命现象的本质。研究内容包括各种生命过程如光合作用、发育的分子机制、神经活动的机理、癌的发生等。 从分子水平研究生物大分子的结构与功能从而阐明生命现象本质的科学。自20世纪50年代以来,分子生物学是生物学的前沿与生长点,其主要研究领域包括蛋白质体系、蛋白质-核酸体系 (中心是分子遗传学)和蛋白质-脂质体系(即生物膜)。 生物大分子,特别是蛋白质和核酸结构功能的研究,是分子生物学的基础。现代化学和物理学理论、技术和方法的应用推动了生物大分子结构功能的研究,从而出现了近30年来分子生物学的蓬勃发展。分子生物学和生物化学及生物物理学关系十分密切,它们之间的主要区别在于:①生物化学和生物物理学是用化学的和物理学的方法研究在分子水平,细胞水平,整体水平乃至群体水平等不同层次上的生物学问题。而分子生物学则着重在分子(包括多分子体系)水平上研究生命活动的普遍规律;②在分子水平上,分子生物学着重研究的是大分子,主要是蛋白质,核酸,脂质体系以及部分多糖及其复合体系。而一些小分子物质在生物体内的转化则属生物化学的范围;③分子生物学研究的主要目的是在分子水平上阐明整个生物界所共同具有的基本特征,即生命现象的本质;而研究某一特定生物体或某一种生物体内的某一特定器官的物理、化学现象或变化,则属于生物物理学或生物化学的范畴。 发展简史 结构分析和遗传物质的研究在分子生物学的发展中作出了重要的贡献。结构分析的中心内容是通过阐明生物分子的三维结构来解释细胞的生理功能。1912年英国 .布喇格和.布喇格建立了X射线晶体学,成功地测定了一些相当复杂的分子以及蛋白质的结构。以后布喇格的学生.阿斯特伯里和.贝尔纳又分别对毛发、肌肉等纤维蛋白以及胃蛋白酶、烟草花叶病毒等进行了初步的结构分析。他们的工作为后来生物大分子结晶学的形成和发展奠定了基础。50年代是分子生物学作为一门独立的分支学科脱颖而出并迅速发展的年代。首先是在蛋白质结构分析方面,1951年.波林等提出了 α-螺旋结构,描述了蛋白质分子中肽链的一种构象。1955年F.桑格完成了胰岛素的氨基酸序列的测定。接着 .肯德鲁和.佩鲁茨在X射线分析中应用重原子同晶置换技术和计算机技术分别于1957和1959年阐明了鲸肌红蛋白和马血红蛋白的立体结构。1965年中国科学家合成了有生物活性的胰岛素,首先实现了蛋白质的人工合成。 另一方面,M.德尔布吕克小组从1938年起选择噬菌体为对象开始探索基因之谜。噬菌体感染寄主后半小时内就复制出几百个同样的子代噬菌体颗粒,因此是研究生物体自我复制的理想材料。1940年.比德尔和.塔特姆提出了“一个基因,一个酶”的假设,即基因的功能在于决定酶的结构,且一个基因仅决定一个酶的结构。但在当时基因的本质并不清楚。1944年.埃弗里等研究细菌中的转化现象,证明了DNA是遗传物质。1953年.沃森和.克里克提出了DNA的双螺旋结构,开创了分子生物学的新纪元。在此基础上提出的中心法则,描述了遗传信息从基因到蛋白质结构的流动。遗传密码的阐明则揭示了生物体内遗传信息的贮存方式。1961年F.雅各布和J.莫诺提出了操纵子的概念,解释了原核基因表达的调控。到20世纪60年代中期,关于DNA自我复制和转录生成RNA的一般性质已基本清楚,基因的奥秘也随之而开始解开了。 仅仅30年左右的时间,分子生物学经历了从大胆的科学假说,到经过大量的实验研究,从而建立了本学科的理论基础。进入70年代,由于重组DNA研究的突破,基因工程已经在实际应用中开花结果,根据人的意愿改造蛋白质结构的蛋白质工程也已经成为现实。 基本内容 蛋白质体系 蛋白质的结构单位是α-氨基酸。常见的氨基酸共20种。它们以不同的顺序排列可以为生命世界提供天文数字的各种各样的蛋白质。 蛋白质分子结构的组织形式可分为 4个主要的层次。一级结构,也叫化学结构,是分子中氨基酸的排列顺序。首尾相连的氨基酸通过氨基与羧基的缩合形成链状结构,称为肽链。肽链主链原子的局部空间排列为二级结构。二级结构在空间的各种盘绕和卷曲为三级结构。有些蛋白质分子是由相同的或不同的亚单位组装成的,亚单位间的相互关系叫四级结构。 蛋白质的特殊性质和生理功能与其分子的特定结构有着密切的关系,这是形形色色的蛋白质所以能表现出丰富多彩的生命活动的分子基础。研究蛋白质的结构与功能的关系是分子生物学研究的一个重要内容。 随着结构分析技术的发展,现在已有几千个蛋白质的化学结构和几百个蛋白质的立体结构得到了阐明。70年代末以来,采用测定互补DNA顺序反推蛋白质化学结构的方法,不仅提高了分析效率,而且使一些氨基酸序列分析条件不易得到满足的蛋白质化学结构分析得以实现。 发现和鉴定具有新功能的蛋白质,仍是蛋白质研究的内容。例如与基因调控和高级神经活动有关的蛋白质的研究现在很受重视。 蛋白质-核酸体系 生物体的遗传特征主要由核酸决定。绝大多数生物的基因都由 DNA构成。简单的病毒,如λ噬菌体的基因组是由 46000个核苷酸按一定顺序组成的一条双股DNA(由于是双股DNA,通常以碱基对计算其长度)。细菌,如大肠杆菌的基因组,含4×106碱基对。人体细胞染色体上所含DNA为3×109碱基对。 遗传信息要在子代的生命活动中表现出来,需要通过复制、转录和转译。复制是以亲代 DNA为模板合成子代 DNA分子。转录是根据DNA的核苷酸序列决定一类RNA分子中的核苷酸序列;后者又进一步决定蛋白质分子中氨基酸的序列,就是转译。因为这一类RNA起着信息传递作用,故称信使核糖核酸(mRNA)。由于构成RNA的核苷酸是4种,而蛋白质中却有20种氨基酸,它们的对应关系是由mRNA分子中以一定顺序相连的 3个核苷酸来决定一种氨基酸,这就是三联体遗传密码。 基因在表达其性状的过程中贯串着核酸与核酸、核酸与蛋白质的相互作用。DNA复制时,双股螺旋在解旋酶的作用下被拆开,然后DNA聚合酶以亲代DNA链为模板,复制出子代 DNA链。转录是在 RNA聚合酶的催化下完成的。转译的场所核糖核蛋白体是核酸和蛋白质的复合体,根据mRNA的编码,在酶的催化下,把氨基酸连接成完整的肽链。基因表达的调节控制也是通过生物大分子的相互作用而实现的。如大肠杆菌乳糖操纵子上的操纵基因通过与阻遏蛋白的相互作用控制基因的开关。真核细胞染色质所含的非组蛋白在转录的调控中具有特殊作用。正常情况下,真核细胞中仅2~15%基因被表达。这种选择性的转录与转译是细胞分化的基础。 蛋白质-脂质体系 生物体内普遍存在的膜结构,统称为生物膜。它包括细胞外周膜和细胞内具有各种特定功能的细胞器膜。从化学组成看,生物膜是由脂质和蛋白质通过非共价键构成的体系。很多膜还含少量糖类,以糖蛋白或糖脂形式存在。 1972年提出的流动镶嵌模型概括了生物膜的基本特征:其基本骨架是脂双层结构。膜蛋白分为表在蛋白质和嵌入蛋白质。膜脂和膜蛋白均处于不停的运动状态。 生物膜在结构与功能上都具有两侧不对称性。以物质传送为例,某些物质能以很高速度通过膜,另一些则不能。象海带能从海水中把碘浓缩 3万倍。生物膜的选择性通透使细胞内pH和离子组成相对稳定,保持了产生神经、肌肉兴奋所必需的离子梯度,保证了细胞浓缩营养物和排除废物的功能。 生物体的能量转换主要在膜上进行。生物体取得能量的方式,或是像植物那样利用太阳能在叶绿体膜上进行光合磷酸化反应;或是像动物那样利用食物在线粒体膜上进行氧化磷酸化反应。这二者能量来源虽不同,但基本过程非常相似,最后都合成腺苷三磷酸。对于这两种能量转换的机制,P.米切尔提出的化学渗透学说得到了越来越多的证据。生物体利用食物氧化所释放能量的效率可达70%左右,而从煤或石油的燃烧获取能量的效率通常为20~40%,所以生物力能学的研究很受重视。对生物膜能量转换的深入了解和模拟将会对人类更有效地利用能量作出贡献。 生物膜的另一重要功能是细胞间或细胞膜内外的信息传递。在细胞表面,广泛地存在着一类称为受体的蛋白质。激素和药物的作用都需通过与受体分子的特异性结合而实现。癌变细胞表面受体物质的分布有明显变化。细胞膜的表面性质还对细胞分裂繁殖有重要的调节作用。 对细胞表面性质的研究带动了糖类的研究。糖蛋白、蛋白聚糖和糖脂等生物大分子结构与功能的研究越来越受到重视。从发展趋势看,寡糖与蛋白质或脂质形成的体系将成为分子生物学研究的一个新的重要的领域。 理论意义和应用 分子生物学的成就说明:生命活动的根本规律在形形色色的生物体中都是统一的。例如,不论在何种生物体中,都由同样的氨基酸和核苷酸分别组成其蛋白质和核酸。遗传物质,除某些病毒外,都是DNA,并且在所有的细胞中都以同样的生化机制进行复制。分子遗传学的中心法则和遗传密码,除个别例外,在绝大多数情况下也都是通用的。 物理学的成就证明,一切物质的原子都由为数不多的基本粒子根据相同的规律所组成,说明了物质世界结构上的高度一致,揭示了物质世界的本质,从而带动了整个物理学科的发展。分子生物学则在分子水平上揭示了生命世界的基本结构和生命活动的根本规律的高度一致,揭示了生命现象的本质。和过去基本粒子的研究带动物理学的发展一样,分子生物学的概念和观点也已经渗入到基础和应用生物学的每一个分支领域,带动了整个生物学的发展,使之提高到一个崭新的水平。 过去生物进化的研究,主要依靠对不同种属间形态和解剖方面的比较来决定亲缘关系。随着蛋白质和核酸结构测定方法的进展,比较不同种属的蛋白质或核酸的化学结构,即可根据差异的程度,来断定它们的亲缘关系。由此得出的系统进化树,与用经典方法得到的是基本符合的。采用分子生物学的方法研究分类与进化有特别的优越性。首先,构成生物体的基本生物大分子的结构反映了生命活动中更为本质的方面。其次,根据结构上的差异程度可以对亲缘关系给出一个定量的,因而也是更准确的概念。第三,对于形态结构非常简单的微生物的进化,则只有用这种方法才能得到可靠结果。 高等动物的高级神经活动是极其复杂的生命现象,过去多是在细胞乃至整体水平上研究,近年来深入到分子水平研究的结果充分说明高级神经活动也同样是以生物大分子的活动为基础的。例如,在高等动物学习与记忆的过程中,大脑中RNA和蛋白质的组成发生明显的变化,并且一些影响生物体合成蛋白质的药物也显著地影响学习与记忆的能力。又如,“生物钟”是一种熟知的生物现象。用鸡进行的实验发现,有一种重要的神经传递介质(5-羟色胺)和一种激素(褪黑激素)以及控制它们变化的一种酶,在鸡脑中的含量呈24小时的周期性变化。正是这种变化构成了鸡的“生物钟”的物质基础。 在应用方面,生物膜能量转换原理的阐明,将有助于解决全球性的能源问题。了解酶的催化原理就能更有针对性地进行酶的人工模拟,设计出化学工业上广泛使用的新催化剂,从而给化学工业带来一场革命。 分子生物学在生物工程技术中也起了巨大的作用,1973年重组DNA技术的成功,为基因工程的发展铺平了道路。80年代以来,已经采用基因工程技术,把高等动物的一些基因引入单细胞生物,用发酵方法生产干扰素、多种多肽激素和疫苗等。基因工程的进一步发展将为定向培育动、植物和微生物良种以及有效地控制和治疗一些人类遗传性疾病提供根本性的解决途径。 从基因调控的角度研究细胞癌变也已经取得不少进展。分子生物学将为人类最终征服癌症做出重要的贡献。 [编辑本段]分子生物学的应用 1,亲子鉴定 近几年来,人类基因组研究的进展日新月异,而分子生物学技术也不断完善,随着基因组研究向各学科的不断渗透,这些学科的进展达到了前所未有的高度。在法医学上,STR位点和单核苷酸(SNP)位点检测分别是第二代、第三代DNA分析技术的核心,是继RFLPs(限制性片段长度多态性)VNTRs(可变数量串联重复序列多态性)研究而发展起来的检测技术。作为最前沿的刑事生物技术,DNA分析为法医物证检验提供了科学、可靠和快捷的手段,使物证鉴定从个体排除过渡到了可以作同一认定的水平,DNA检验能直接认定犯罪、为凶杀案、强奸杀人案、碎尸案、强奸致孕案等重大疑难案件的侦破提供准确可靠的依据。随着DNA技术的发展和应用,DNA标志系统的检测将成为破案的重要手段和途径。此方法作为亲子鉴定已经是非常成熟的,也是国际上公认的最好的一种方法。参考资料:蛋白质质谱分析研究进展 摘 要: 随着科学的不断发展,运用质谱法进行蛋白质的分析日益增多,本文简要综述了肽和蛋白质等生物大分子质谱分析的特点、方法及蛋白质质谱分析的原理、方式和应用,并对其发展前景作出展望。 关键词: 蛋白质,质谱分析,应用 前言: 蛋白质是生物体中含量最高,功能最重要的生物大分子,存在于所有生物细胞,约占细胞干质量的50%以上, 作为生命的物质基础之一,蛋白质在催化生命体内各种反应进行、调节代谢、抵御外来物质入侵及控制遗传信息等方面都起着至关重要的作用,因此蛋白质也是生命科学中极为重要的研究对象。关于蛋白质的分析研究,一直是化学家及生物学家极为关注的问题,其研究的内容主要包括分子量测定,氨基酸鉴定,蛋白质序列分析及立体化学分析等。随着生命科学的发展,仪器分析手段的更新,尤其是质谱分析技术的不断成熟,使这一领域的研究发展迅速。 自约翰.芬恩()和田中耕一()发明了对生物大分子进行确认和结构分析的方法及发明了对生物大分子的质谱分析法以来,随着生命科学及生物技术的迅速发展,生物质谱目前已成为有机质谱中最活跃、最富生命力的前沿研究领域之一[1]。它的发展强有力地推动了人类基因组计划及其后基因组计划的提前完成和有力实施。质谱法已成为研究生物大分子特别是蛋白质研究的主要支撑技术之一,在对蛋白质结构分析的研究中占据了重要地位[2]。 1.质谱分析的特点 质谱分析用于蛋白质等生物活性分子的研究具有如下优点:很高的灵敏度能为亚微克级试样提供信息,能最有效地与色谱联用,适用于复杂体系中痕量物质的鉴定或结构测定,同时具有准确性、易操作性、快速性及很好的普适性。 2.质谱分析的方法 近年来涌现出较成功地用于生物大分子质谱分析的软电离技术主要有下列几种:1)电喷雾电离质谱;2)基质辅助激光解吸电离质谱;3)快原子轰击质谱;4)离子喷雾电离质谱;5)大气压电离质谱。在这些软电离技术中,以前面三种近年来研究得最多,应用得也最广泛[3]。 3.蛋白质的质谱分析 蛋自质是一条或多条肽链以特殊方式组合的生物大分子,复杂结构主要包括以肽链为基础的肽链线型序列[称为一级结构]及由肽链卷曲折叠而形成三维[称为二级,三级或四级]结构。目前质谱主要测定蛋自质一级结构包括分子量、肽链氨基酸排序及多肽或二硫键数目和位置。 蛋白质的质谱分析原理 以往质谱(MS)仅用于小分子挥发物质的分析,由于新的离子化技术的出现,如介质辅助的激光解析/离子化、电喷雾离子化,各种新的质谱技术开始用于生物大分子的分析。其原理是:通过电离源将蛋白质分子转化为气相离子,然后利用质谱分析仪的电场、磁场将具有特定质量与电荷比值(M/Z值)的蛋白质离子分离开来,经过离子检测器收集分离的离子,确定离子的M/Z值,分析鉴定未知蛋白质。 蛋白质和肽的序列分析 现代研究结果发现越来越多的小肽同蛋白质一样具有生物功能,建立具有特殊、高效的生物功能肽的肽库是现在的研究热点之一。因此需要高效率、高灵敏度的肽和蛋白质序列测定方法支持这些研究的进行。现有的肽和蛋白质测序方法包括N末端序列测定的化学方法Edman法、C末端酶解方法、C末端化学降解法等,这些方法都存在一些缺陷。例如作为肽和蛋白质序列测定标准方法的N末端氨基酸苯异硫氰酸酯(phenylisothiocyanate)PITC分析法(即Edman法,又称PTH法),测序速度较慢(50个氨基酸残基/天);样品用量较大(nmol级或几十pmol级);对样品纯度要求很高;对于修饰氨基酸残基往往会错误识别,而对N末端保护的肽链则无法测序[4]。C末端化学降解测序法则由于无法找到PITC这样理想的化学探针,其发展仍面临着很大的困难。在这种背景下,质谱由于很高的灵敏度、准确性、易操作性、快速性及很好的普适性而倍受科学家的广泛注意。在质谱测序中,灵敏度及准确性随分子量增大有明显降低,所以肽的序列分析比蛋白容易许多,许多研究也都是以肽作为分析对象进行的。近年来随着电喷雾电离质谱(electrospray ionisation,ESI)及基质辅助激光解吸质谱(matrix assisted laser desorption/ionization,MALDI)等质谱软电离技术的发展与完善,极性肽分子的分析成为可能,检测限下降到fmol级别,可测定分子量范围则高达100000Da,目前基质辅助的激光解吸电离飞行时间质谱法(MALDI TOF MS)已成为测定生物大分子尤其是蛋白质、多肽分子量和一级结构的有效工具,也是当今生命科学领域中重大课题——蛋白质组研究所必不可缺的关键技术之一 [5] 。目前在欧洲分子生物实验室(EMBL)及美国、瑞士等国的一些高校已建立了MALDI TOF MS蛋白质一级结构(序列)谱库,能为解析FAST谱图提供极大的帮助,并为确证分析结果提供可靠的依据[6]。 蛋白质质谱分析研究进展 来自: 免费论文网 蛋白质的质谱分析方式 质谱用于肽和蛋白质的序列测定主要可以分为三种方法:一种方法叫蛋白图谱(proteinmapping),即用特异性的酶解或化学水解的方法将蛋白切成小的片段,然后用质谱检测各产物肽分子量,将所得到的肽谱数据输入数据库,搜索与之相对应的已知蛋白,从而获取待测蛋白序列。将蛋白质绘制“肽图”是一重要测列方法。第二种方法是利用待测分子在电离及飞行过程中产生的亚稳离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基,其中亚稳离子碎裂包括“自身”碎裂及外界作用诱导碎裂.第三种方法与Edman法有相似之处,即用化学探针或酶解使蛋白或肽从N端或C端逐一降解下氨基酸残基,形成相互间差一个氨基酸残基的系列肽,名为梯状测序(laddersequencing),经质谱检测,由相邻峰的质量差知道相应氨基酸残基。 蛋白消化 蛋白的基团越大,质谱检测的准确率越低。因此,在质谱检测之前,须将蛋白消化成小分子的多肽,以提高质谱检测的准确率。一般而言,6-20个氨基酸的多肽最适合质谱仪的检测。现今最常用的酶为胰蛋白酶(trypsin),它于蛋白的赖氨酸(lysine)和精氨酸(arginine)处将其切断。因此,同一蛋白经胰蛋白酶消化后,会产生相同的多肽。 基质辅助激光解吸电离/飞行时间质谱测量法(MALDI-TOF MS) [7] 简而言之,基质辅助激光解吸电离/飞行时间质谱测量仪是将多肽成分转换成离子信号,并依据质量/电荷之比(mass/charge,m/z)来对该多肽进行分析,以判断该多肽源自哪一个蛋白。待检样品与含有在特定波长下吸光的发光团的化学基质(matrix)混合,此样品混合物随即滴于一平板或载玻片上进行挥发,样品混合物残余水份和溶剂的挥发使样品整合于格状晶体中,样品然后置于激光离子发生器(lasersource)。激光作用于样品混合物,使化学基质吸收光子而被激活。此激活产生的能量作用于多肽,使之由固态样品混合物变成气态。由于多肽分子倾向于吸收单一光子,故多肽离子带单一电荷.这些形成的多肽离子直接进入飞行时间质量分析仪(TOFmassanalyzer)。飞行时间质量分析仪用于测量多肽离子由分析仪的一端飞抵另一端探测器所需要的时间。而此飞行时间同多肽离子的质量/电荷的比值成反比,即质量/电荷之比越高,飞行时间越短。最后,由电脑软件将探测器录得的多肽质量/电荷比值同数据库中不同蛋白经蛋白酶消化后所形成的特定多肽的质量/电荷比值进行比较,以鉴定该多肽源自何种蛋白.此法称为多肽质量指纹分析(peptidemassfin-gerprinting)。基质辅助激光解吸电离/飞行时间质谱测量法操作简便,敏感度高,同许多蛋白分离方法相匹配,而且,现有数据库中有充足的关于多肽质量/电荷比值的数据,因此成为许多实验室的首选蛋白质谱鉴定方法。 电子喷雾电离质谱测量法(electrosprayion-izationmassspectrometry,ESI-MS)[8 ] 同基质辅助激光解吸电离/飞行时间质谱测量法在固态下完成不同,电子喷雾电离质谱测量法是在液态下完成,而且多肽离子带有多个电荷,由高效液相层析等方法分离的液体多肽混合物,在高压下经过一细针孔。当样本由针孔射出时,喷射成雾状的细小液滴,这些细小液滴包含多肽离子及水份等其他杂质成分。去除这些杂质成分后,多肽离子进入连续质量分析仪(tan- demmassanalyzer),连续质量分析仪选取某一特定质量/电荷比值的多肽离子,并以碰撞解离的方式将多肽离子碎裂成不同电离或非电离片段。随后,依质量/电荷比值对电离片段进行分析并汇集成离子谱(ionspectrum),通过数据库检索,由这些离子谱得到该多肽的氨基酸序列。依据氨基酸序列进行的蛋白鉴定较依据多肽质量指纹进行的蛋白鉴定更准确、可靠。而且,氨基酸序列信息即可通过蛋白氨基酸序列数据库检索,也可通过核糖核酸数据库检索来进行蛋白鉴定。 蛋白质质谱分析研究进展 来自: 免费论文网 4.蛋白质质谱分析的应用 1981年首先采用FAB双聚焦质谱测定肽分子量,分析十一肽(Mr=1318),质谱中出现准分子离子[M+1]+=1319强峰。分子量小于6kDa肽或小蛋白质合适用FAB质谱分析,更大分子量的多肽和蛋自质可用MALDI质谱或ESI质谱分析。用MALDI-TOF质谱分析蛋自质最早一例是Hillen Kramp等[9]于1988年提出用紫外激光以烟酸为基质在TOF谱仪上测出质量数高达60kDa蛋白质,精确度开始只有,后改进到。质谱技术主要用于检测双向凝胶电泳或“双向”高效柱层析分离所得的蛋白质及酶解所得的多肽的质量,也可用于蛋白质高级结构及蛋白质间相互作用等方面的研究[10,11],三条肽段的精确质量数便可鉴定蛋白质。近年来,串联质谱分析仪发展迅猛,其数据采集方面的自动化程度、检测的敏感性及效率都大大提高,大规模数据库和一些分析软件(如:SEQUEST)的应用使得串联质谱分析仪可以进行更大规模的测序工作。目前,利用2D电泳及MS技术对整个酵母细胞裂解产物进行分析,已经鉴定出1484种蛋白质,包括完整的膜蛋白和低丰度的蛋白质[12];分析肝细胞癌患者血清蛋白质组成分[13],并利用质谱进行鉴定磷酸化蛋白研究工作[14]及采用质谱技术研究许旺细胞源神经营养蛋白(SDNP)的分子结构[15]等。 结束语: 在蛋白质的质谱分析中,质谱的准确性(accuracy)对测定结果有很大影响,因此质谱测序现在仍很难被应用于未知蛋白的序列测定。肽和蛋白的质谱序列测定方法具有快速、用量少、易操作等优点,这些都非常适合于现在科学研究的需要。我们相信,随着各种衍生化方法和酶解方法的不断改进,蛋白双向电泳的应用[16]以及质谱技术的不断完善,质谱将会成为多肽和蛋白质分析最有威力的工具之一。

【关键词】 蛋白质组 【关键词】 线粒体;蛋白质组 0引言 线粒体拥有自己的DNA(mtDNA),可以进行转录、翻译和蛋白质合成. 根据人类的基因图谱,估计大约有1000~2000种线粒体蛋白,大约有600多种已经被鉴定出来. 线粒体蛋白质只有2%是线粒体自己合成的,98%的线粒体蛋白质是由细胞核编码、细胞质核糖体合成后运往线粒体的,线粒体是真核细胞非常重要的细胞器,在细胞的整个生命活动中起着非常关键的作用. 线粒体的蛋白质参与机体许多生理、病理过程,如ATP的合成、脂肪酸代谢、三羧酸循环、电子传递和氧化磷酸化过程. 线粒体蛋白质结构与功能的改变与人类许多疾病相关,如退行性疾病、心脏病、衰老和癌症. 尤其是在神经退行性疾病方面,线粒体蛋白质的研究日益受到关注. 蛋白质组研究技术的产生与发展为线粒体蛋白质组的研究提供了有力的支持,使得从整体上研究线粒体蛋白质组在生理、病理过程中的变化成为可能. 1线粒体的结构、功能与人类疾病 线粒体一般呈粒状或杆状,也可呈环形、哑铃形或其他形状,其主要化学成分是蛋白质和脂类. 线粒体由内外两层膜封闭,包括外膜、内膜、膜间隙和基质四个部分. 线粒体在细胞内的分布一般是不均匀的,根据细胞代谢的需要,线粒体可在细胞质中运动、变形和分裂增殖. 线粒体是细胞进行呼吸的主要场所,在细胞代谢旺盛的需能部位比较集中,其主要功能是进行氧化磷酸化,合成ATP,为细胞生命活动提供直接能量. 催化三羧酸循环、氨基酸代谢、脂肪酸分解、电子传递、能量转换、DNA复制和RNA合成等过程所需要的一百多种酶和辅酶都分布在线粒体中. 这些酶和辅酶的主要功能是参加三羧酸循环中的氧化反应、电子传递和能量转换. 线粒体具有独立的遗传体系,能够进行DNA复制、转录和蛋白质翻译. 线粒体不仅为细胞提供能量,而且还与细胞中氧自由基的生成、细胞凋亡、细胞的信号转导、细胞内离子的跨膜转运及电解质稳态平衡的调控等有关. 许多实验证实,线粒体功能改变与细胞凋亡〔1〕、衰老〔2〕、肿瘤〔3,4〕的发生密切相关;另外,有许多人类疾病的发生与线粒体功能缺陷相关,如线粒体肌病和脑肌病、线粒体眼病,老年性痴呆、帕金森病、2型糖尿病、心肌病及衰老等,有人统称为线粒体疾病〔5〕. 2线粒体蛋白质组学研究现状 线粒体蛋白质组的蛋白质鉴定Rabilloud等〔6〕在1998年,以健康人的胎盘作为组织来源,分离提取线粒体进行蛋白质组研究,试图建立线粒体蛋白质组的数据库,为研究遗传性或获得性线粒体功能障碍时线粒体蛋白质的变化提供依据. 他们使用IPG(pH )双相电泳技术, 共获得1500个蛋白点. 通过MALDITOFMS和PMF等技术鉴定其中的一些蛋白点,鉴于当时基因组信息的局限性,只有46种蛋白被鉴定出来. 随着人类基因组图谱的完成,应该有更多的蛋白点被鉴定出来. Fountoulakis等〔7〕从大鼠的肝脏中分离线粒体,并分别利用宽范围和窄范围pH梯度IPG对线粒体蛋白质进行双相电泳,通过MALDIMS鉴定出192个基因产物,大约70%的基因产物是具有广谱催化能力的酶,其中8个基因产物首次被检测到并且由一个点构成,而大多数蛋白质都是由多个点构成,平均10~15个点对应于一个基因产物. Mootha等〔8〕从小鼠大脑、心脏、肾脏、肝脏中分离提取线粒体蛋白质,进行线粒体蛋白质组研究,他们参照已有的基因信息共鉴定出591个线粒体蛋白质,其中新发现了163个蛋白质与线粒体有关. 这些蛋白质的表达与RNA丰度的检测在很大程度上是一致的. 不同组织的RNA表达图谱揭示出线粒体基因在功能、调节机制方面形成的网络. 对这些蛋白与基因的整合分析使人们对哺乳动物生物起源的认识更加深入,对理解人类疾病也具有参考价值. 线粒体亚组分的研究线粒体对维持细胞的体内平衡起着关键作用,因此加速了人们对线粒体亚组分的研究. 线粒体内膜不仅包含有呼吸链复合物,它还包含多种离子通道和转运蛋白. 对线粒体发挥正常的功能起着重要作用. Cruz等〔9〕专注于线粒体内膜蛋白质的研究,他们通过二维液相色谱串联质谱技术鉴定出182个蛋白质,pI(),MW(Mr 6000~527 000),这些蛋白与许多生化过程相关,比如电子传递、蛋白质运输、蛋白质合成、脂类代谢和离子运输. 线粒体蛋白质复合物的研究线粒体内膜上嵌有很多蛋白质复合物,对于线粒体的功能具有重要作用,应用常规的双相电泳很难将这些蛋白质复合物完整地分离出来. Devreese等〔10〕采用Bluenative polyacrylamide gel electrophoresis(BNPAGE)分离线粒体内膜上的五个氧化磷酸化复合物,结合肽质量指纹图谱,成功地鉴定出氧化磷酸化复合物中60%的已知蛋白质. BNPAGE在分离蛋白质复合物时可以保持它们的完整性,因此这项技术可以用于研究在不同的生理病理状态下蛋白质复合物的变化及临床诊断等. 线粒体蛋白质组数据库目前人们查询最多的线粒体蛋白质组数据库有MITOP, MitoP2和SWISSPROT三种. MITOP〔11〕是有关线粒体、核编码的基因和相应的线粒体蛋白质的综合性数据库,收录了1150种线粒体相关的基因和对应的蛋白质,人们可依据基因、蛋白质、同源性、通道与代谢、人类疾病分类查询相关的信息.MitoP2〔12〕数据库中主要为核编码的线粒体蛋白质组的数据,MitoP2数据库将不同来源的线粒体蛋白质的信息整合在一起,人们可以根据不同的参数进行查询. MitoP2数据库既包括最新的数据也包括最初的MITOP〔11〕数据库中的数据. 目前数据库中主要为酵母和人的线粒体蛋白质组的数据,以后还将收录小鼠、线虫等的数据. 数据库旨在为人们提供线粒体蛋白质的综合性数据. SWISSPROT数据库包含269种人类线粒体蛋白质,其中与人类疾病相关的蛋白质有225种. 数据库中有相当一部分蛋白质没有明确的定位和功能信息的描述. 随着线粒体研究热潮到来和蛋白质组学技术的发展,将有更多的数据被填充到数据库中. 3线粒体蛋白质组研究中存在的问题 线粒体碱性蛋白质与低分子量蛋白质线粒体蛋白质中,具有碱性等电点的蛋白质占有很大比例,在等电聚焦时难以溶解,一些碱性程度很大的蛋白质如细胞色素C(pH )在pH 3~10的IPG胶上不能被分离出. 线粒体蛋白质中相当一部分蛋白是低分子量蛋白,因此在SDSPAGE电泳时要分别应用高浓度和低浓度分离胶,以更好地分离低分子量蛋白质和高分子量蛋白质. 线粒体膜蛋白质线粒体是一个具有双层膜结构的细胞器,内膜和外膜上整和有很多膜蛋白质,这些膜蛋白质对于线粒体功能的发挥具有重要作用,但是膜蛋白质具有很强的疏水性,在等电聚焦时,用常规的水化液难以溶解,因此用常规的IPG胶检测不出来. 换用不同的裂解液对膜蛋白的溶解具有帮助. 有研究人员在等电聚焦缓冲液中加入SB310以增加膜蛋白的溶解性. 在等电聚焦前对样品进行有机酸处理也可以增加膜蛋白的溶解性. 在研究中人们发现,不同的样品应该选用不同的裂解液,没有一种裂解液能够适合于所有的膜蛋白质.百事通针对膜蛋白质的难溶和等电聚焦时的沉淀,一些研究人员另辟径,避开双相电泳而进行一维SDSPAGE电泳,如Taylor等〔13〕先通过蔗糖梯度离心将线粒体蛋白质分成不同的组分,而后将每一个组分进行一维电泳,一维电泳中SDS可以很好地溶解疏水性蛋白质和膜整合蛋白质,他们鉴定出600多种线粒体蛋白质,其中有很多蛋白质以前应用双相电泳没有被鉴定出来. 他们鉴定的蛋白质中有很多具有跨膜结构域,如adenine nucleotide translocator(ANT1)和VDACs蛋白质,这些蛋白质对于调节线粒体的功能具有关键作用而且应用常规双相电泳很难被鉴定出来. 提高质谱鉴定的灵敏性对于一维SDSPAGE电泳后蛋白质分析鉴定具有很大的帮助,Pflieger等〔14〕应用液相色谱串联质谱(LCMS/MS)成功地鉴定出179种线粒体蛋白质,其中43%是膜蛋白质而且23%具有跨膜结构域. 液相色谱串联质谱(LCMS/MS)检测灵敏度较高,SDS可以很好地溶解膜蛋白,因此这种方法比传统的双相电泳具有更高的灵敏性而且不受蛋白质等电点、分子量、疏水性的限制. 线粒体样品的纯度线粒体样品的纯度对于蛋白质组分析非常重要,在样品制备的过程中,具有与线粒体相同沉降系数的成分会同线粒体一起沉降下来,如内质网、微粒体、胞浆蛋白的一些成分. 这些蛋白斑点出现在双相电泳胶上,会影响整体蛋白质组分析的结果. 因此提高样品的纯度至关重要. Scheffler等〔15〕采用多步percoll/metrizamide密度梯度离心纯化线粒体样品,双相电泳后鉴定出61个蛋白质,几乎全部是线粒体蛋白质. 4未来展望 随着人类基因组工作草图的完成,生命科学的研究进入后基因组时代,蛋白质组学的研究遂成为重点. 蛋白质组学旨在采用全方位、高通量的技术路线,确认生物体全部蛋白质的表达和功能模式,从一个机体、一个器官组织或一个细胞的蛋白质整体活动来揭示生命规律,并研究疾病的发生机制、建立疾病的早期诊断和防治方法. 抗体技术在线粒体蛋白质组学领域中具有重要的应用价值. 单克隆抗体还具有高度的特异性,应用于亲和层析技术中不仅可以去除组织细胞样品中高表达的蛋白质成分,同样也可以富集表达量极低的组分. 结合蛋白免疫转印、流式细胞术和免疫组织细胞化学,实现对相应蛋白质的定性、定量和细胞(内)定位分析. 与微阵列技术(芯片)结合,可以研制出含有成百上千种抗体的蛋白(抗体)芯片,这种新技术使得研究人员可以在一次实验中比较生物样品中成百上千的蛋白质的相对丰度,能够检测到样品中浓度很低的抗原,以实现蛋白质组学对复杂组分高通量、高效率的检测. 某些抗体可以特异性识别蛋白质翻译后修饰的糖基化或磷酸化位点、降解产物、功能状态和构象变化,成为基因芯片检测不可替代的补充. 抗体捕获组分的分析有助于蛋白质复合物及其相互作用的研究,也在新的蛋白质发现和确认方面提供重要信息和证据. 随着抗体技术的不断提高,抗体数目的不断增多,蛋白质组学的研究也将更加深入. 线粒体不仅参与细胞重要的生命活动,而且对于生物进化的研究也有重要意义. 随着线粒体研究热潮的到来,将有更多的蛋白质被发现,对于蛋白质功能的研究也将更加深入,相信线粒体蛋白质组的研究对于人类疾病的发病机制和早期诊断将做出重要贡献. 【参考文献】 〔1〕 Jiang X, Wang X. Cytochrome Cmediated apoptosis 〔J〕. Annu Rev Biochem, 2004,73: 87-106. 〔2〕 Chen XJ, Wang X, Kaufman BA, et al. Aconitase couples metabolic regulation to mitochondrial DNA maintenance 〔J〕. Science, 2005,307(5710): 714-717. 〔3〕 Petros JA, Baumann AK, RuizPesini E, et al. mtDNA mutations increase tumorigenicity in prostate cancer 〔J〕. PNAS, 2005,102(3):719-724. 〔4〕 Wonsey DR, Zeller KI, Dang CV. The cMyc target gene PRDX3 is required for mitochondrial homeostasis and neoplastic transformation 〔J〕. PNAS, 2002, 99(10): 6649-6654. 〔5〕 Taylor RW, Turnbull DM. Mitochondrial DNA mutations in human disease〔J〕. Nat Rev Genet, 2005,6:389-402. 〔6〕 Rabilloud T, Kieffer S, Procaccio V, et al. Twodimensional electrophoresis of human placental mitochondria and protein identification by mass spectrometry: toward a human mitochondrial proteome 〔J〕. Electrophoresis, 1998,19:1006-1014. 〔7〕 Fountoulakis M, Berndt P, Langen H, et al. The rat liver mitochondrial proteins〔J〕. Electrophoresis, 2002,23:311-328. 〔8〕 Mootha VK, Bunkenborg J, Olsen JV, et al. Integrated analysis of protein composition, tissue diversity, and gene regulation in mouse mitochondria 〔J〕. Cell, 2003,115(5): 629-640. 〔9〕 Cruz SD, Xenarios I, Langridge J, et al. Proteomic analysis of the mouse liver mitochondrial inner membrane 〔J〕. J Biol Chem, 2003, 278(42): 41566-41571. 〔10〕 Devreese B, Vanrobaeys F, Smet J, et al. Mass spectrometric identification of mitochondrial oxidative phosphorylation subunits separated by twodimensional bluenative polyacrylamide gel electrophoresis 〔J〕. Electrophoresis, 2002,23: 2525-2533. 〔11〕 Scharfe C, Zaccaria P, Hoertnagel K, et al. MITOP, the mitochondrial proteome database: 2000 update 〔J〕. Nuc Acid Res, 2000,28(1):155-158. 〔12〕 Andreoli C, Prokisch H, Hortnagel K, et al. MitoP2, an integrated database on mitochondrial proteins in yeast and man 〔J〕. Nuc Acid Res, 2004,32(90001):459-462. 〔13〕 Taylor SW, Warnock DE, Glenn GM, et al. An alternative strategy to determine the mitochondrial proteome using sucrose gradient fractionation and 1D PAGE on highly purified human heart mitochondria 〔J〕. J Proteome Res, 2002,1(5):451-458. 〔14〕 Pflieger D, Le Caer JP, Lemaire C, et al. Systematic identi?cation of mitochondrial proteins by LCMS/MS 〔J〕. Anal Chem, 2002,74:2400-2406. 〔15〕 Scheffler NK, Miller SW, Carroll AK, et al. Twodimensional electrophoresis and mass spectrometric identification of mitochondrial proteins from an SHSY5Y neuroblastoma cell line〔J〕. Mitochondrion, 2001,1(2):161-179.

相关百科

热门百科

首页
发表服务