前列腺素E2(Prostaglandin E2,PGE2)是一种二十碳不饱和脂肪酸。目前,畜牧生产上将该激素主要用作待产母畜的催产素,在同期发情技术上也有应用。实际上,前列腺素E2在体内分布广泛,不仅仅是参与机体平滑肌的收缩,还参与炎症反应的炎性递质,干细胞增殖分化,而且在骨组织形成与改建过程中也有非常重要的调节作用[1]。前列腺素E受体3基因(Prostaglandin E receptor 3,PTGER3)编码前列腺素E2受体EP3蛋白[2]。EP3蛋白是前列腺素E2(Prostaglandin E2,PGE2)的受体中的一种亚型,属于G蛋白偶联受体家族(G-protein coupled receptors,GPCRs)[3]。G蛋白偶聯受体家族的成员庞大,主要通过结合和调节细胞G蛋白活性完成细胞内信号传递,是细胞重要的代谢门控。此外,部分GPCRs参与细胞增殖转化炎症变态等机体反应,具有重要的生物学意义[3-5]。根据G蛋白偶联信号传导理论,前列腺素E2需要与前列腺素E2受体EP3蛋白结合,EP3蛋白与多种G蛋白偶联,才能将细胞外信号转为细胞内信号。
本试验利用生物信息学相关网页和软件对绵羊的PTGER3基因进行理论分析,预测绵羊PTGER3基因及其编码蛋白的结构和功能,对实际生产科学应用前列腺素E2提供指导,为下一步羊的PTGER3基因重组实验提供帮助,为未来PTGER3基因检测技术对绵羊进行选育提供理论依据。
1 材料与方法
1.1 试验材料
试验序列材料来源于美国国家生物信息中心(http://www.ncbi.nlm.nih.gov/),下文简称为NCBI。本研究选用绵羊(XM_012173631.2)、山羊(XM_018045482.1)、牛(NM_181032.1)、人(XM_011541810.2)、家鼠(XM_011240037.1)、狗(NM_001002958.1)、猪(XM_013988866.1)和鸡(NM_001040468.1)8个物种的mRNA序列。括号内为NCBI中的GenBank数据库的登录号。
1.2 试验方法
绵羊PTGER3基因开放阅读框(Open reading frame,ORF)利用NCBI网页中的ORF Finder程序对其mRNA序列进行识别预测分析;PTGER3基因编码产物的理化性质采用ExPASy在线预测(http://www.expasy.org/);对编码产物的位置分布采用PSORTⅡ亚细胞定位(http://www.genscript.com/psort/psort2.html)分析预测;编码产物结构功能分析采用是ProtFun网页(http://www.cbs.dtu.dk/services/ProtFun)预测;跨膜区域预测分析采用信号肽网页在线分析(http://www.cbs.dtu.dk/services/SignalP/);二级结构采用Jpred网页预测(http://www.compbio.dundee.ac.uk/www-jpred/);利用DNAMAN软件对试验序列的同源性进行分析比较。
2 结果与分析
2.1 绵羊PTGER3基因的ORF分析
开放阅读框(Open reading frame,ORF)是一段可编码蛋白质的,中间无终止序列打断从启动子到终止子的碱基序列。通过识别ORF可以快速识别出基因序列中的编码区域。图1为绵羊PTGER3基因的开放阅读框的结果,可知此序列中共识别有12个开放阅读框,其中最大的开放阅读框长度为1 239 bp,分析是由412个氨基酸构成了该编码产物的。
2.2 绵羊PTGER3基因编码产物序列同源性分析
由图2可以看出,研究对照的8个物种中均表达有PTGER3基因。尤其绵羊、牛的序列同源性高,因此推测这2个物种的亲缘关系较近。根据图3的PTGER3基因编码产物的系统发育树可以看出,绵羊、牛同源性远高于其他物种,其亲缘相似性到达了99%;此外,绵羊与山羊的系统发育的距离很近,其亲缘相似性达到了92%。
2.3 绵羊PTGER3基因编码产物的理化性质分析
氨基酸是蛋白质的基本组成单位,图4是预测绵羊PTGER3基因编码产物的氨基酸组成的分析图,结果表明,其编码产物的理论分子量约为45 568.48 Da,其等电点为9.49,编码的421个氨基酸中,含有色氨酸、苯丙氨酸和酪氨酸,可知该编码产物可以利用280 nm的光吸收值进而预测分析溶液中的蛋白含量。此外,从氨基酸组成上发现,脂质类氨基酸占全部氨基酸的51.8%,其中脂肪族类∶芳香族类为190∶67。该蛋白还富有羟基和含硫氨基酸,所占比例分别为16.8%和7.3%。
2.4 绵羊PTGER3基因编码产物亚细胞定位分析
绵羊PTGER3基因编码产物的亚细胞定位结果如表1所示,PTGER3基因编码产物主要表达在内质网中,其可能性为66.7%,同时在高尔基体、线粒体、细胞质基质的分布概率均占11.1%。由此可以推断该基因产物作用比较专一,在细胞中的内质网、高尔基体、细胞质基质、线粒体中发挥生物学作用,可能参与调控细胞中辅助因子合成、中间代谢产物的合成以及能量代谢的生命活动。
2.5 绵羊PTGER3基因编码产物结构功能预测与分析
结构域是二级蛋白序列片段经过盘曲折叠形成的超二级结构,不同的结构域具有不同的特定的功能作用。通过分析PTGER3编码产物的结构域的特点可有效预测基因PTGER3编码产物的功能。从表2可得知,PTGER3主要具有调控功能、辅助因子生物合成、能量代谢和代谢中间产物的功能,可能性分别为0.530、0.133、0.087和0.046,由此推断PTGER3作为运载体在信号传导、能量调控和分泌蛋白转录和翻译中发挥重要调节作用。
2.6 绵羊PTGER3基因编码产物信号肽预测与分析
信号肽序列是存在于分泌蛋白基因编码序列中,在起始密码子之后的一段富含疏水氨基酸多肽的序列。通过检测绵羊PTGER3基因编码产物信号肽的存在情况,可以得知编码产物是否是分泌蛋白和跨膜蛋白以及跨膜蛋白的基本信息。由图5可知,绵羊PTGER3蛋白氨基酸C值为1,Y值为1,S值为1。表明PTGER3基因的编码产物不存在信号肽,是非分泌性蛋白;未发现跨膜区,该蛋白是非跨膜蛋白。
2.7 绵羊PTGER3基因编码产物二级结构的预测与分析
Jpred是一款利用已知氨基酸序列推测其蛋白二级结构的网络服务系统。通过预测绵羊PTGER3基因产物的二级结构,分析后结果如图6所示。绵羊PTGER3基因编码产物从N端的第50个氨基酸才开始出现二级结构,即第50位的丝氨酸处形成第一个α螺旋结构。PTGER3蛋白二级结构按照αααααββαααααααα顺序排列,其中共由13个α螺旋、2个β折叠。
3 讨论
本试验选取登记在NBCI数据库中猪、马、牛、山羊和绵羊等物种的PTGER3基因序列,利用生物信息学方法对绵羊PTGER3基因分析其编码蛋白结构和功能。生物信息学是利用数学方法处理和分析生物数据,基于人们现有对分子生物学的认识和构建生物模型,进而分析其生物学特性的方法。如根据不同核糖核苷酸序列估计其氨基酸组成、蛋白的结构和功能等。利用基因数据库和生物信息学方法系统分析相关基因及其编码产物,是当前功能基因组学的重要研究手段。其明显优于过去的单一基因研究模式,可以在基因组、分子的水平对基因的表达调控网络机制进行系统全面的分析[6]。
4 结论
①研究结果显示,在系统发育树中,绵羊、牛和山羊的PTGER3基因的同源性高于其他物种。
②通過分析绵羊的PTGER3基因序列编码产物的氨基酸的组成,得知分子量为45 568.48 Da,其等电点为9.46,是碱性蛋白质。
③预测显示编码产物是非酶非跨膜非分泌蛋白质,并根据组成的各类氨基酸分子理化性质和比例关系,推测该编码产物是分布于细胞膜表面,通过调控离子通道达到调节生理功能的作用。
④通过对其氨基酸序列的结构域的特点,预测在生物体中该蛋白的生理功能是主要参与细胞中辅酶因子的生物合成、中间产物的代谢和能量代谢。
参考文献
[1]李劼若,邓思远,侯辉歌,等.前列腺素E2调控骨髓间充质干细胞成骨分化最佳浓度及其效应基因[J].中国组织工程研究,2014(14):2147-2152.
[2]张迪.PTGER3基因多态性与精神分裂症的关联性研究[D].长春:吉林大学,2009.
[3]赵荷雅.前列腺素受体EP3的结构与功能研究[D].长春:吉林大学,2013.
[4]赵玉华.G蛋白偶联受体的研究进展[J].国外医学(分子生物学分册),2002(5):302-305.
[5]侯永丰,李通化.HMM用于G蛋白偶联受体超家族的识别[J].同济大学学报(自然科学版),2004(12):1696-1700.
[6]滕玉鸥,宋彬彬,郭茜楠,等.前列腺素E-2受体EP-3及其调节剂的研究进展[J].天津科技大学学报,2014(1):1-6.