生物信息学其实目前的发展,个人觉得就是用计算机的强大运算能力来解决生物实验中出现的大量数据,并期待在其中发现更多生物的规律以及特点。
个人认为计算机已经成为了一个世界的核心工具,什么领域都快要离不开计算机了,计算机分析金融已经不是什么很新鲜的事情了,计算机解决数学物理问题更是司空见惯,学建筑的和土木的需要用计算机制图,使用CAD等软件,就算是搞商业的也需要用到Excl等等……所以计算机与生物的绑定,其实应该是一种必然出现的趋势吧,所以个人觉得,这个领域会发展的很快很快(而且目前的确是这样的)。
至于说未来,我觉得有几种趋势:首先就是应用于研究领域,毫无疑问现在很多大学和研究所都已经有了相应的计算生物领域的分支了,通过学计算机的人和数学的人编写程序分析查找海量的生物数据中的规律,然后在将猜测到的结果告知生物学家,让他们做实验验证假设,这就是我未来的工作(这不稀奇,现在各个领域的研究都很依赖计算机了,之所有血淋淋的生物最晚于计算机挂钩,那是因为生物学科本来就是人类深入最浅的一门学科)。
另外我觉得生物信息将会真正意义上引爆生物的革命,个人觉得无论什么研究领域,只有转化为应用,作用于社会与世界才真正有意义,现在开始出现的个人基因组测序已经是生物产业出现的前兆,比如Affymatrix,华大基因等等……但是大量的数据根本没有人读得懂!生物信息的第一个应用我觉得就会出现在生物数据的解释上,这就类比于,每个人都可以查询到海量的股票信息,但是只有特定的Analysis可以发现其中蕴含的商机一样!可以想象,如果一群人破解了一大堆人类的有关于生老病死的基因信息,但是他们不公开,他们需要你缴费,然后给你测序(以后测序会非常非常便宜的,我估计就会像现在每人必须有身份证一样普遍),然后帮你分析,你有什么疾病……等等。这样的产业出现与微软有什么差别!!完全没有!!微软存在的基础是计算机的普及,我设想的生物公司的基础是测序的普及,微软提供自己的软件,你必须买,生物公司提供自己公司内部的数据资料,帮你分析(类似于做一次咨询)……这是我个人的一点想法是一种比较直接的使用生物信息技术的手段。
至于其他,计算机的运用应该会深入到方方面面,因为我觉得一切其他的领域都已经被计算机插足了,农业的灌溉系统是全自动的,机床是数控的,显微镜是电子的,华尔街的数据每天有无数的计算机在分析……这一切都是计算机普及之后的30年之内实现的,所以生物信息个人觉得前景还是很强大的。之前一直在说的DNA计算机,我觉得相反比较难实现……因为我很久没有听说相关进展了,我感觉下一代计算机是量子的更可能,但这并不妨碍什么,因为我个人觉得,计算机仅仅是一个工具,一个任何领域都离不开的工具而已,以后任何人都需要掌握这一门工具,就像是现在中国几乎所有的在校大学生都能说几句英语一样普及。
补一句吧,这个领域目前还是集中在研究领域,就业相比于其他工科专业还是要差一些的,不过个人感觉相比于纯生物领域好很多,工资状况影响因素很多,大学城市都有影响,不过总体来说,目前这个领域远远不如如日中天的IT,我是计算机学院的,IT的发展速度已经早表明,计算机的时代远远的没有到结束的那一天,未来十几年甚至几十年,我个人觉得工资上IT人依然会笑傲工科领域……如果你很在意工资就业什么的,我挺推荐计算机的,IT的世界是很公平的,而且确实压力与机遇并存,如果你努力,一般都会获得成功,很适合年轻人。
以上均为个人感想而已拉 ^_^ ,很多其实应该都是错的,还望指正
基因芯片——“生物信息精灵”
——浅谈数学、计算机在现代生命科学研究中的作用
二十世纪是物理科学的世纪,而二十一世纪则是生命科学的世纪。生命科学,尤其是生物技术的迅猛发展,不仅与人类健康,农业发展以及生存环境密切相关,而且还将对其它学科的发展起到促进作用,所谓"今天的科学,明天的技术,后天的生产"。而生命科学的基础性研究是现代生物技术的源泉、科学和技术创新的关键。
现代生物技术,是一门领导尖端科技的学科,正因如此,我很想知道它与数学——我得专业课,计算机等理论或技术是怎样有机的联系在一起的。基于此,我利用课余时间查阅了许多网站、书籍,并有了小小的收获。现就“基因芯片”技术,浅谈如下。
一、基因芯片简介
基因芯片,也叫DNA芯片,是在90年代中期发展出来的高科技产物。基因芯片大小如指甲盖一般,其基质一般是经过处理后的玻璃片。每个芯片的基面上都可划分出数万至数百万个小区。在指定的小区内,可固定大量具有特定功能、长约20个碱基序列的核酸分子(也叫分子探针)。
由于被固定的分子探针在基质上形成不同的探针阵列,利用分子杂交及平行处理原理,基因芯片可对遗传物质进行分子检测,因此可用于进行基因研究、法医鉴定、疾病检测和药物筛选等。基因芯片技术具有无可比拟的高效、快速和多参量特点,是在传统的生物技术如检测、杂交、分型和DNA测序技术等方面的一次重大创新和飞跃。
二、基因芯片技术
生物芯片技术是于90年代初期随着人类基因组计划的顺利进行而诞生,它是通过像集成电路制作过程中半导体光刻加工那样的微缩技术,将现在生命科学研究中许多不连续的、离散的分析过程,如样品制备、化学反应和定性、定量检测等手段集成于指甲盖大小的硅芯片或玻璃芯片上,使这些分析过程连续化和微型化。也就是说将现在需要几间实验室、检验室完成的技术,制作成具有不同用途的便携式生化分析仪,使生物学分析过程全自动化,分析速度成千上万倍地提高,所需样品及化学试剂成千上万倍地减少。可以预见,在不远的将来,用它制作的微缩分析仪将广泛地应用于分子生物学、医学基础研究、临床诊断治疗、新药开发、司法鉴定、食品卫生监督、生物武器战争等领域。
生物芯片技术是目前应用前景最好的DNA分析技术之一,分析对象可以是核酸、蛋白质、细胞、组织等。目前全世界用生物芯片进行疾病诊断还处于研究阶段,国外已将其用于观察癌基因及肌萎缩等一些遗传病基因的表达和突变情况。
生物芯片技术还可以用于治疗,例如已开发出在4平方毫米的芯片上布满400根有药物的针,定时定量为病人进行药物注射。另外,科学家还在考虑制作定时释放胰岛素治疗糖尿病的生物芯片微泵及可以置入心脏的芯片起搏器等。生物芯片技术与组合化学相结合将开辟另一个极有价值的应用方向,即为新药研制提供超高通量筛选平台技术,这必将使新药研究开发和传统中药的成分评估获得重大突破。
三、基因芯片的应用技术举例
1、基因破译
目前,由多国科学家参与的“人类基因组计划”,正力图在21世纪初绘制出完整的人类染色体排列图。众所周知,染色体是DNA的载体,基因是DNA上有遗传效应的片段,构成DNA的基本单位是四种碱基。由于每个人拥有30亿对碱基,破译所有DNA的碱基排列顺序无疑是一项巨型工程。与传统基因序列测定技术相比,基因芯片破译人类基因组和检测基因突变的速度要快数千倍。
基因芯片的检测速度之所以这么快,主要是因为基因芯片上有成千上万个微凝胶,可进行并行检测;同时,由于微凝胶是三维立体的,它相当于提供了一个三维检测平台,能固定住蛋白质和DNA并进行分析。
美国正在对基因芯片进行研究,已开发出能快速解读基因密码的“基因芯片”,使解读人类基因的速度比目前高1000倍。图1所示为一种内嵌基因芯片的基因检测装置。
2、基因诊断
通过使用基因芯片分析人类基因组,可找出致病的遗传基因。癌症、糖尿病等,都是遗传基因缺陷引起的疾病。医学和生物学研究人员将能在数秒钟内鉴定出最终会导致癌症等的突变基因。借助一小滴测试液,医生们能预测药物对病人的功效,可诊断出药物在治疗过程中的不良反应,还能当场鉴别出病人受到了何种细菌、病毒或其他微生物的感染。利用基因芯片分析遗传基因,将使10年后对糖尿病的确诊率达到50%以上。
未来人们在体检时,由搭载基因芯片的诊断机器人对受检者取血,转瞬间体检结果便可以显示在计算机屏幕上。利用基因诊断,医疗将从千篇一律的“大众医疗”的时代,进步到依据个人遗传基因而异的“定制医疗”的时代。
3、基因环保
基因芯片在环保方面也大有可为。基因芯片可高效地探测到由微生物或有机物引起的污染,还能帮助研究人员找到并合成具有解毒和消化污染物功能的天然酶基因。这种对环境友好的基因一旦被发现,研究人员将把它们转入普通的细菌中,然后用这种转基因细菌清理被污染的河流或土壤。
4、基因计算
DNA分子类似“计算机磁盘”,拥有信息的保存、复制、改写等功能。将螺旋状的DNA的分子拉直,其长度将超过人的身高,但若把它折叠起来,又可以缩小为直径只有几微米的小球。因此,DNA分子被视为超高密度、大容量的分子存储器。
基因芯片经过改进,利用不同生物状态表达不同的数字后还可用于制造生物计算机。基于基因芯片和基因算法,未来的生物信息学领域,将有望出现能与当今的计算机业硬件巨头――英特尔公司、软件巨头――微软公司相匹敌的生物信息企业。
四、基因芯片的实际应用
基因芯片在生命科学、医药研究、环境保护和农业等领域有极其重要的应用价值。在基因芯片的驱动下,人类正进入一个崭新的生物信息时代。
1、在美国科学家第一次将一个他们称之为生物芯片的计算机芯片植入人体的细胞上,从而使人体细胞与计算机连接。这是美国科学家波利斯·鲁宾斯基(Boris Lubinsky)和他的同事黄永(译音)在3月份的美国《生物医学微设备》杂志中著文披露的。
2、人体细胞外面包有一个细胞膜,该细胞膜具有使特定物质单向通过的功能。多年来,科学家们一直寻求找到用电冲击的方法,使所希望的物质进入细胞膜,但直 到目前为止,所用的方法有时成功,有时失败。而使用鲁宾斯基和黄永研究出来的 新方法,细胞膜由计算机得到一个信号,让某些物质进入到细胞中。随具体场合的 不同,这些物质可以是例如用来改变基因的遗传物质,也可以是药物或蛋白质。这样,就可以更好地使这些物质发生效力。
鲁宾斯基等科学家打算研制出能对例如神经细胞和肌肉等人体组织发出指令的生物芯片,这样至少会使人所服用的药物发挥更大的效力。俄亥俄州立大学生物医学工程中心主任莫里罗·弗拉里称鲁宾斯基的这项发明是处在发展阶段早期的具有潜在作用的实验室工具。
美国科学家们称,他们已经找到了一种能使人体细胞和电路进行交配的生物工程芯片,它能在医学和基因工程学方面发挥关键的作用。
这种比头发还小还细的微型装置使健康人体细胞和电子芯片结合,通过电脑对芯片进行控制,科学家认为他们能够控制细胞的活动。
电脑向细胞芯片发送电脉冲,激发细胞膜孔张开,并激活细胞。科学家希望能够大批量地生产这种细胞芯片,并能够把它们植入人体,取代或修正病变组织。
领导这项研究的加州大学机械工程学教授鲍里斯·鲁宾斯基说:“细胞芯片还使科学家在复杂的基因治疗过程中更准确地进行控制,因为他们能够更准确地开启细胞孔。”
鲁宾斯基还说:“我们在生物学领域里引入了工程学的精髓,我们完全可以在不影响周围其它细胞的情况下输入DNA、提取蛋白质以及注射药物。”
该细胞芯片的出现与长期存在的一种理论有关,即一定量的电压能够穿透细胞膜。
多年来,科学家一直在进行用电力轰击细胞试验的遗传研究,希望藉此引入新的疗法和基因物质。研究人员希望能最终制造出与激活不同的身体组织(从肌肉到骨骼到大脑)所需的准确的电压量相调合的细胞芯片。那样的话,将会有数以千计的细胞芯片用来治疗各种类型的疾病。
3、用独创技术自行研制的中国第一片应用型基因芯片于近日在第一军医大学正式诞生。
据第一军医大学有关负责人透露,该军医大研制成功的基因芯片,是中国首次应用一种创新的基因片扩增技术,率先攻克了内地同行在基因芯片研究中首先面临的快速经济地搜集数以万数基因探针难题,并巧妙运用新技术手段明显地降低成本。
目前,该芯片已完成实验室工作,即将进入临床验证阶段,如果顺利,用於临床诊断的基因芯片可望不久投入批量生产。但到目前为止,全世界还没有实际用於临床应用诊断的基因芯片生产。
在实验室里,将这几片比大拇指盖稍大的基因芯片,放在检测器上,与之相连的电脑屏幕上立刻出现了纵横交错的红红绿绿荧光点,出现的每个荧光点就是一个基因片断的点阵。只要取病人一滴血放在芯片检测卡上,经过分子杂交后,连上电脑就可以立刻显示出基因变化情况,并通过电脑把基因语言翻译成医生能读得懂的信息,从而对疾病做出准确的诊断。
这种芯片的成功诞生,标志着疾病的诊断由细胞和组织水平推进到基因水平。它们的开发应用将在环境污染控制、动植物检疫、器官移植、产前诊断、药物筛选、药物开发等方面展示出广阔的前景。
五、生命科学渐成IT公司关注焦点
人类基因组工作草图绘毕的消息像打开了阿里巴巴宝藏的大门,以基因技术为核心的生命科学市场正吸引着越来越多的淘金者。近来,为这些淘金者生产“铁锨”的资讯科技(IT)公司的积极行动颇为引人注目。
1、揭开基因之迷须破译大量数据
人类基因组草图仅仅是读出了“生命之书”,而要真正读懂它,揭示所有基因编码所代表的信息,还必须破译浩如烟海的数据。
在著名的英国桑格中心里,有关人类基因组的数据已经达到22万亿字节,是世界上首屈一指的美国国会图书馆藏书内容的两倍多。据这家中心估计,在未来两至三年内,与人类基因组有关的数据量还将上升到50万亿至100万亿字节。
2、生命科学公司10%投资用于开发资讯科技
为了解决处理数据所需的庞大计算能力的问题,世界上最大的12家生命科学公司目前把近10%的科研预算用于资讯科技投资,而且这个比例可能还将增长。
据美国国际商业机器公司(IBM)估计,与生命科学有关的资讯科技市场将在今年达到35亿美元,到2003年达到90亿美元。
3、市场潜力巨大
一些著名的IT企业,已将眼光瞄准了这一潜力巨大的市场。例如,IBM已经决定投资1亿美元,用五年时间研制一种名为“蓝基因”的超级电脑。
“蓝基因”的运算能力将是美国现有40台最快的超级电脑运算能力总和的40倍,它主要用于模拟人类蛋白折叠成特殊形状的过程。世界最大的个人电脑制造商美国康柏公司,也垂涎这块“肥肉”。
4、康柏趁早下手培养未来客户基础
已经成为生命科学领域电脑服务器主要供应商的康柏公司最近宣布,它将继续投资1亿美元,支持新兴生物技术公司,以培养未来的客户基础。
其实,IT公司还远不止盯着这些近期利益。以基因研究为基础的生物经济可能在新世纪里成为新经济的重要组成部分,对此人们已经达成共识。
5、行业标准制定者能享有巨大经济利益
根据以往的经验,率先进入市场的公司大多能够成为行业标准的制定者,这些行业标准往往意味着巨大的经济利益。
今年8月,德国狮生命科学公司的股票上市。由于投资者看中这家公司的基因次序检索系统(SRS)可能成为行业新标准,其股票价格在短短时间里迅速上涨了50%。
6、政府支持基因研究
IT公司进军生命科学领域,与各国政府对基因研究的支持密不可分。为了在基因组研究的下一个阶段——分析蛋白质结构的国际竞争中领先,不少国家积极采取措施,促进信息业与生物产业的结合。
例如,日本不久前就组织了“官产学”大联合的“生物产业信息化研究共同体”,参加这个共同体除了制药、食品、生物、化学等与基因科学相关的企业外,还有不少电脑公司。
小结:科学界公认,生物芯片技术将给下个世纪生命科学和医学研究带来一场革命。目前我国科学家正在加速研制这种可能快捷便利提取DNA,查找遗传基因特性的新技术。相信,这一现代生物与高科技联姻的成果将为二十一世纪的发展作出巨大的贡献!
总体来说呈上升趋势,生物信息行业目前也是比较有市场的。行业技术更新快,要求学习能力强,不断跟上新技术。
虽然说各个公司都缺人,但全国一共就1000多家公司,而且大部分是小公司,公司每年缺口也就一两千人。生物信息学是用计算机的方法处理生物数据,不能只理解成做个转录组重测序。生物医药产业的前景可以说一片大好。而用计算机处理生物数据又不可或缺。所以生物信息也会越来越重要,需求越来越大,会分化成多个职业。
科研岗位的需求会越来越多,当然竞争也会越来越大。
1,序列比对(Sequence Alignment)
序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似性.从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构DNA的完整序列.在各种试验条件下从探测数据(probe data)中决定物理和基因图存贮,遍历和比较数据库中的DNA序列比较两个或多个序列的相似性在数据库中搜索相关序列和子序列寻找核苷酸(nucleotides)的连续产生模式找出蛋白质和DNA序列中的信息成分序列比对考虑了DNA序列的生物学特性,如序列局部发生的插入,删除(前两种简称为indel)和替代,序列的目标函数获得序列之间突变集最小距离加权和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等.两个序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,甚至采用算法复杂性为线性的也难以奏效.因此,启发式方法的引入势在必然,著名的BALST和FASTA算法及相应的改进方法均是从此前提出发的.
2, 蛋白质结构比对和预测
基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性.蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般相似.蛋白质是由氨基酸组成的长链,长度从50到1000~3000AA(Amino Acids),蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等.氨基酸的序列内在的决定了蛋白质的3维结构.一般认为,蛋白质有四级不同的结构.研究蛋白质结构和预测的理由是:医药上可以理解生物的功能,寻找dockingdrugs的目标,农业上获得更好的农作物的基因工程,工业上有利用酶的合成.直接对蛋白质结构进行比对的原因是由于蛋白质的3维结构比其一级结构在进化中更稳定的保留,同时也包含了较AA序列更多的信息.蛋白质3维结构研究的前提假设是内在的氨基酸序列与3维结构一一对应(不一定全真),物理上可用最小能量来解释.从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构.同源建模(homology modeling)和指认(Threading)方法属于这一范畴.同源建模用于寻找具有高度相似性的蛋白质结构(超过30%氨基酸相同),后者则用于比较进化族中不同的蛋白质结构.然而,蛋白结构预测研究现状还远远不能满足实际需要.
3, 基因识别,非编码区分析研究.
基因识别的基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.非编码区由内含子组成(introns),一般在形成蛋白质后被丢弃,但从实验中,如果去除非编码区,又不能完成基因的复制.显然,DNA序列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中.分析非编码区DNA序列目前没有一般性的指导方法.在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已完成编码部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序列是难以想象的.侦测密码区的方法包括测量密码区密码子(codon)的频率,一阶和二阶马尔可夫链,ORF(Open Reading Frames),启动子(promoter)识别,HMM(Hidden Markov Model)和GENSCAN,Splice Alignment等等.
4, 分子进化和比较基因组学
分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树.既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似性.通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的.早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化的依据.近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化.在匹配不同种族的基因时,一般须处理三种情况:Orthologous: 不同种族,相同功能的基因;Paralogous: 相同种族,不同功能的基因;Xenologs: 有机体间采用其他方式传递的基因,如被病毒注入的基因.这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现.
5, 序列重叠群(Contigs)装配
根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,如人类基因的测量就采用了短枪(shortgun)方法,这就要求把大量的较短的序列全体构成了重叠群(Contigs).逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配.从算法层次来看,序列的重叠群是一个NP-完全问题.
6, 遗传密码的起源
通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今.不同于这种"冻结"理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密码.随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材.
7, 基于结构的药物设计
人类基因工程的目的之一是要了解人体内约10万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗.基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域.为了抑制某些酶或蛋白质的活性,在已知其蛋白质3级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物.这一领域目的是发现新的基因药物,有着巨大的经济效益.
8.生物系统的建模和仿真
随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究 热点-系统生物学。目前来看,其研究内容包括生物系统的模拟(Curr Opin Rheumatol,2007,463-70),系统稳定性分析(Nonlinear Dynamics Psychol Life Sci,2007,413-33),系统鲁棒性分析(Ernst Schering Res Found Workshop, 2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)为代表的建模语言在迅速发展之中,以布尔网络 (PLoS Comput Biol,2007,e163)、微分方程(Mol Biol Cell,2004,3841-62)、随机过程(Neural Comput,2007,3262-92)、离散动态事件系统等(Bioinformatics,2007,336-43)方法在系统分析中已经得到应 用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题(Anal Quant Cytol Histol,2007,296-308)。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨 识所需要的数据远远超过了目前数据的产出能力。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系 统建模主要困难。系统描述和建模方法也需要开创性的发展。
9.生物信息学技术方法的研究
生物信息学不仅仅是生物学知识的简单整理和、数学、物理学、信息科学等学科知识的简单应用。海量数据和复杂的背景导致机器学习、统 计数据分析和系统描述等方法需要在生物信息学所面临的背景之中迅速发展。巨大的计算量、复杂的噪声模式、海量的时变数据给传统的统计分析带来了巨大的困难, 需要像非参数统计(BMC Bioinformatics,2007,339)、聚类分析(Qual Life Res,2007,1655-63)等更加灵活的数据分析技术。高维数据的分析需要偏最小二乘(partial least squares,PLS)等特征空间的压缩技术。在计算机算法的开发中,需要充分考虑算法的时间和空间复杂度,使用并行计算、网格计算等技术来拓展算法的 可实现性。
10, 生物图像
没有血缘关系的人,为什么长得那么像呢?
外貌是像点组成的,像点愈重合两人长得愈像,那两个没有血缘关系的人像点为什么重合?
有什么生物学基础?基因是不是相似?我不知道,希望专家解答。
11, 其他
如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域;在学科方面,由生物信息学衍生的学科包括结构基因组学,功能基因组学,比较基因组学,蛋白质学,药物基因组学,中药基因组学,肿瘤基因组学,分子流行病学和环境基因组学,成为系统生物学的重要研究方法.从现在的发展不难看出,基因工程已经进入了后基因组时代.我们也有应对与生物信息学密切相关的如机器学习,和数学中可能存在的误导有一个清楚的认识.