楼主的问题问的太宽泛了。请问你是具体问题出在哪里呢?你可以利用Biomart这个工具(),找到种间的orthlogue关系以及各种类型的注释ID直接的对应关系。你也可以用ncbi里面的homologene数据库去找种间的同源序列.multiple alignment可以用clust W或者mega做。系统发育树可以用mega做。PHYLIP好像也可以。基因结构上可以做做gc含量,外显子大小,splicing,调控序列什么的蛋白结构预测软件很多,不过我没做过。ncbi有一个conserved domain 的数据库,你可以和他比较下,分析下结构域。表达情况。。。。你可以找找相关的EST(ncbi)或者array(。。这个不记得了,在ncbi上应该有别人的数据)的表达数据。
该分析工具的网址如下 FGENESH - HMM-based gene structure prediction
进入该网址之后,输入该基因的fasta序列,关于目标基因的fasta序列,fig.1即为所示,我们以小麦中的基因为例分析。
根据fig.2所示,将fasta序列输入进去,选择小麦(triticum aestivum),然后search。
图3展示了分析结果,可以看到我们这个序列比对到了正义链,因为我们用的例子是该基因的转录本,所以只包括黄色的部分,即CDSo序列,这也和我们使用的转录本相吻合。下面的是该基因对应的mRNA序列,同样也是1152bp,最下面的是将该mRNA翻译为蛋白质的序列。
同样选择好序列和物种,搜索,等待结果。
图5是分析结果,一共鉴定了10个基因,21个外显子,由于篇幅所限,我们只展示了前几个,但是统计的话,正好能对上数目。
图6是紧接上图的具体的序列分析,总共包含10个基因。
图8可以看到该基因在拟南芥中的同源基因,具体的生物学注释,就要看自己对这个基因的了解程度了。
1,去NCBI上进行Blast,如果与已知的基因相同,可以直接点开它的基因简介,一般都会有该基因的结构功能说明。
2,如果与已知的序列有差异,就可以上EXpasy进行在线预测