生物信息学论文如何写

最好先阅读几篇相应文章和相今似的论文，比如你的课题是油菜，你可以搜有关其他物种如小麦的。根据论文写作步骤制定实验计划。要练习使用一些常用软件，如NCBI,GenBank,在用时最好先下载安装有道词典，因为是英文网站，不容易懂，专业名词也太多！不要怕，万事开头难！好好准备，入了门就好了！

生物论文的写作思路是什么？

一、生物学科研论文需要含有以下内容

（1）前言：阐述研究的目的，说明为什么做这个研究？

（2）材料与方法：细致表达怎么做这个研究？

（3）结果与分析：通过研究获得了哪些证据？这些证据说明了什么问题？

（4）讨论：通过研究得出了什么结论？结论有什么价值？

为了方便读者检索和阅读，科研论文还需要有合适的题目、作者、单位、摘要、关键词、参考文献等方面的内容。下面就各部分的写作方法和功能进行简要说明。二、题目

1、论文题目应以最恰当、最简明的词语反映论文最重要的特定内容。中文文题一般不超过20个汉字。尽可能不设副标题。文题用词应有助于选定关键词和编制题录、索引，不使用非公知公认的缩略语、字符、代号等。一般来说，标题是在论文完成之后，在统观全文的基础上提炼出来的。题目切忌太泛、太繁。

2、一般使用充分反映论文主要内容的词语，不使用具有主、谓、宾结构的完整语句，不用标点。

三、摘要

1、摘要是科研论文全文的缩写版，因此也应包含有文中的四个要素，即研究的目的、方法、结果和结论。摘要应具有独立性和自含性，是一篇完整的短文，可以独立使用和引用，读者不阅读全文就能获得必要的信息。摘要是在文章主体完成的基础上提炼而成。

2、中文摘要一般250~400字，中英文摘要的主要内容应一致。一般采用第三人称的写法，不列图表，不引用文献，不加评论和解释；应着重反映新内容和作者特别强调的观点，不必列出本学科已成为常识的内容。摘要中使用英文缩略语，应于首次使用时著名其中文全称；英文摘要中的缩略语，应于首次使用时将其英文全称注出。

3、摘要中各要素的写法：

（1）目的：简要说明研究的目的，表明研究的范围和重要性；

（2）方法：简要说明基本设计，使用的材料与方法，如何分组对照，研究范围及精确程度，如何经过统计学处理；

（3）结果：简要列出主要结果和数据，特别是新发现。叙述要具体、准确。给出具体的检验数值；

（4）结论：简要说明经验、论证取得的正确观点及其理论价值或应用价值。

初学写作的同学，建议先将目的、方法、结果和结论几个部分用提纲分别列出，待思路清晰、内容明确后，再重新组织语言用段落的形式表达。

四、关键词

论著一般要有3~5个关键词，应反映全文最主要的内容。中英文关键词要一致，均不用缩写。

五、前言

1、前言的主要表达内容是告诉读者为什么要选这个研究主题，并把研究的意义论述清楚。选题的理由有很多，包括研究对象的价值，所研究的对象存在什么问题没有解决，或者有什么问题值得去解决，别人对这个问题做了什么研究，还存在哪些需要进一步解决的问题，或者是所研究的问题能解决什么问题，包括方法、应用或理论等。

2、因此，在概述时就要包括以下内容：研究的背景、目的、研究思路、理论依据等，有的研究还应说明该研究开始的年月。

3、前言的写作要点时要注意阐述问题的逻辑性，将所要陈述的理由逐条提出，渐渐深入，充分向读者展示所选课题的必要性。

4、在表达方式上应开门见山，简要、清楚，不要涉及本研究中的数据或结论。未经检索，前言中不可写“国内未曾报道”等字样，也不可自我评价“达到XX水平”或“填补XX空白”等。比较短的论文可以只用小段文字起前言作用。

六、材料与方法

1、材料与方法部分要向读者介绍你是怎么对所选课题进行研究，包括怎样处理材料，用到了哪些实验方法，怎样对所获得的数据进行分析等。在这部分内容中要详细介绍研究材料（包括对照组）的选择、基本情况和来源。

2、对研究中所采用的方法及观察指标逐一介绍，属于创造的方法应详细叙述“方法”的细节，以备他人重复。改进的方法应详细叙述改进之处，并以引用文献的方式给出原方法的出处。完全使用他人方法，应以引用文献的方式给出方法的出处，说明统计方法及其选择的依据。不要描述使用方法的工作原理。材料与方法部分的写作要点是：表达细致、清晰，方法可靠。

七、结果与分析

1、结果与分析部分是呈现出通过研究获得的实验数据，并对这些数据进行分析说明，通过对数据进行推论得出结论。结果与分析是论文的核心部分，是一篇论文是否具有创新性和价值的具体体现。

2、在这部分，通过将研究过程中所得的各种资料和数据进行必要的统计学处理，然后用文字和图表加以表述，在进行分析和归纳，推论出相应的结论。结果的叙述要客观、真实和准确，简洁明了，重点突出，层次分明，不应与讨论内容混淆。

3、在写作时，切忌对所获得的未经统计处理的原始数据和盘托出，表达时要注意有一定的逻辑性，不要将各种数据杂乱无章地堆砌在一起。

八、讨论

1、讨论部分包含几个要素：本研究获得了什么结论，解决了什么问题，或者有什么创新性的发现。应着重讨论研究中的新发现及从中得出的结论，包括发现的意义及其限度，以及对进一步研究的启示。

2、若不能导出结论，也可进行必要的讨论，提出建议、设想、改进的意见或需要解决的问题。应将研究结果与其他有关的研究相联系，并将本研究的结论与目的相关联。写作时注意不要重述已在前言和结果中详述过的数据或资料，不要过多罗列文献，避免做不成熟的主观推断，最好留有余地。不要列入图表。

九、参考文献

1、标注参考文献可以反映论文的科学依据，体现尊重他人研究成果的态度，并向读者提供有关信息。参考文献必须是作者亲自阅读过的、主要的、发表于正式出版物上的原始文献。文内引用时，按文献出现的先后顺序用阿拉伯数字连续编码；图中引用时，按其在全文中出现的顺序编号，音问标注在图题或注释中；表中引用时，在表中依次标注。

2、文后参考文献的顺序按文中引用的顺序依次排列。外国人名姓在前，名缩写在后。中文刊名写全称，外文刊名采用美国国立医学图书馆编印的Index Medicus中列出的刊名缩写形式。

生物论文如何写

第一，先要有论点，提出。第二，用论据来阐述。第三，具体深入的说明。第四，总结全文，深化论点。

生物信息学毕业论文，如何选题？格式有要求吗

生物信息学推荐系统设计
关键词：推荐系统；生物信息学
推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一，它实现的是“信息找人，按需服务”；通过对用户信息需要、兴趣爱好和访问历史等的收集分析，建立用户模型，并将用户模型应用于网上信息的过滤和排序，从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科；其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展，在信息的数量和质量上都极大地丰富了生物科学的数据资源，而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们，基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织，但是用户无法从大量的生物数据中寻求自己感兴趣的部分（著名的生物信息学网站NCBI(美国国立生物技术信息中心)，仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种），因此在生物二次数据库上建立个性化推荐系统，能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下，生物信息学推荐系统将发挥强大的优势。
1推荐系统的工作流程
应用在不同领域的推荐系统，其体系结构也不完全相同。一般而言，推荐系统的工作流程[5]如图1所示。
(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等，所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6]，即显式获取(Explicit)和隐式获取(Implicit)，由于用户的很多行为都能暗示用户的喜好，因此隐式获取信息的准确性比显式高一些。
(2)信息处理。信息获取阶段所获得的用户信息，一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式，最常用的是用m×n维的用户—项目矩阵R来表示，矩阵中的每个元素Rij=第i个用户对第j个项目的评价，可以当做数值处理，矩阵R被称为用户—项目矩阵。
(3)个性化推荐。根据形成推荐的方法的不同可以分为三种，即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目，并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目，通过用户与近邻之间的“交流”，发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。
(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户，完成对用户的推荐。目前最常用的推荐可视化方法是Top－N列表[7]，按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。
2生物信息学推荐系统的设计
综合各种推荐技术的性能与优缺点，本文构造的生物信息学推荐系统的总体结构如图2所示。
生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时，所留下的登录信息通过网站传递到推荐算法部分；推荐算法根据该用户的用户名从数据库提取出推荐列表，并返回到网站的用户界面；用户访问的记录返回到数据库，系统定时调用推荐算法，对数据库中用户访问信息的数据进行分析计算，形成推荐列表。
本系统采用基于近邻的协同过滤推荐算法，其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分，两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大，使得系统的可扩展性降低。本系统采用SVD矩阵降维方法，减少用户—项目矩阵的维数，在计算用户相似度时大大降低了运算的次数，提高了推荐算法的效率。
(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单，以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后，系统会自动为该用户创建一个“信息矩阵”，该矩阵保存了所有项目的ID号以及相应的用户评价，保存的格式为：S+编号+用户评价，S用于标记项目，每个项目编号及其评价都以“S”相隔开；编号是唯一的，占5位；用户评价是用户点击该项目的次数，规定其范围是0~100，系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵，使用户信息矩阵数值化，假设系统中有M个用户和N个项目，信息处理的目的就是创建一个M×N的矩阵R，R[I][J]代表用户I对项目J的评价。
(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果，而且在系统较大的情况下，它既不能精确地产生推荐集，又忽视了数据之间潜在的关系，发现不了用户潜在的兴趣，而且庞大的矩阵增加了计算的复杂度，因此有必要对该矩阵的表述方式做优化，进行矩阵处理。维数简化是一种较好的方法，本文提出的算法应用单值分解(SingularValueDecomposition，SVD)技术[8]，对用户—项目矩阵进行维数简化。
(4)相似度计算。得到降维以后的用户矩阵US，就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10]，即基于中心的邻居(Center－BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法，直接找出与用户相似度最高的前N个用户作为邻居，邻居个数N由系统设定，比如规定N＝5。
(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中，而在前面的工作中已找出各用户的邻居以及与用户的相似度，推荐形成部分只需要对当前登录用户进行计算。推荐策略是：对当前用户已经访问过的项目不再进行推荐，推荐的范围是用户没有访问的项目，其目的是推荐用户潜在感兴趣的项目；考虑到系统的项目比较多，用户交互项目的数量很大，所以只筛选出推荐度最大的N个项目，形成Top－N推荐集，设定N＝5。
3生物信息学推荐系统的实现
生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息，用SQLServer2000实现。
数据访问层实现了与用户交互必需的存储过程以及触发器，也使用SQLServer2000，主要完成以下功能：初始化新用户信息矩阵；插入新项目时更新所有用户的信息矩阵；用户点击项目时更新该用户对项目的评价；删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程，在这里不做详细的介绍。
推荐算法完成整个个性化推荐的任务，用Java实现。(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接，在连接之前必须要下载三个与SQLServer连接相关的包，即msutil.jar、msbase.jar和mssqlserver.jar。
(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换，静态成员Con调用DataCon.getcon()获得数据库连接，然后对数据库进行各种操作。把所有方法编写成静态，便于推荐算法中不创建对象就可以直接调用。
(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类，RecmmendSource用于保存当前用户的推荐列表，包括推荐项目号和推荐度；CurrentUserNeighbor用于保存邻居信息，包括邻居ID号、相似度及其访问信息。
(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法，主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。
下面给出方法FCArithmetic的关键代码：
Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵
user_item=this.SVD_Calculate(user_item);//调用SVD降维方法
Vectorc_uservector=newVector();//当前用户向量
Vectoro_uservector=newVector();//其他用户向量
Vectorc_user_correlate_vector=newVector();
//当前用户与其他用户之间相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.获得当前用户向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.获得其他用户的向量
//3.计算当前用户与其他用户的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根据当前用户与其他用户的相似度，计算其邻居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根据邻居形成方法FCArithmetic，可以得到每个用户的邻居。作为测试用例，图6显示用户Jack与系统中一部分用户的相似度，可以看出它与自己的相似度必定最高；并且它与用户Sugx访问了相同的项目，它们之间的相似度也为1，具有极高的相似度。
4结束语
在传统推荐系统的基础上，结合当前生物信息学网站的特点，提出一个基于生物信息平台的推荐系统，解决了传统生物信息网站平台信息迷茫的缺点，为用户推荐其感兴趣物种的DNA或蛋白质序列。
优点在于协同过滤的推荐算法能发现用户潜在的兴趣，能促进生物学家之间的交流；推荐算法的邻居形成与推荐形成两部分可以单独运行，减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系，增加用户和项目数量，更好地发挥推荐系统的优势。
参考文献：
［1］PAULR，HALRV.Recommendersystems[J].CommunicationsoftheACM，1997,40(3):56－58.
[2]陈新.生物信息学简介[EB/OL].(2001).http://166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157－158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58－60.