信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 2.1 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 2.2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。
我们对一个问题研究之后,如何将其展现于众人面前是一个重要的工作。在这里我们结合具体的事例,给大家介绍科研的一个重要部分枣论文的一般格式及其注意事项。当然,要写出一篇好的论文,绝不是单单这么一个简要的介绍就够了,还需自己多写、多练。
随着科学技术的发展,越来越多的学者涉及到学术论文的写作领域,那么怎样写学术论文、学术论文写作是怎样要求的、格式如何,下面就介绍一下学术论文的写作,希望能对您论文写作有所帮助。
(一)题名(Title,Topic)
1、论文格式的论文题目:(下附署名)要求准确、简练、醒目、新颖。
论文题目是一篇论文给出的涉及论文范围与水平的第一个重要信息,也是必须考虑到有助于选定关键词不达意和编制题录、索引等二次文献可以提供检索的特定实用信息。 论文题目十分重要,必须用心斟酌选定。有人描述其重要性,用了下面的一句话:论文题目是文章的一半。 对论文题目的要求是:准确得体;简短精炼;外延和内涵恰如其分;醒目。对这四方面的要求分述如下。
1.准确得体
要求论文题目能准确表达论文内容,恰当反映所研究的范围和深度。 常见毛病是:过于笼统,题不扣文。关键问题在于题目要紧扣论文内容,或论文内容民论文题目要互相匹配、紧扣,即题要扣文,文也要扣题。这是撰写论文的基本准则。
2.简短精炼
力求题目的字数要少,用词需要精选。至于多少字算是合乎要求,并无统一的硬性规定,一般希望一篇论文题目不要超出20个字,不过,不能由于一味追求字数少而影响题目对内容的恰当反映,在遇到两者确有矛盾时,宁可多用几个字也要力求表达明确。 若简短题名不足以显示论文内容或反映出属于系列研究的性质,则可利用正、副标题的方法解决,以加副标题来补充说明特定的实验材料,方法及内容等信息使标题成为既充实准确又不流于笼统和一般化。
3.外延和内涵要恰如其分
外延和内涵属于形式逻辑中的概念。所谓外延,是指一个概念所反映的每一个对象;而所谓内涵,则是指对每一个概念对象特有属性的反映。 命题时,若不考虑逻辑上有关外延和内涵的恰当运用,则有可能出现谬误,至少是不当。
4.醒目
论文题目虽然居于首先映入读者眼帘的醒目位置,但仍然存在题目是否醒目的问题,因为题目所用字句及其所表现的内容是否醒目,其产生的效果是相距甚远的。 有人对36种公开发行的医学科持期刊1987年发表的论文的部分标题,作过统计分析,从中筛选100条有错误的标题。在100条有错误的标题中,属于省略不当错误的占20%;属于介词使用不当错误的占12%)。在使用介词时产生的错误主要有:
①省略主语枣第一人称代词不达意后,没有使用介词结构,使辅助成分误为主语;
②需要使用介词时又没有使用;
③不需要使用介词结构时使用。属主事的错误的占11%;属于并列关系使用不当错误的占9%;属于用词不当、句子混乱错误的各占9%,其它类型的错误,如标题冗长、文题不符、重复、歧意等亦时有发生。
(二)作者姓名和单位(Author and department)
这一项属于论文署名问题。署名一是为了表明文责自负,二是记录作用的劳动成果,三是便于读者与作者的联系及文献检索(作者索引)。大致分为二种情形,即:单个作者论文和多作者论文。后者按署名顺序列为第一作者、第二作者厖。重要的是坚持实事求是的态度,对研究工作与论文撰写实际贡献最大的列为第一作者,贡献次之的,列为第二作者,余类推。注明作者所在单位同样是为了便于读者与作者的联系。
(三)摘要(Abstract)
论文一般应有摘要,有些为了国际交流,还有外文(多用英文)摘要。它是论文内容不加注释和评论的简短陈述。其他用是不阅读论文全文即能获得必要的信息。
摘要应包含以下内容:
①从事这一研究的目的和重要性;
②研究的主要内容,指明完成了哪些工作;
③获得的基本结论和研究成果,突出论文的新见解;
④结论或结果的意义。
论文摘要虽然要反映以上内容,但文字必须十分简炼,内容亦需充分概括,篇幅大小一般限制其字数不超过论文字数的5%。例如,对于6000字的一篇论文,其摘要一般不超出300字。
论文摘要不要列举例证,不讲研究过程,不用图表,不给化学结构式,也不要作自我评价。 撰写论文摘要的常见毛病,一是照搬论文正文中的小标题(目录)或论文结论部分的文字;二是内容不浓缩、不概括,文字篇幅过长。
(四)关键词(Key words)
关键词属于主题词中的一类。主题词除关键词外,还包含有单元词、标题词的叙词。
主题词是用来描述文献资料主题和给出检索文献资料的一种新型的情报检索语言词汇,正是由于它的出现和发展,才使得情报检索计算机化(计算机检索)成为可能。 主题词是指以概念的特性关系来区分事物,用自然语言来表达,并且具有组配功能,用以准确显示词与词之间的语义概念关系的动态性的词或词组。
关键词是标示文献关建主题内容,但未经规范处理的主题词。关键词是为了文献标引工作,从论文中选取出来,用以表示全文主要内容信息款目的单词或术语。一篇论文可选取3~8个词作为关键词。
关键词或主题词的一般选择方法是:
由作者在完成论文写作后,纵观全文,先出能表示论文主要内容的信息或词汇,这些住处或词江,可以从论文标题中去找和选,也可以从论文内容中去找和选。例如上例,关键词选用了6个,其中前三个就是从论文标题中选出的,而后三个却是从论文内容中选取出来的。后三个关键词的选取,补充了论文标题所未能表示出的主要内容信息,也提高了所涉及的概念深度。需要选出,与从标题中选出的关键词一道,组成该论文的关键词组。
关键词与主题词的运用,主要是为了适应计算机检索的需要,以及适应国际计算机联机检索的需要。一个刊物增加关键词这一项,就为该刊物提高引用率、增加知名度开辟了一个新的途径。
(五)引言(Intorduction)
引言又称前言,属于整篇论文的引论部分。其写作内容包括:研究的理由、目的、背景、前人的工作和知识空白,理论依据和实验基础,预期的结果及其在相关领域里的地位、作用和意义。
引言的文字不可冗长,内容选择不必过于分散、琐碎,措词要精炼,要吸引读者读下去。引言的篇幅大小,并无硬性的统一规定,需视整篇论文篇幅的大小及论文内容的需要来确定,长的可达700~800字或1000字左右,短的可不到100字。
(六)正文(Main body)
正文是一篇论文的本论,属于论文的主体,它占据论文的最大篇幅。论文所体现的创造性成果或新的研究结果,都将在这一部分得到充分的反映。因此,要求这一部分内容充实,论据充分、可靠,论证有力,主题明确。为了满足这一系列要求,同时也为了做到层次分明、脉络清晰,常常将正文部分人成几个大的段落。这些段落即所谓逻辑段,一个逻辑段可包含几个自然段。每一逻辑段落可冠以适当标题(分标题或小标题)。段落和划分,应视论文性质与内容而定。
编写要求
页面要求:毕业论文须用A4(210×297)标准、70克以上白纸,一律采用单面打印;毕业论文页边距按以下标准设置:上边距为30mm,下边距为25mm,左边距和右边距为25mm;装订线为10mm,页眉16mm,页脚15mm。
页眉:页眉从摘要页开始到论文最后一页,均需设置。页眉内容:浙江广播电视大学汉语言文学类本科毕业论文,居中,打印字号为5号宋体,页眉之下有一条下划线。
页脚:从论文主体部分(引言或绪论)开始,用阿拉伯数字连续编页,页码编写方法为:第×页共×页,居中,打印字号为小五号宋体。
前置部分从中文题名页起单独编页。
字体与间距:毕业论文字体为小四号宋体,字间距设置为标准字间距,行间距设置为固定值20磅。
浅论医学文献检索的发展
作者:林丹红,苏晓宇,林晓华
【关键词】 文献信息检索课;中医高等院校;中医教育
中医药文献信息检索课自1985年首批中医院校开课至今已25年,目前国内所有中医院校均已开设检索课,有了相应的统编教材和自编教材、教参和一支教师队伍,不少院校还成立了检索教研室。通过对这门课程的学习,增强了中医院校大学生的信息意识,使广大同学普遍掌握了文献检索最基本的方法和技能,为今后的临床和科研奠定了基础。
1医学文献索课程发展早在20世纪70年代,北京大学等已正式设立了《科技文献检索》课程,为国内文献检索教学拉开了序幕。《医学文献检索》课程早期仅在少数高校以选修课或讲座形式开展,但在1984年之后,在多方共同努力下,有了较快的发展。首先,国家教育部在1984和1985年分别颁布两个行政性文件,很大程度上促进了高校文献检索课程的发展。其次,1985年前后国家卫生部在四所医学高校设立了图书情报学系。医学文献检索课程成为此类专业的专业主干甚至核心课程,受到了前所未有的重视。最后,计算机技术和网络通信技术的发展,使文献检索教学有了飞跃式的发展。《医学文献检索》课程是一门工具课,一是文献检索的目的是为其他专业服务,通过检索文献为科研、教学或临床等提供医学信息:二是课程的主要内容是学会使用文献检索的工具书,以获得需要的文献信息。早期的文献检索是手工检索,以印刷版的工具书为检索对象,比如美国的《医学索引》、荷兰的《医学文摘》,虽然编排结构严谨,但使用依然不方便。
1 985年,赖茂生主编的《科技文献检索》教材中,认为计算机检索在我国已经成为现实,在某些章节中也穿插了少量计算机检索的内容,但该教材内容以检索理论为主,检索工具的介绍则以国外工具书为主…。随着社会信息化程度的提高,手工检索逐步向计算机检索过渡,特别是通信技术的发展和网络的普及,检索对象由单一的出版物变成了形式多样的网络信息,人们逐渐接受并认可信息检索这一概念。
2医学文献检索与医学信息检索概念使用现状2.1医学文献数据库文献分析通过检索中国生物医学文献数据库(CBM),对几个常用的概念(“文献检索”、 “信息检索”、“文献信息检索”、 “信息素养”或“信息素质”)使用频率做一比较,数据见表1,CBM数据库“文献检索”、 “信息检索”等文献数量表,时间截止到2012年12月18日。从表1可见,在医学科技文献中,使用“信息检索”概念始于1995年,使用“文献检索”概念的文献数量明显多于其他概念的使用,数据中不排除同一文献中出现两个以上概念。使用“文献检索”和“信息检索”概念的文献基本呈逐年递增趋势。
“信息检索”文献数量阶段性变化比较明显(将文献数量相近的连续年分为一个阶段),大致可分为四个阶段:1 995—1 998年,年均2.5篇;1 999—2000年,年均1 4篇;2001—2004年,年均37篇;2005—201 2年,年均57篇。而使用“文献检索”概念的文献数量虽然也处于增长态势,但变化趋势不明显,对照上述的四个阶段, “文献检索”概念的年均文献数量分别为,46篇、76篇、1 06.3篇、223篇。对万方医学网1998—2012年的文献分析,发现使用“文献检索”概念的文献数量(3453篇)明显多于使用“信息检索”概念的文献数量(907篇)(时间截止到20 1 2年1 2月1 8日),与CBM数据分析结果一致。
2.2课程名称分析关于课程名称,张妍妍于201 O年1月1 1日在中国期刊网数据库中分别以“文献检索课”、“信息检索课”和“文献信息检索课”为检索词,分别得到1580条、360条、17条结果比‘。在万方医学网期刊库(2000—2012年数据)中以“文献检索课”、 “信息检索课”为检索词,分别得到291条、62条数据。在CBM(2000—2012年数据)中以“文献检索课”、 “信息检索课”为检索词,分别得到282条、58条数据。可见教育界对“文献检索”的认可度仍高于“信息检索”。2.3教材或论著名称分析关于教材或论著名称,目前出版的检索类教材,信息检索的种类的数量已经远超过文献检索U1。通过检索南京图书馆(江苏省级图书馆)中文图书库,对“文献检索”、 “信息检索”、“文献信息检索”、 “信息素养”使用频率做一比较,发现虽然使用文献检索为书名的图书种类(213种)多于信息检索(204种)。但21 3种文献检索类图书中有1 14种是在1993年前出版的,其中包括一些翻译文献,及检索工具介绍等。1993—2012年,信息检索使用
写作中文献资料的检索论文
在学习和工作中,大家或多或少都会接触过论文吧,论文是讨论某种问题或研究某种问题的文章。相信写论文是一个让许多人都头痛的问题,下面是我为大家整理的写作中文献资料的检索论文,欢迎阅读,希望大家能够喜欢。
【摘要】
本文简要介绍了文献的概念及分类,按照纸质文献检索和电子文献检索对论文写作过程中如何检索文献进行了简单的论述。
【关键词】
文献 检索 方法 途径
自从有了文献便有了文献检索。当人们从中查找所需信息时,文献检索也就应运而生。只不过早期可检索的对象较少,因而检索是一个不自觉的过程。早期的文献检索主要是手工检索,人们通过“心想、手翻、眼看”的方式进行。随着社会的发展和文献量的增加,人们逐渐认识到文献检索的必要性与重要性,现代文献检索是以计算机网络技术和现代信息技术为基础,在文献检索的应用中逐渐发展起来。
一、文献检索概述
文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。
文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。根据载体把其分为印刷型、缩微型、机读型和声像型。根据不同出版形式及内容,可以分为:图书、连续性出版物、特种文献。
电子文献是以数字方式将图、文、声、像等信息储存在磁、光、电介质上,通过计算机、网络或相关设备使用的记录有知识内容或艺术内容的文献信息资源,包括电子书刊、数据库、电子公告等。
文献检索,就是从文献信息集合中找出所需要的文献的过程,相当于人们通常所说的资料查寻。
二、纸质文献的检索
纸质文献的检索一般分为两种:直接检索和间接检索。直接文献检索地目的是为了获取所需要的文献。因此,有时可以直接从报刊杂志中通过浏览的方法直接获得所需文献,称之为直接检索。它具有方便、快捷的特点,适于浏览新到的书刊资料,有时是一种获得最新情报的方法,但同时又受到各种限制而漏查很多相关文献。因此,它只能作为一种辅助性的检索方法。
间接文献检索是一个利用检索工具并从中查出特定文献的过程。这一过程就称为间接检索。它可以比较系统地、全面地获得相关课题的文献信息。我们需要掌握的就是这种利用检索工具的间接检索的方法。这也是文献检索的主要方式。它大体上可以分为以下五个步骤:
(一)分析研究课题,明确检索要求:弄清楚课题的'性质及学科专业范围是什么,所需的文献类型,要求的文种、年代的限定、课题的关键词等等是检索的第一步。
(二)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具或数据库。首先必须对各种检索工具所覆盖的学科范围有清楚的了解,然后从文献的类型、文种、出版的时间等方面来考虑选用哪种检索工具最合适。
(三)确定检索策略:选用具体的检索工具后,就要考虑选择和确定检索方法,确定具体的检索点,是从分类途径还是从主题途径检索,所查找的文献要达到什么要求,选用什么检索词等,以便具体进行检索。
(四)使用检索工具:确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代和文献范围内具体查找,以获得文献信息。手工检索时可以一边检索一边分析取舍,获得符合需要的文献。
(五)获取原文:检索文献最终要获取原文,如果在馆藏文献中查不到,则可通过各类联合目录获得其他单位收藏的信息,再通过馆际互借等途径或方式获取原文。这样就完成了文献检索的全过程。
文献检索方法主要有三种:
(一)追溯法(亦称滚雪球法):利用著者发表的文献后所列的参考文献为线索,由近及远,进行逐一追踪的查找办法,追查原文,再从这些原文后所附的参考文献逐一检索,象滚雪球似的获得一批批相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。
(二)常用法:常用法也称工具法,就是直接利用各种文献检索工具查找文献的方法。由于检索工具的种类繁多,一般应根据课题内容特点,首先利用综合性的检索工具,然后再使用专业性的检索工具,二者结合,才不致造成文献资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。
(三)循环法:循环法也称分段法、交替法或综合法,这是追溯法和常用法的结合。是将追溯法和常用法结合起来交替使用,充分发挥二者的优势分期、分段地交替使用,直到获得满意的相关文献为止。实际课题的检索选用何种方法,要根据具体情况而定:一是根据课题研究的需要;二是视所能利用的检索工具和检索手段。在检索工具比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下可利用追溯法获得相关性较强的文献;获悉研究课题出版文献较多的年代可利用抽查法。
三、电子文献的检索
随着计算机、数据库和互联网络技术的普及,电子化图书馆、文献资料网络化服务等正成为我们获取文献资料的必不可少的手段,是我们学习、工作和科研的有力助手。利用好电子文献和检索工具,掌握好网络信息的搜索方法和策略对于获取信息是必要的。
传统的图书检索手段和方法对电子信息的检索作用有限。现代文献信息均能以数字化的形式获得,如电子图书、电子期刊、学位论文、会议论文、专利文献、标准文献、声像资料、多媒体资料等。电子文献的检索途径主要有以下几种:
(一)网络目录和搜索引擎
各种各样的Internet网络文献检索工具不计其数,根据提供检索与否,有网络目录和搜索引擎之分。
网络目录是按主题的等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。
搜索引擎则强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。各种资源进行标引,并为检索者提供检索的工具。基于搜索引擎的检索方法接近于通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获取检索结果,并输出给用户。
(二)联机馆藏目录
网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供的公共联机检索(OPAC)馆藏书目、地区或行业的图书馆的联合目录等。
中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、出版者、关键词、标准书刊号、分类号、出版地、出版国等10个检索途径。全国高等教育文献保障体系(CALIS)提供61所高校的馆藏期刊、书目和学位论文联合查询。
(三)网络数据库
网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。
非商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供美国专利的免费检索,用户可检索到1971年以来的美国专利说明书的内容,包括专利书目信息和专利项,浏览1974年以来的专利文献。
(四)电子出版物
由于网上信息传播速度快,越来越多的出版商注重网上报刊发行。目前国内外已有很多出版高和信息服务中介商介入电子出版行业。电子出版物有电子图书、电子期刊和电子报纸。
(五)参考工具书
网络中许多参考资料是可以免费使用的,如新格罗夫音乐与音乐家大词典、英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料等大型工具书已加入因特网。
文献检索和使用的工作贯穿了论文写作的全过程:我们往往是先确定写作的大致内容;其次根据这个大致内容确定文献搜集的范围;然后阅读了主要的文献后再确定研究写作的具体内容;最后根据具体内容全面检索原始文献,搜得的文献又充实了论文写作的基础。