首页

> 学术期刊知识库

首页 学术期刊知识库 问题

信息检索学术论文摘要

发布时间:

信息检索学术论文摘要

信息检索是学习如何通过网络来找到你想要的。如文献检索一般都在“万方数据库”、“CNKI数据库”、“国家知识产权局”等各个网站搜索,要想知道有关检索的一些问题,你可以看看这个网站作为参考。

1、信息素养或素质的具体内容要求又哪些?信息素质是指用户在利用以计算机机器网络技术为代表现代科学技术进行知识学习、成长的过程中,逐渐形成的主动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。信息素质是一个内涵机器广泛的综合行概念,包括强雷的信息意识、系统化的信息理念、综合信息能力等内容。1)信息素质的体系结构一般来讲,信息素质的体系结构由信息意识、信息知识、信息能力三个方面组成。2、信息、知识、情报、文献的概念?(1)信息:信息与现代科学技术息息相关,是当代科学技术发展的产物,从某种程度上说,信息体现为一种载体,承载知识内容。20世纪90年代后一些关于信息的经典定义:1)信息是人们根据一定的目的和需要,把自然现象和社会现象中搜集的院士材料进行加工、处理,找出其中关系二形成的对象实体。2)信息是有一定含义的、经过加工处理的、对决策有价值的数据,即信息=数据+处理。(2)知识:是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的以求经验的总和。(3)情报:在关于情报要领的讨论中,所提出的情报定义大都与信息知识有关。如情报是“被人们所利用的信息”、“被人们感受并可交流的信息”;情报是“为了解决一个特定问题所需要的知识”、“借助语言、符号在载体上传递的知识”等。显然,对情报概念的定义分成两派——“信息派”和“知识派”。(4)文献:一是《文献情报术语国际标准(草案)》(ISO/DIS5127)定义:为了吧人类知识传播开来和继承下去,人们用文字、图形、符号、音频和视频等手段将其记录下来,或写在纸上,或洒在蓝图上,或摄制在感光片上,或录到唱片上,或存在磁盘上,这种附着在各种载体上的记录统称为文献。一是《中华人民共和国国家标准•文献著录总则》()的定义:文献是记录有知识的以求载体。3、信息、信息资源有哪些类型?(1)信息:(2)信息资源:信息源、信息服务、信息系统4、文献有哪些类型?将文献分成这些类型的依据是什么?(1)根据载体材料、存储技术和传递方式划分:印刷型、缩微型、视听型和嫉妒型(2)根据加工程度的不同划分:一次文献信息源、二次文献信息源、三次文献信息源(3)根据文献信息源的内容形式划分:图书、期刊、报纸、科技报告、政府出版物、会议文献、专利文献、学位论文、标准文献、档案文献、产品样本5、数据库的类型?网络资源有哪些特点?数据库的类型:网络资源特点:数量庞大、增长迅速;内容丰富、形式多样;变化频繁、价值不一;结构复杂、分布广泛;信息分散、无序等。6、何为“核心期刊”?本专业的核心期刊有哪些?(1)核心期刊:在某一学科中 ,少数期刊覆盖了该学科的大部分文献 ,而多数期刊仅包含该学科的少量文献 ,这少数期刊就是该学科的核心期刊。(2)本专业的核心期刊:《机械工程学报》《中国机械工程》《摩擦学学报》《机械科学与技术》《机械设计》《仪器仪表学报》《计算机集成制造系统》《润滑与密封》《机械传动》《机床与液压》《工程机械》《机械设计与研究》《起重运输机械》《轴承》《流体机械》《光学精密工程》《制造业自动化》《机械设计与制造》《水泵技术》《液压与气动》《制造技术与机床》《仪表技术与传感器》《压力容器》等7、什么是信息检索?信息检索的类型有哪些?信息检索:是通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。信息检索的类型:文献检索、数据检索、事实检索、手工信息检索、脱机信息检索、联机信息检索、光盘信息检索、网络信息检索8、简述信息检索的原理?是根据读者需求,确定检索概念及其范围,然后选择一定的检索语言,并将此检索概念转换成检索特征标志后到检索系统中查找文献线索,最后对其进行逐篇筛选,以确定需要阅读的文献。即检索指提供一定的检索手段,按照一定的检索方法,根据读者需要,迅速全面地查出文献线索,这是文献检索输出的过程,可见存贮是检索的基础,检索是存贮的目的。9、什么是计算机信息检索系统,它由哪几个部分组成?计算机信息检索系统是信息检索所用的硬件资源、系统软件和检索软件的总合。组成部分:硬件、软件、数据库10、计算机检索技术有哪些?计算机检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息二而采用的技术,11、从外表特征与内容特征来看,检索语言的类型各有哪些?不同特征各举一简单的检索式。外部特征:题名、著者姓名/单位名称、出版事项、代码/序号等。如《围城》内部特征:分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。如关键词:机械12、为什么要创建“检索语言”,它有哪些类型?比较分类语言和主题语言的优缺点。①原因:创建“检索语言”后检索会更加方便快捷。②类型:外部特征、内部特征③分类语言具有单维性特点,适用于按学科体系进行族性检索,但不适用于多维性的、按专题概念进行的特性检索。主题语言,不论是叙词法还是标题法,具有直接性、专指性、灵活性等优点,克服了体系分类法只能从一种概念为中心检索文献的缺点,但缺乏族性检索能力又成了它的缺点。13、信息(文献)检索的方法与途径,详细论述检索步骤?信息(文献)检索的方法:⑴ 常用法:是指在文献检索中经常使用的方法,可细分为:顺查法--是以检索课时的起始年代为起点,按时间顺序由远及近地查找,直到查得的文献信息可以满足要求为止,这种方法系统、全面、可靠。 倒查法--是一种由近及远地查找文献的方法一般用于新开课题,比较注意近期的文献,以便掌握最近一段时间该课题所达到的水平及研究和动向。抽查法--是针对学科发展特点,抽出其发展迅速、发表文献较多的一段时期,逐年进行检索的一种方法,能以较少的时间获得较多的文献。⑵ 追溯法:这是利用已有的文献后面的参考文献进行追溯查找的方法这是在没有检索工具或检索工具不全的情况下使用的一种方法,但这种方法查找的文献不全,目前已很少有人使用。⑶ 分段法:这是将常用法与追溯法交替使用的一种方法即利用工具书检索文献,又利用文献后面的参考文献进行追溯,两种方法交替使用,直到满足读者需要为止。这种方法可根据文献和本单位工具书收藏的情况分期分段交叉运用不同的查找方法,既能获得一定时期内的文献,还可节约查找时间。信息(文献)检索的途径:文献信息检索有两种不同的检索途径。根据文献的特征检索文献信息是最简捷的途径。其特征有两个:一是文献的外表特征,即“著者、书名、刊名、号码”等;二是内容特征,即“分类、主题、关键词”等。文献检索的步骤:人们的检索课题和需要虽各不相同,但为了达到检索目的,都要利用一定的检索工具按照一定的途径与方法才能把需要的文献检索出来。一般而言,要经过以下几个步骤: 分析研究课题→明确检索目的和要求→选择检索工具和检索方法→选择检索途径和检索标志→查找文献线索→整理检索结果→索取原文。14、什么是文献线索?列举五种以上不同文献类型(期刊论文、会议论文、图书、标准等)的线索。文献线索:文献检索的概念有狭义和广义之分。狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。这里的文献集合,不是通常所指的文献本身,而是关于文献的信息或文献的线索。如果真正要获取文献中所记录的信息,那么还要依据检索所取得的文献线索索取原文。广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。15、简述“超星电子图书馆”、“书生之家数学图书馆”、“中国学术期刊全文数据库”、“维普中文科技期刊数据库”和“万方数字化期刊”收藏资源的特点。超星电子图书馆:内容丰富,包括经典理论、哲学、社科、经济、语言文字、文学、数理化、生物、工业技术、计算机等五十余个学科分类,现拥有中文电子图书80万种,论文300万篇,全文总量4亿余页,并且每天仍在不断的增加与更新。书生之家数学图书馆:是一个基于互联网的全球性中文书刊网上开架交易平台,下设中华图书网、中华期刊网、中华报纸网、中华CD网等子网,集成了图书、期刊、报纸、论文、CD等各种出版物的书目信息、内容提要、精彩篇章、全文等内容,是著书、出书、售书、购书、读书、评书的网上交流园地。中国学术期刊全文数据库:中国期刊全文数据库(SupFree5CJFD)SupFree6是以中国学术期刊电子杂志社编辑出版的《中国学术期刊(光盘版)》全文数据库为核心,SupFree0目前已收录94年以来5300种期刊的全文文献,SupFree0读者可以利用任何一台校园网终端检索、SupFree3浏览、SupFree3下载和打印文摘索引和全文信息。SupFree1维普中文科技期刊数据库:全文版:从1989年至今的8000余种期刊刊载的1370余万篇文献,并以每年150万篇的速度递增。涵盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的8000余种中文期刊数据资源。引文版:从1989年至今公开出版的5000余种科技类期刊(其中包括《中文核心期刊要目总览》中的核心期刊1500余种),总数据量约224万篇文献。全面覆盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等信息资源。文摘版:从1989年至今的8000余种期刊的980余万篇文献,并以每年150万篇的速度递增。全面覆盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等信息资源。万方数字化期刊:目前集纳了理、工、农、医、人文五大类70多个类目的2500多种科技类核心期刊,实现全文上网。从2001年底开始,数据化期刊已囊括我国所有科技核心期刊,成为中国网上期刊的第一大门户。主要包括:中国医学会系列杂志、大学学报、中国科学系列杂志、科学普及期刊。该系统收录的期刊种类主要有7个:基础科学、农业科学、社会科学、哲学政法、医药卫生、教育文艺、经济财政。到2006年5月15日为止,共收录期刊数为5065种。浏览全文前需要下载PDF全文阅览器。该浏览器可在万方数据资源系统的数字化期刊子系统中下载。下载PDF全文阅览器前计算机中应安装有压缩软件。16、结合“中国学术期刊全文数据库”、“维普中文科技期刊数据库”两种数据库,谈各自的“高级检索”的方法。中国学术期刊全文数据库:维普中文科技期刊数据库:17、简述特种文献的特点和作用,学位论文的结构。特点:专利文献是重要的技术信息源;特种文献是重要的法律信息源;专利文献是重要的经济信息源。作用:特种文献不论从数量和质量上,都堪称最重要的特种信息源。它具有三大重要作用:一、专利文献是重要的技术信息源;二、特种文献是重要的法律信息源;三、专利文献是重要的经济信息源。结构:学术论文的结构:目录、序言、导论、本论、结论、参考文献目录、后记。18、按级别分的标准的类型?我国标准分为那些级别?分别用哪些符号表示?按级别分的标准的类型:国家标准、区域标准、国家标准、行业标准、地方标准、企业标准。我国标准级别与符号:级别 符号国家标准 如GB7718—94强制性国家标准 如GB/T3860—95推荐性标准 如GB/*1645—9819、专利的新颖性、创造性和实用性各自含义,中国保护的专利类型?新颖性:是指在申请日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国家知识产权局提出过申请并且记载在申请日以后公布的专利申请文件中。创造性:是指同申请日以前已有的技术相比,该发明有突出的实质性特点和显著的进步,该实用新型有实质性特点和进步。实用性:是指该发明或者实用新型能够制造或者使用,并且能够产生积极效果。20、中国何时实施专利法?中国专利法对专利采用怎样的审批程序?受中国专利法保护的对象分别有哪些?时间:《中国人民共和国专利法》1984年3月12日第六届全国人民代表大会常务委员会第四次会议通过程序:申请专利的发明涉及新的生物材料,该生物材料公众不能得到,并且对该生物材料的说明不足以使所属领域的技术人员实施其发明的,除应当符合专利法和本细则的有关规定外,申请人还应当办理下列手续:(一)在申请日前或者最迟在申请日(有优先权的,指优先权日),将该生物材料的样品提交国务院专利行政部门认可的保藏单位保藏,并在申请时或者最迟自申请日起4个月内提交保藏单位出具的保藏证明和存活证明;期满未提交证明的,该样品视为未提交保藏;(二)在申请文件中,提供有关该生物材料特征的资料;(三)涉及生物材料样品保藏的专利申请应当在请求书和说明书中写明该生物材料的分类命名(注明拉丁文名称)、保藏该生物材料样品的单位名称、地址、保藏日期和保藏编号;申请时未写明的,应当自申请日起4个月内补正;期满未补正的,视为未提交保藏。保护对象: 一、专利权人二、专利法的客体(一)发明专利 1.产品发明专利2.方法发明专利(二)实用新型专利(三)外观设计专利21、中国专利文献的编号提心含有几种专利文献号?如何称谓?22、专利文献的特点、专利说明书的结构。特点:1)数量巨大、内容广博。(2)集技术、法律、经济信息于一体。专利文献记载技术解决方案,确定专利权保护范围,披露专利权人、注册证书所有人权利变更等法律信息。同时,依据专利申请、授权的地域分布,可分析专利技术销售规模、潜在市场、经济效益及国际间的竞争范围。是一种独一无二的综合科技信息源。(3)反映新的科技信息。首先,大多数国家专利局采用先申请制原则,致使申请人在发明完成之后尽早提交申请,以防他人捷足先登。其次,由于新颖性是专利性的首要条件,因此,发明创造多以专利文献而非其他科技文献形式公布与众。第三,20世纪70年代初专利申请早期公开制度的推行,更加速了科技信息向社会的传播速度。(4)格式统一、形式规范。结构:一、现将本文书的制作要点介绍如下: 1.说明书中对发明或者实用新型内容的描述务必做到清楚、完整。2.写作应符合注意事项中所列各项要求。二、格式:说 明 书注意事项一、申请发明或实用新型专利必须提交说明书,一式两份怔、副本各一份)。二、说明书应当打字或者印刷,字迹整齐清晰、黑色,符合制版要求,字高在厘米至厘米之间,行距在厘米至厘米之间。说明书首页用此页,续页可用同样大小和质量相当的白纸续写。纸张纵向使用,只限使用正面,四周须留有空白:左侧和顶部各厘米,右侧和底部各厘米。三、邮寄申请文件不得折叠。四、发明或者实用新型专利中请的说明书,除发明或者实用新型的性质需用其他方式和顺序说明的以外,应持下列顺序撰写:1.发明或者实用新别名称,该名称应与请求书中的名称一致;2.发明或者实用新型所属技术领域;3.就申请人所知,写明对发明或者实用新型的理解、检索、审查有参考作用的现有技术,并且引证反映该项技术的文件;4.发明或者实用新型的目的;5.清楚、完整地写明发明或者实用新型的内容,以所属技术领域的普通技术人员能够实现为准;6.发明或者实用新型与现有技术相比所具有的优点或者积极效果;7.如有附图,应当有图面说明;8.详细描述中请人认为实现发明或者实用新型的最好方式,有附图的应当+照附图。发明或者实用新型可以有化学式或数学式,但不得有商业性宣传用语。五、发明或者实用新型名称居中。名称与正文之间空一行。23、专利文献的分类方法,分类号的结构组成,专利检索的目的。24、国际上主要国家和国际组织的专利“国别代码”。25、简述“中国学位论文数据库”、“中国标准文献数据库”的使用方法。26、什么是科技报告?它有那些类型?用哪些检索工具查找我国的科技报告?27、什么是会议文献?若查找国外各种学术会议的信息,利用哪些检索工具?28、简述我校图书馆引进或购置的外文数据库的类型机器收录特点。29、Springerlink提供的个性化服务包括哪些?读者在使用个性化服务前需要什么操作程序?30、Springerlink主页面默认为简单检索页面。请用简单检索功能查找“计算机优化”方面近2年内的文献2条。31、Springerlink系统可以对于符合预期的检索结果进行标记。标记过的记录,可以暂时保存在系统中,可以通过个性化服务功能,进行永久保存。写出检索结果的几种输出方式。32、EBSCO提供的个性化服务包括哪些?读者在使用个性化服务前需要什么操作程序?33、网络资源的特点与种类;搜索引擎的功能。34、队百度、中文搜狐、北大天网、一搜四种搜索引擎的功能进行比较。35、文献信息的先进性、可靠性、适用性判断方法。36、查阅有关文献,写出“标准文献、专利文献、学位论文研究报告”作为参考文献时的标注格式。37、学术论文一般由哪几部分构成?各部分的写作规范分别是什么?学术论文的结构:目录、序言、导论、本论、结论、参考文献目录、后记下面对各部分作简要说明:(一)导论导论起什么作用?导论的作用在于引起读者的阅读兴趣。读者拿到一篇学术论文,通常好多万字、二三十万字,是否值得花费宝贵的时间,光看题目还难以判断,总是首先读导论,希望从导论的内容判断本文是否有阅读价值,是否值得花费时间阅读。导论的内容,通常是交待课题,本文究竟要研究一个什么课题,这个课题的产生背景,说明作者为什么要研究这个课题,它有什么理论意义和现实意义。如果是博士论文,通常还要交待所采用的研究方法,交待论文的大体结构。(二) 结论 学术论文应当有结论,是学术研究的规律性决定的。学术研究是一个过程,有其始端和终端。导论是始端,结论是终端。结论表明一项科学研究的结束。同时,一项研究当有其研究结果。最终得到一个什么研究结果,应当在结论部分作出概括。如果还有遗留问题没有解决,也应在结论部分指出。 从学位论文答辩的角度讲,论文要经专家鉴定,写出评语。答辩委员会成员也要审读论文,写出评语。考虑到一篇博士学位论文通常二十多万字,甚至三十多万字,专家教授通常不可能一口气读完。总是读几页,放下了,又读几页,有什么事情又放下了。经过好多次才断续读完,读到末尾,前面的内容已经模糊、记不清了。不可否认,有的评定人因时间关系不可能读完全文,阅读了导论部分,翻阅、选读几个章节,然后就写评语。如果有一个结论,概括本文的研究结果、作者的基本学术见解、本研究结果的理论意义和实践价值,对于审定人作出总的评价有莫大的帮助。这对于论文最后能否通过答辩,有极重大的意义。切不可掉以轻心!(三) 本论本论是一篇学位论文的本质部分,没有本论就不成其为一篇论文。就象没有头和躯干不能成其为人一样。本论的内容是研究过程的反映,应当写什么,自然不用我在这里说。这里只是介绍本论部分的结构安排。评价一篇论文的结构是否合理,主要是针对本论部分的结构是否合理。

一、什么是论文的摘要?

简单的来讲,论文摘要就是整篇文章和浓缩预览,它被排放在论文的首要位置。论文摘要是文章的灵魂,很多老师审稿时没有时间查看论文正文内容,往往是通过文章的摘要了解论文的研究内容及研究层次,因此,写好论文摘要无比重要。

二、什么是论文的关键词?

关键词是反映论文主题概念的词、词组或术语。对文献检索开发利用有着重要的作用。是随着计算机的出现,为适应引编制自动化的需要而产生的一种主题检索类型。是指那些出现在文献的标题以及摘要、正文中,对表达文献主题内容实质意义的,未经规范化处理的自然语言词汇,在作文献索引和检索时能反映文章内容信息的单词或术语,既反映文章主题的关键词汇。要求每个关键词与论文主题概念直接相对应,即有专指性。一组关键词要能反映单元主题和多元主题,能反映文章的专业主题和相关主题,即有全面性。关键词对揭示和描述文献主题内容来说是非常重要的。(本回答由学术堂整理提供)

摘要是大致描述你在这篇论文中要表达的内容,通常100-150字左右关键词是文中提到较多的比较重要的4-5个词语

信息检索技术论文

计算机检索、网络文献检索将成为信息检索的主流。网络信息检索,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。信息检索的对象包括:文献检索(Document Retrieval),是以文献(包括题录、文摘和全文)为检索对象的检索,可分为全文检索和书目检索两种;数据检索(Data Retrieval)是以数值或数据(包括数据、图表、公式等)为对象的检索; 事实检索 (Fact Retrieval)是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。 1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢? 1.基于网页的网络信息检索工具的现状和发展趋势现状。网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

四、智能检索智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。五、计算机信息检索随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时睛报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。DiMog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。在单语言检索中,计算机检索系统利用网络蜘蛛进行网络信息的收集,然后利用自动标引技术对搜集的信息进行标引形成索引信息库。用户输入检索式后,计算机把检索式与数据库中索引项进行匹配,按索引式与标引项相关性大小降序输出检索结果。跨语言检索中,只要在检索过程中加入语言处理技术,就可以使一种语言与其他语言对应。信息检索是经济生活和科学研究的一个重要组成部分,尤其在今天这个飞速发展的信息时代,如何广泛、快速、准确地获取对自己有价值的信息,特别是如何借助电子化、网络化的手段去获取有价值的信息,直接影响到教学、科研等工作的成败。因此信息检索的方法和技能,越来越成为现代科技工作者和教师所必备的基本技能。目前,计算机信息检索已成为广大用户获取信息的主要方式,而且呈现出联机信息检索、光盘信息检索以及因特网信息检索多元并存的信息检索格局。如何快速、准确及有效地检索到所需信息,已成为日益突出的问题,那么,了解各信息检索系统的特点是实施信息检索最基本的前提。下面就其三种计算机信息检索系统作一介绍。1.联机信息检索系统。所谓联机信息检索,是指信息用户利用终端设备,通过国际通讯网络与世界上的信息检索系统,进行直接的人机对话,从检索系统的数据库中查找出用户所需信息的全过程。一个联机信息检索系统,通常由检索服务机构、国际通讯网络和终端组成。2.光盘信息检索系统。光盘信息检索系统是单机信息检索系统的一种,它解决了单机检索系统数据存储量少的缺点,是目前应用较为广泛的一种计算机信息检索系统。在信息检索领域应用的光盘主要是只读光盘。3.因特网信息检索。作为用户最多、影响最大的计算机网络,因特网堪称世界上资源最丰富的信息库和文档资料库,几乎能满足全球范围内对任何信息的需求。因特网信息检索系统一般由计算机服务器、通信网络、通信协议。网络信息检索服务器、用户终端等构成。六、网络信息检索网络信息检索简单地10说就是网络环境下的信息检索。它与传统信息环境下的检索有很大的不同,网络信息检索具有多样性、灵活性也超出了传统的信息检索。原来传统途径可获得的信息,现在几乎全部可以通过网络检索得到,而且更快、更新、更准确。随着计算机、多媒体和现代通讯技术的飞速发展,以印刷型文献为主的学校图书馆开始向以电子信息和虚拟信息为主的数字图书馆转化,Internet创造了丰富和多元化的学习资源,实现了资源共享。随着学习社会化、终身学习体系的诞生和进一步推进,网络在中小学教育中的应用也日益广泛和深入起来。Internet为我们带来了丰富的学校综合教育信息资源,它是提供Internet上的可用于学校综合教育过程的,在学校教育系统中传递的信息。近几年,Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。信息内容涉及广泛,几乎包括工农业生产、科技、教育、文化艺术、商业、资讯、娱乐休闲等诸多方面。在Intemet上,购物、在线教育、在线股市、远程医疗、点播电影、网络会议、网络展览都已变成现实,成为人类技术和文明的巨大财富,是全球取之不尽,用之不竭的信息资源基地。丰富信息资源带到人们面前的同时,也带来了问题:人们在蕴含丰富的信息面前无所适从,在浩如烟海的信息海洋中迅速、准确获取自己最需要的信息,变得十分困难。因此,20世纪90年代中期出现了检索万维网信息资源的搜索引擎技术。万维网是目前因特网上最受欢迎的检索服务系统,它利用超链接技术将全球的信息资源连接起来,用户通过浏览器就可以实现对网站页面的访问。21世纪是一个高度信息化的社会,信息就是商品、信息就是财富、信息就是资源、信息就是机会,因此人人都渴望及时获得有用的信息。如果说搜集信息是人类赖以生存、发展的一种本能,那么信息检索则是每个大学生和科研人员必须具备的一种基本技能。在计算机、网络通信技术日新月异,互联网遍及世界各个角落的今天,我们正身置于广袤无垠的信息海洋中。面对这样一个新知识、新技术不断涌现、知识新陈代谢频繁的世界,想要一劳永逸地获取知识是不可能的。我们只有终身学习,不断地获取、更新知识,才能不被社会所淘汰。要有效、快速地获取和利用最新信息,就必须掌握信息检索的技能。大学生在校求学期间所获得的不应该仅仅是“黄金”,更重要的是应获得“点金术”,其中之一就是信息检索的能力。通过检索和利用各种信息,不仅可以深化所学的知识;而且可以开阔视野,拓宽知识面;也为自学前人的知识、不断更新知识以及从事科学研究和发明创造奠定基础。

“信息资源共享”课程检索报告一 检索课题数字图书馆个性化服务研究现状二 主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取所需资源的可能性则越来越少, 用户需求的专业化、垂直化激化了数字图书馆大量信息数据库与用户需求之间的矛盾。1999 年, 美国图书馆与信息技术联合会(LITA) 10 位著名的数字图书馆专家在研讨会上, 把个性化定制服务列为数字图书馆发展的7 大趋势之首。目前, 数字图书馆个性化的信息服务已经开始得到普遍的关注, 人们正在为提供个性化信息服务做出努力的尝试。数字图书馆个性化服务是近几年数字图书馆研究中受到关注较多的一个研究方向,数字图书馆个性化服务是基于信息用户的信息使用行为,习惯,偏好,特点及用户特定的需求,来向用户提供满足其个性化需求的信息内容和系统功能的一种服务。关于数字图书馆个性化服务研究现状,该主题涉及到:(1)数字图书馆个性化服务的有哪些介绍(2)数字图书馆个性化服务的模式有什么(3)数字图书馆个性化服务的技术研究有哪些(4)数字图书馆个性化服务研究的最新进展(2005年-2007年)三 检索情况(一)检索工具1.维普中文期刊数据库 (1989-2007)2.中国期刊全文数据库 (1994-2007)(二)检索过程1.检索途径 关键词 题名 主题词2.检索用词 数字图书馆 关键词或题名、主题词 个性化服务 关键词或题名、主题词3.检索策略(1)维普中文期刊数据库(题名或关键词=数字图书馆)*(题名或关键词=个性化服务) 在高级检索中选择题名或关键词字段,输入“数字图书馆”和“个性化服务”两个检索词进行限定,年代限定在2005-2007年,共检索出78条记录。(2)中国期刊全文数据库(题名或关键词=数字图书馆)* (题名或关键词=数字图书馆)在高级检索中选择篇名字段,输入“数字图书馆”与“个性化服务”,年代限定在2005-2007,共检出89条记录。四 检索结果分析(一) 检索结果经检索上述两个数据库,有关数字图书馆个性化服务的研究论文众多,现选出其中具有代表性,研究主题未重复的文献。1.中国期刊全文数据库(1) 数字图书馆个性化信息服务系统研究 刘燕平 图书情报工作 2006/S2(2) 数字图书馆个性化服务系统分类体系问题 叶红 科技信息(学术研究) 2007年13期(3) 浅析智能搜索引擎技术及其在数字图书馆个性化信息服务中的应用 王林廷 高校图书情报论坛 2006年01期(4)数据挖掘技术在数字图书馆个性化服务中的应用 朱冰冰 科技情报开发与经济 2006年24期(5)数字图书馆个性化信息服务发展研究 马维华 郑州大学学报(哲学社会科学版) 2006年06期(6) 智能推送技术在数字图书馆个性化服务中的应用 石岩 情报探索 2006年11期(7) 基于文本过滤的数字图书馆个性化服务技术 张帆 计算机工程与应用 2006年31期(8) 数字图书馆信息门户的个性化服务模式 何平 中国信息导报 2006年08期(9) 网络信息技术下的数字图书馆个性化服务 张丹 林区教学 2006年07期(10)MyLibrary——数字图书馆个性化服务新趋势 杨华 农业图书情报学刊 2006年08期(11)基于Web服务组合的数字图书馆个性化动态定制服务构建 张晓青 情报学报 2006年03期(12)校园网中数字化图书馆个性化服务的实现 朱江峰 科技经济市场 2006年01期(13)数字图书馆的个性化推送服务 白雪松 图书馆杂志 2005年09期(14)Web日志挖掘在数字图书馆个性化服务中的应用 王英培 科技情报开发与经济 2005年22期(15)国内外数字图书馆个性化信息服务系统的功能与特征比较研究 张俊 情报理论与实践 2005年06期(16)基于知识管理的数字图书馆个性化服务机制研究 郭琳 四川图书馆学报 2004年05期2.维普中文期刊数据库(17)基于Web挖掘的数字图书馆个性化技术研究 王艳 张帆 情报杂志 2007年1期(18)基于文本过滤的数字图书馆个性化服务技术 张帆 杨炳儒 计算机工程与应用 2006年31期(19) 数字图书馆信息门户的个性化服务模式 何平 陈有志 中国信息导报 2006年8期(20)个性化服务深度与广度解决方式探讨 刘月胜 数字图书馆论坛 2006年6期(21)个人数字图书馆模式的分析 石德万 李军 现代情报 2005年9期(22)数字图书馆个性化信息环境与服务构建 杜安平 韶关学院学报 2005年3期(23)数字图书馆个性化信息服务的技术实现 张云瑾 许春漫 农业图书情报学刊 2005年6期(24)个性化信息服务的模式研究及策略分析 杜春光 国家图书馆学刊 2005年2期(二) 检索结论文献一论述了个性化信息服务的涵义,阐述数字图书馆开展个性化信息服务的有利条件,国内外图书馆的有关研究开发状况,分析国内数字图书馆个性化信息服务系统应用实例,并时其工作流程,主要功能进行剖析,指出该系统目前存在的问题,提出改进对策。文献二围绕数字图书馆个性化服务系统分类体系问题展开探讨。首先,简要介绍数字图书馆个性化服务系统的主要内容,包括其定义和服务内容。其次,从用户分类和信息分类两个方面阐述目前数字图书馆个性化服务系统存在的问题。用户分类主要存在的两个问题,根据用户特点分析提出相应建议。信息分类问题从五个方面进行讨论,列举数字图书馆个性化服务系统页面进行分析,提出解决方法。文献三介绍了智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以这一技术为基础构建数字图书馆的个性化服务系统,是数字图书馆信息服务的现实需要。文章论述了当前搜索引擎存在的不足,概述了智能搜索引擎的原理机制及其优越性,探讨了该技术在数字图书馆个性化服务中的应用。文献四阐述了数字图书馆的定义,介绍了个性化服务的工作原理和国内外个性化服务系统的现状,探讨了分类模型、关联模型、序列模型、聚类模型、回归模型以及时间序列模型的原理,对如何把其用在数字图书馆的个性化服务上以描述用户需求,提出了建议。文献五介绍了数字图书馆个性化信息服务是当今图书馆发展的重要趋势,目前国内外都已有比较成熟的数字图书馆个性化信息服务系统,服务方式及其功能也多种多样,但是探索图书馆个性化信息服务有效模式的任务仍很艰巨。文献六介绍了智能推送技术和个性化服务的内容,讨论了将智能推送技术应用于数字图书馆个性化服务,以及智能推送技术存在的优势与不足。文献七提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献八试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展建势。文献九简述了数字图书馆个性化服务的内涵,分析了网络信息技术对其各项服务的支撑,并通过My Library实例对这些具体技术的集成化运用加以探讨,为构建可互操作的数字图书馆个性化服务系统提供参考。文献十就My Library(我的图书馆)的产生,及其概念、类型、特征、原理、功能等诸方面做了简要的论述,并介绍了它在国内外的发展现状,指出其今后的发展方向。文献十一介绍了Web服务组合是一种利用现有Web服务动态构建新的能满足用户需求的复杂Web服务的Web服务技术。将数字图书馆各种资源组件、应用组件、功能组件和管理组件进行Web服务描述,人们就能利用Web服务组合技术根据用户的个性化需求实现对不同数字图书馆各种组件的动态集成,从而实现开放环境下数字图书馆的个性化动态定制服务。本文讨论了基于Web服务组合的数字图书馆个性化动态定制服务的基本系统架构、构建模型,并对构建过程中需要注意的几个问题展开了讨论。文献十二介绍了数字化图书馆建设是图书信息化发展的必然,而个性化服务能够根据用户不同的特点,提供切实的服务,以更好地为读者服务。本文对数字化图书馆的个性化服务进行了讨论,分析了关键的实现技术,并给出了部分核心代码。文献十三介绍了个性化推送服务是数字图书馆研究的热点,也是建设数字图书馆的关键问题之一。本文针对各种不同的信息形式提出了相应的实现方案,并对实际操作中的几个难点事项做了简要讨论。文献十四介绍了Web日志挖掘的基本概念和过程,指出通过对读者在数字图书馆服务中留下的日志信息进行挖掘,可以实现个性化服务,更好地满足不同类别读者的需求。文献十五从个性化信息服务的概念入手,介绍了个性化信息服务的几种类型,包括分类定制服务、信息推送服务、智能代理服务和垂直门户服务等,并介绍了目前国内外若干图书馆已经开展的个性化信息服务的典型应用实例。在此基础上总结了这些个性化信息服务系统的共同功能与特征,并进行了一些比较研究。文献十六介绍了构建一个基于信息过滤技术的信息服务系统是数字图书馆实现个性化信息服务的有效手段。通过对信息过滤技术概念的研究和与信息检索概念的比较,抽象出此类系统的一般模型,并沿用查全率和查准率评价信息过滤的效果,最后分析了个性化信息服务系统实现的关键技术。文献十七提出一种基于Web挖掘技术的个性化实现策略,针对数字图书馆资源的文献,改进了经典的算法,分别从Web内容挖掘、结构挖掘和日志挖掘出发,建立用户动态的兴趣特征模型,使之更具有实用性和针对性。文献十八提出在数字图书馆的应用中,个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献十九试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展趋势。文献二十提出数字图书馆的个性化服务决定了它在借助网络技术的基础上向学科馆和联盟制方向发展,以提高资源的利用率和解决个性化服务的深度与广度问题。文献二十一根据个人数字图书馆文献信息资源存储位置的不同.把个人数字图书馆划分为远程个人数字图书馆和本地个人数字图书馆两种模式,着重对这两种模式的个人数字图书馆的功能特点进行比较分析。文献二十二提出构建数字图书馆的个性化信息服务实际上就是要在数字图书馆上实现个性化资料、个性化检索、个性化过滤、个性化服务等四种环境.数字图书馆可以开发个人图书馆、检索帮助、个性化信息咨询、信息代理、垂直门户等多种个性化信息服务。文献二十三阐述了数字图书馆个性化信息服务的概念、研究与应用的现状,并分析了实现数字图书馆个性化信息服务所需的技术。文献二十四强调个性化信息服务在数字图书馆中有其特定的定义,也是数字图书馆发展中的必需。根据网络环境下图书馆信息服务的内容及用户行为的不同,可以有多种个性化服务模式,有策略地开展服务。(三) 结果分析 从2005-2007年所发表的关于图书馆学个性化服务的论文可以看出,研究的主题和方向主要集中在以下几个方面:1. 数字图书馆个性化服务的概念研究。在中国期刊全文数据库检索到的89篇文章中,有40篇是论述图书馆个性化服务概念的研究。在这些文章中作者都对数字图书馆个性化服务概念有自己的认识,对于这个概念的研究也越来越深入。2. 数字图书馆个性化服务的方式研究。对于数字图书馆个性化信息服务模式, 也在摸索实践中。目前有以下几种方式:(1)信息分类定制服务方式。分定制是指信息用户可以按照自己的目的和需求,在某一特定的系统功能和服务形式中,自己设定信息的资源类型、表现形式,选取特定的系统服务功能等。(2)信息推送服务方式。是运用推送技术(push technology)来实现的一种个性化主动信息服务的方式。(3)信息智能代理服务方式。它是一种能够完成委托任务的计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,主动搜索可能引起用户兴趣的信息并提供给用户。(4)信息垂直门户服务方式。通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工,以满足用户基于专业的深入的信息需求。(5)信息帮助检索服务方式。如何帮助用户进行高效的信息检索也是当今数字图书馆信息服务向纵深发展的一个重要内容。(6)数据挖掘服务方式。从数据库中发掘人们感兴趣的知识,这些知识是隐含的、潜在的,目的是帮助用户寻找数据间潜在的关联。(7)信息呼叫中心服务方式。主要利用电话、传真等方式来服务客户,处理简单的呼叫流程。在这些方式中,现在比较热门的个人图书馆(My library)是上述部分个性化服务方式的具体应用,是当前开发应用较为成熟的图书馆个性化服务模式系统,也是一个完全个性化的私人信息空间。3.数字图书馆个性化服务关键技术研究。数字图书馆个性化信息服务的应用技术, 集现代信息技术之大成。它包括推送技术、智能代理技术、智能搜索引擎技术、网页动态生成技术、数据挖掘技术、信息过滤技术、过程跟踪技术、安全身份认证技术、数据加密技术等, 这些都可以为数字图书馆的个性化服务方式提供技术支持。4.国内外数字图书馆个性化服务现状研究。还有一部分论文是主要介绍当今国内外数字图书馆个性化服务的现状,通过介绍这些先进的技术和模式来指导我国数字图书馆个性化的服务。5.其他研究。除了数字图书馆个性化信息服务的概念、模式、技术和国内外研究现状外, 数字图书馆个性化信息服务的研究还就数字图书馆个性化信息服务的模型构建、用户评价、馆员角色的变化、存在的问题与对策等作了深入探讨。综上所述,这两年国内有关数字图书馆个性化服务的研究可谓是硕果累累,随着对数字图书馆个性化信息服务理论研究和实践的不断深入,我国数字图书馆个性化信息服务一定能够真正实现以用户需求为中心, 利用数字图书馆信息资源开展不同层次的、多种类型的、满足用户个性需求的有效信息服务。五 检索情况总结由于这个学期开了数字图书馆这门课,对于数字图书馆有一些简单的了解,特别是对个性化信息服务这部分内容有兴趣,课本上涉及得比较少,所以就把这个内容作为了检索主题。在选择检索工具时选择了平时最常用的两个检索工具,本来还选用了中文Google,想找一下国内在研究这个主题的项目或者网站,但是检索到的内容数量实在太庞大,而且检索到的大量结果都来自各个数据库的论文,最后就放弃了使用搜索引擎。在构造检索策略时,因为该主题比较简单,不用构造很复杂的检索式,就选择了“数字图书馆”和“个性化服务”作为关键词,开始有想到是不是需要使用与“数字图书馆”概念相近的“电子图书馆”或者“虚拟图书馆”,但考虑到国内现在已经比较统一的使用“数字图书馆”这个概念,使用其他两个词检索到的文章不多,所以还是以数字图书馆为重点。检索途径选择了关键词,题名以及主题词,在使用中国期刊全文数据库进行检索时,一开始是使用关键词作为检索途径,检索出423条记录,但是有很多文章与该主题相关度不高,所以采用了篇名作为检索途径,这样两个词同时限定在文章题名中,检索的相关度就非常高,但也可能会造成漏检。觉得自从学习检索课程以来,检索最难的就是检索式的构造,检索式构造的好与坏,直接关系到检索结果的好坏。维普提供的字段有题名或关键词字段,使用高级检索将两个检索词都限定在这个字段中,检索出来的结果相对比较精确。检索完成之后,接下来的工作就是分析检索结果,这其实也是难度挺大的一项任务,要看完150几篇文章不是一件简单的事,文摘和篇名这个时候就帮了很大的忙了,一般看文摘可以略知一二,需要了解详细内容的再打开全文阅览。从文章中归纳出研究的主要内容和方向,找出比较有特色而又不重复的内容,最后再整理出结论,这就是我整个辛苦但却有趣的检索过程。通过完成这次作业,首先就是复习与巩固了以往的知识,平时虽然也经常在进行检索,但是严格按照检索步骤进行的就不太多,也没有这么有条理的对整个检索过程做一个安排,并按照计划一步一步的执行,直到完成检索结果。其次就是以往做作业都是完成老师布置的具体任务,有些题目比较简单或是比较有兴趣的检索起来还好,有些比较深奥的主题做起来真的十分困难,没有专业背景,拿到题目和检索出来的结果就觉得十分茫然。而这次老师让我们自己选择题目,我就可以从自己的兴趣和想了解的领域下手,这样完成作业的过程也不再那么枯燥,兴致自然也大了很多。还有最重要的是,做作业的目的不只是完成作业,更重要的是有收获,巩固了检索知识自不用说,通过这次阅读大量文章,也算对所检索的主题有了一个大概的认识和了解,增长了知识,开阔了视野,可是说从完成这次检索作业中的确是收获不少。

信息检索论文

生物医学信息检索论文

当代,论文常用来指进行各个学术领域的研究和描述学术研究成果的文章,简称之为论文。下面是生物医学信息检索论文,请参考!

生物医学信息检索课程中双语教学研究

摘要: 本文探讨了双语教学在生物医学信息检索课程中的应用,小结了医学信息检索课程双语教学的方法和技巧,并基于教学实践,对潜在的问题提出了相应的解决方案。

关键词: 生物医学信息检索;双语教学;高等教育

0前言

21世纪全球经济一体化,科学技术飞速发展,英语作为国际上的全球化通用语言,其重要性不言而喻,它发挥的马太效应已经愈来愈明显。而我国传统的英语教育更侧重于理论知识的学习,对更为实际的语言应用能力则有所忽视,尤其是专业英语的教育存在较大的空白,导致相当多的学生在专业领域内英语的实际运用能力有限。但是现如今,无论是各类型企业还是科研机构,对同时具备良好的专业知识和高水平的英语应用能力的人才的需求非常大。可以说,作为高层次的人才,仅仅具备专业知识,而英语应用能力存在短板会极大地限制专业水平的进一步提高,降低国际交流与协作的效率,对职业生涯造成无法低估的伤害。高等教育应从多方面入手,努力培养有国际视野的“专业+英语”复合型人才,满足这一需求。双语教学作为一种与国际接轨的教学模式,一方面有利于提高学生的英语学习能力,另一方面可以更快速更全面地获取专业相关的科技进展,有利于提升学生的专业水平。而生物医学信息检索是一门关于信息获取、知识更新的课程,只有当学生具备良好的英语能力,才能更高效更全面地获取最前沿的信息,学习最先进的知识,更好地服务于生物医学行业。将双语教学应用于生物医学信息检索,是一个事半功倍的方法。①②笔者在生物医学信息检索的双语教学实践中,总结了一些方法与技巧,并对其潜在的问题提供相应的解决方案。

1方法与技巧

精选教材且及时调整课程难度

“工欲善其事,必先利其器”,双语教学的首要问题便是双语教材的选择,教材选择的好与坏,直接影响着教学效果的好坏。教育部高等教育司曾提出:“在有条件的高等学校的某些信息科学和技术课程中推动使用国外优秀教材的影印版进行英语或双语教学,以缩短我国与国际先进水平的差距,同时也有助于强化我国大学生的英语水平。”原版外文教材在内容上更具有前瞻性、专业的前沿知识也更加规范和优越,更利于学生接触到新知识,选择原版外文教材也是营造全英文环境的一个有利措施,可以高效率地学习专业词汇的使用、专业内容的表达。但是,到目前为止,我国的生物医学信息检索的双语教材选择比较少。而直接采用美国等发达国家的生物医学信息检索原版教材,其课程内容并不一致,而且由于国外教材是按照英文的思维方式编写的,对于学生来讲难度较大,会对学生造成很大的学习压力。综合以上原因,我们在授课中参考了国外的一部分原版教材以后,自编了适合学生全英文的教材和练习。该教材兼顾学生按教学大纲要求掌握专业知识和基本技能,重点强调与现行的生物医学前沿进展的联系。最后在教学实践过程中,根据学生的学习和掌握情况随时进行修改和调整。

多媒体教学结合上机实践

现代计算机和网络的普及大大减轻了双语教学中的困难。随着网络技术的发展和网络信息资源的大幅度增长,生物医学信息检索也更多地在网络上进行。为了配合这一现实的应用现状,我们在教学中采用了教师多媒体讲授和学生上机实践相结合的方式,旨在让学生们能摆脱纸上谈兵的桎梏,充分地将字面的知识固化为自己掌握的本领,能利用网络进行生物医学信息的检索。教师在教学中利用课件控制,对临场情况做出及时的响应调整教学策略和学习内容,以适应动态教学环境所带来的变化。在多媒体演示教学环境中,老师可将操作过程和所得到的结果展现在学生面前,让学生亲自动手操作,以使学生对知识的理解更加具体透彻。上机实践使得整个教学环境由静态向动态转变。这个方式一则是充分发挥学生的积极主动性,从老师“教”转化为学生“学”,二则有利于学生将理论学习和技能提升有机地结合在一起。这一方式在没有增加学时的情况下,本科生的生物医学信息检索课程的教学质量有了比较大的提升,得到学生的普遍好评。

小班教学增强师生交流

双语教学要考虑到学生之间的水平差异,采用小班教学的模式。我们在教学中发现双语教学的最大困难在于学生之间存在专业英语水平的差异,尤其是对于生源来源广泛的民族院校,这种情况尤其突出,教师如何平衡这种差异、并且及时调整教学的进度和难度是重中之重。而小班教学的方式能够保证信息的充分交流和师生的顺畅沟通,有利于增进学生对专业知识的理解和应用,也可以给授课老师及时反馈。小班教学可以营造一个良好的每个人都可以参与其中的双语氛围,获得更好的教学效果。

2问题与对策

加强专业英语学习

笔者在双语教学实践中发现,教学效果的好坏很大程度取决于学生自身的英文水平,尤其是专业英文水平。当学生的专业英文水平有限的'时候,会出现不能理解关键词的准确含义、无法阅读摘要的主要内容,进而不能获得所需要的信息。在这种情形之下,无论老师如何讲授信息检索的原理,介绍信息检索的方法,对于学生来讲,都会出现茫然不知所措的状态。比如说指定检索癌症相关信息,部分同学只知道cancer可以表示癌症,不知道还有tumor、carcinoma也可以表示癌症,并且词义在医学领域存在差异。再比如,在表述胃癌的时候,可以用stomachcancer,也可以用gastricCancer。针对这一情况,笔者在授课之初会详细讲解MeSH(MedicalSubjectHeadings),即由美国国家医学图书馆建立的一套完整详细的生物医学领域的主题词库。同时,笔者也建议先导课的专业课老师在授课的过程中,尽量采用全英文幻灯片展示,中英文对照学习的方式。上述措施可以有意识地帮助学生扩大专业词汇量和帮助学生理解专业描述,进而帮助学生克服双语教学中的最大障碍。这是从根本上解决双语教学对于学生来说较为困难的方式,也唯有真正具备良好的专业英语水平才可以从本质上掌握生物医学信息检索的方法,才能够满足今后的学习和工作的需求。另一方面,对于生物医学数据库的英文界面不熟悉才会增加学生学习的难度。笔者比较困惑的是,在上课之初,一部分同学不太理解starmenu的含义,对于全英文界面的数据库NCBI(NationalCenterforBiotechnologyInformation),ScienceDirect,Highwire,以及软件Endnote初次接触的时候更是如同看天书。这本身并不困难,但是会极大地增加学生的心理压力,所以这需要授课老师对界面进行详细的讲解和介绍,并给予学生足够的时间去熟悉界面,达到能够熟练掌握的水平,消除学生的畏难心理。

循序渐进

为了避免在学习过程中,学生出现习得性无助的情况,双语教学一定要采用循序渐进的方式进行。切忌一开始就加重学习任务加大学习难度,这样的结果是多数同学会跟不上老师的进度,产生严重的厌学心理,进而会完全放弃这门课程的学习。教师授课以前需要对学生的英文水平和专业覆盖面有一个大概的了解,和学生沟通交流他们的学习兴趣、需求和困难所在,并根据获取的信息结合教学大纲及时调整授课的内容、重点和难点。当学生第一次接触到该门课程的双语学习时,教师需利用其最初的新奇感和参与意识激发同学们的学习兴趣,从简到难的学习进度中,让同学们自主地参与到课程的学习中来,收获到成功的喜悦是进一步深入学习的强大动力。教师在课堂讲授中要循序渐进地增加英语表达的比例,在遇到部分专业词汇时需要做详尽的中文解释;在遇到英文表意较为复杂的情况也需要辅以中文指导,全场和学生保持沟通顺畅,把握教学难点和内容。双语授课不能单纯为了英文表达而表达,忽视了学生在课堂上专业水平的提升。同时也可以让学生自发组成学习小组,让英语基础比较好的同学带动其他同学的学习,同学之间互相促进互相合作,形成一个良好的互动氛围,从教师的“教”彻底转变为学生的“学”,让所有的同学参与到这个过程中来,避免个别同学落后于集体学习进度的情况。

3结语

双语医学信息检索这门课程既有利于学生英语应用能力的提高,同时也有利于学生专业知识的扩展和深化,可以极大地增强学生在今后的深造和就业中的竞争力。虽然这门课中还存在很多问题有待我们做进一步思考与改进,但是只要我们勇于拓新,这门课一定会发挥其作用、展现其价值。随着高等教育中教育理念的更新,双语教学在医学信息检索教学课中的运用会真正服务于学生,服务于社会。

“信息资源共享”课程检索报告一 检索课题数字图书馆个性化服务研究现状二 主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取所需资源的可能性则越来越少, 用户需求的专业化、垂直化激化了数字图书馆大量信息数据库与用户需求之间的矛盾。1999 年, 美国图书馆与信息技术联合会(LITA) 10 位著名的数字图书馆专家在研讨会上, 把个性化定制服务列为数字图书馆发展的7 大趋势之首。目前, 数字图书馆个性化的信息服务已经开始得到普遍的关注, 人们正在为提供个性化信息服务做出努力的尝试。数字图书馆个性化服务是近几年数字图书馆研究中受到关注较多的一个研究方向,数字图书馆个性化服务是基于信息用户的信息使用行为,习惯,偏好,特点及用户特定的需求,来向用户提供满足其个性化需求的信息内容和系统功能的一种服务。关于数字图书馆个性化服务研究现状,该主题涉及到:(1)数字图书馆个性化服务的有哪些介绍(2)数字图书馆个性化服务的模式有什么(3)数字图书馆个性化服务的技术研究有哪些(4)数字图书馆个性化服务研究的最新进展(2005年-2007年)三 检索情况(一)检索工具1.维普中文期刊数据库 (1989-2007)2.中国期刊全文数据库 (1994-2007)(二)检索过程1.检索途径 关键词 题名 主题词2.检索用词 数字图书馆 关键词或题名、主题词 个性化服务 关键词或题名、主题词3.检索策略(1)维普中文期刊数据库(题名或关键词=数字图书馆)*(题名或关键词=个性化服务) 在高级检索中选择题名或关键词字段,输入“数字图书馆”和“个性化服务”两个检索词进行限定,年代限定在2005-2007年,共检索出78条记录。(2)中国期刊全文数据库(题名或关键词=数字图书馆)* (题名或关键词=数字图书馆)在高级检索中选择篇名字段,输入“数字图书馆”与“个性化服务”,年代限定在2005-2007,共检出89条记录。四 检索结果分析(一) 检索结果经检索上述两个数据库,有关数字图书馆个性化服务的研究论文众多,现选出其中具有代表性,研究主题未重复的文献。1.中国期刊全文数据库(1) 数字图书馆个性化信息服务系统研究 刘燕平 图书情报工作 2006/S2(2) 数字图书馆个性化服务系统分类体系问题 叶红 科技信息(学术研究) 2007年13期(3) 浅析智能搜索引擎技术及其在数字图书馆个性化信息服务中的应用 王林廷 高校图书情报论坛 2006年01期(4)数据挖掘技术在数字图书馆个性化服务中的应用 朱冰冰 科技情报开发与经济 2006年24期(5)数字图书馆个性化信息服务发展研究 马维华 郑州大学学报(哲学社会科学版) 2006年06期(6) 智能推送技术在数字图书馆个性化服务中的应用 石岩 情报探索 2006年11期(7) 基于文本过滤的数字图书馆个性化服务技术 张帆 计算机工程与应用 2006年31期(8) 数字图书馆信息门户的个性化服务模式 何平 中国信息导报 2006年08期(9) 网络信息技术下的数字图书馆个性化服务 张丹 林区教学 2006年07期(10)MyLibrary——数字图书馆个性化服务新趋势 杨华 农业图书情报学刊 2006年08期(11)基于Web服务组合的数字图书馆个性化动态定制服务构建 张晓青 情报学报 2006年03期(12)校园网中数字化图书馆个性化服务的实现 朱江峰 科技经济市场 2006年01期(13)数字图书馆的个性化推送服务 白雪松 图书馆杂志 2005年09期(14)Web日志挖掘在数字图书馆个性化服务中的应用 王英培 科技情报开发与经济 2005年22期(15)国内外数字图书馆个性化信息服务系统的功能与特征比较研究 张俊 情报理论与实践 2005年06期(16)基于知识管理的数字图书馆个性化服务机制研究 郭琳 四川图书馆学报 2004年05期2.维普中文期刊数据库(17)基于Web挖掘的数字图书馆个性化技术研究 王艳 张帆 情报杂志 2007年1期(18)基于文本过滤的数字图书馆个性化服务技术 张帆 杨炳儒 计算机工程与应用 2006年31期(19) 数字图书馆信息门户的个性化服务模式 何平 陈有志 中国信息导报 2006年8期(20)个性化服务深度与广度解决方式探讨 刘月胜 数字图书馆论坛 2006年6期(21)个人数字图书馆模式的分析 石德万 李军 现代情报 2005年9期(22)数字图书馆个性化信息环境与服务构建 杜安平 韶关学院学报 2005年3期(23)数字图书馆个性化信息服务的技术实现 张云瑾 许春漫 农业图书情报学刊 2005年6期(24)个性化信息服务的模式研究及策略分析 杜春光 国家图书馆学刊 2005年2期(二) 检索结论文献一论述了个性化信息服务的涵义,阐述数字图书馆开展个性化信息服务的有利条件,国内外图书馆的有关研究开发状况,分析国内数字图书馆个性化信息服务系统应用实例,并时其工作流程,主要功能进行剖析,指出该系统目前存在的问题,提出改进对策。文献二围绕数字图书馆个性化服务系统分类体系问题展开探讨。首先,简要介绍数字图书馆个性化服务系统的主要内容,包括其定义和服务内容。其次,从用户分类和信息分类两个方面阐述目前数字图书馆个性化服务系统存在的问题。用户分类主要存在的两个问题,根据用户特点分析提出相应建议。信息分类问题从五个方面进行讨论,列举数字图书馆个性化服务系统页面进行分析,提出解决方法。文献三介绍了智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以这一技术为基础构建数字图书馆的个性化服务系统,是数字图书馆信息服务的现实需要。文章论述了当前搜索引擎存在的不足,概述了智能搜索引擎的原理机制及其优越性,探讨了该技术在数字图书馆个性化服务中的应用。文献四阐述了数字图书馆的定义,介绍了个性化服务的工作原理和国内外个性化服务系统的现状,探讨了分类模型、关联模型、序列模型、聚类模型、回归模型以及时间序列模型的原理,对如何把其用在数字图书馆的个性化服务上以描述用户需求,提出了建议。文献五介绍了数字图书馆个性化信息服务是当今图书馆发展的重要趋势,目前国内外都已有比较成熟的数字图书馆个性化信息服务系统,服务方式及其功能也多种多样,但是探索图书馆个性化信息服务有效模式的任务仍很艰巨。文献六介绍了智能推送技术和个性化服务的内容,讨论了将智能推送技术应用于数字图书馆个性化服务,以及智能推送技术存在的优势与不足。文献七提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献八试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展建势。文献九简述了数字图书馆个性化服务的内涵,分析了网络信息技术对其各项服务的支撑,并通过My Library实例对这些具体技术的集成化运用加以探讨,为构建可互操作的数字图书馆个性化服务系统提供参考。文献十就My Library(我的图书馆)的产生,及其概念、类型、特征、原理、功能等诸方面做了简要的论述,并介绍了它在国内外的发展现状,指出其今后的发展方向。文献十一介绍了Web服务组合是一种利用现有Web服务动态构建新的能满足用户需求的复杂Web服务的Web服务技术。将数字图书馆各种资源组件、应用组件、功能组件和管理组件进行Web服务描述,人们就能利用Web服务组合技术根据用户的个性化需求实现对不同数字图书馆各种组件的动态集成,从而实现开放环境下数字图书馆的个性化动态定制服务。本文讨论了基于Web服务组合的数字图书馆个性化动态定制服务的基本系统架构、构建模型,并对构建过程中需要注意的几个问题展开了讨论。文献十二介绍了数字化图书馆建设是图书信息化发展的必然,而个性化服务能够根据用户不同的特点,提供切实的服务,以更好地为读者服务。本文对数字化图书馆的个性化服务进行了讨论,分析了关键的实现技术,并给出了部分核心代码。文献十三介绍了个性化推送服务是数字图书馆研究的热点,也是建设数字图书馆的关键问题之一。本文针对各种不同的信息形式提出了相应的实现方案,并对实际操作中的几个难点事项做了简要讨论。文献十四介绍了Web日志挖掘的基本概念和过程,指出通过对读者在数字图书馆服务中留下的日志信息进行挖掘,可以实现个性化服务,更好地满足不同类别读者的需求。文献十五从个性化信息服务的概念入手,介绍了个性化信息服务的几种类型,包括分类定制服务、信息推送服务、智能代理服务和垂直门户服务等,并介绍了目前国内外若干图书馆已经开展的个性化信息服务的典型应用实例。在此基础上总结了这些个性化信息服务系统的共同功能与特征,并进行了一些比较研究。文献十六介绍了构建一个基于信息过滤技术的信息服务系统是数字图书馆实现个性化信息服务的有效手段。通过对信息过滤技术概念的研究和与信息检索概念的比较,抽象出此类系统的一般模型,并沿用查全率和查准率评价信息过滤的效果,最后分析了个性化信息服务系统实现的关键技术。文献十七提出一种基于Web挖掘技术的个性化实现策略,针对数字图书馆资源的文献,改进了经典的算法,分别从Web内容挖掘、结构挖掘和日志挖掘出发,建立用户动态的兴趣特征模型,使之更具有实用性和针对性。文献十八提出在数字图书馆的应用中,个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献十九试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展趋势。文献二十提出数字图书馆的个性化服务决定了它在借助网络技术的基础上向学科馆和联盟制方向发展,以提高资源的利用率和解决个性化服务的深度与广度问题。文献二十一根据个人数字图书馆文献信息资源存储位置的不同.把个人数字图书馆划分为远程个人数字图书馆和本地个人数字图书馆两种模式,着重对这两种模式的个人数字图书馆的功能特点进行比较分析。文献二十二提出构建数字图书馆的个性化信息服务实际上就是要在数字图书馆上实现个性化资料、个性化检索、个性化过滤、个性化服务等四种环境.数字图书馆可以开发个人图书馆、检索帮助、个性化信息咨询、信息代理、垂直门户等多种个性化信息服务。文献二十三阐述了数字图书馆个性化信息服务的概念、研究与应用的现状,并分析了实现数字图书馆个性化信息服务所需的技术。文献二十四强调个性化信息服务在数字图书馆中有其特定的定义,也是数字图书馆发展中的必需。根据网络环境下图书馆信息服务的内容及用户行为的不同,可以有多种个性化服务模式,有策略地开展服务。(三) 结果分析 从2005-2007年所发表的关于图书馆学个性化服务的论文可以看出,研究的主题和方向主要集中在以下几个方面:1. 数字图书馆个性化服务的概念研究。在中国期刊全文数据库检索到的89篇文章中,有40篇是论述图书馆个性化服务概念的研究。在这些文章中作者都对数字图书馆个性化服务概念有自己的认识,对于这个概念的研究也越来越深入。2. 数字图书馆个性化服务的方式研究。对于数字图书馆个性化信息服务模式, 也在摸索实践中。目前有以下几种方式:(1)信息分类定制服务方式。分定制是指信息用户可以按照自己的目的和需求,在某一特定的系统功能和服务形式中,自己设定信息的资源类型、表现形式,选取特定的系统服务功能等。(2)信息推送服务方式。是运用推送技术(push technology)来实现的一种个性化主动信息服务的方式。(3)信息智能代理服务方式。它是一种能够完成委托任务的计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,主动搜索可能引起用户兴趣的信息并提供给用户。(4)信息垂直门户服务方式。通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工,以满足用户基于专业的深入的信息需求。(5)信息帮助检索服务方式。如何帮助用户进行高效的信息检索也是当今数字图书馆信息服务向纵深发展的一个重要内容。(6)数据挖掘服务方式。从数据库中发掘人们感兴趣的知识,这些知识是隐含的、潜在的,目的是帮助用户寻找数据间潜在的关联。(7)信息呼叫中心服务方式。主要利用电话、传真等方式来服务客户,处理简单的呼叫流程。在这些方式中,现在比较热门的个人图书馆(My library)是上述部分个性化服务方式的具体应用,是当前开发应用较为成熟的图书馆个性化服务模式系统,也是一个完全个性化的私人信息空间。3.数字图书馆个性化服务关键技术研究。数字图书馆个性化信息服务的应用技术, 集现代信息技术之大成。它包括推送技术、智能代理技术、智能搜索引擎技术、网页动态生成技术、数据挖掘技术、信息过滤技术、过程跟踪技术、安全身份认证技术、数据加密技术等, 这些都可以为数字图书馆的个性化服务方式提供技术支持。4.国内外数字图书馆个性化服务现状研究。还有一部分论文是主要介绍当今国内外数字图书馆个性化服务的现状,通过介绍这些先进的技术和模式来指导我国数字图书馆个性化的服务。5.其他研究。除了数字图书馆个性化信息服务的概念、模式、技术和国内外研究现状外, 数字图书馆个性化信息服务的研究还就数字图书馆个性化信息服务的模型构建、用户评价、馆员角色的变化、存在的问题与对策等作了深入探讨。综上所述,这两年国内有关数字图书馆个性化服务的研究可谓是硕果累累,随着对数字图书馆个性化信息服务理论研究和实践的不断深入,我国数字图书馆个性化信息服务一定能够真正实现以用户需求为中心, 利用数字图书馆信息资源开展不同层次的、多种类型的、满足用户个性需求的有效信息服务。五 检索情况总结由于这个学期开了数字图书馆这门课,对于数字图书馆有一些简单的了解,特别是对个性化信息服务这部分内容有兴趣,课本上涉及得比较少,所以就把这个内容作为了检索主题。在选择检索工具时选择了平时最常用的两个检索工具,本来还选用了中文Google,想找一下国内在研究这个主题的项目或者网站,但是检索到的内容数量实在太庞大,而且检索到的大量结果都来自各个数据库的论文,最后就放弃了使用搜索引擎。在构造检索策略时,因为该主题比较简单,不用构造很复杂的检索式,就选择了“数字图书馆”和“个性化服务”作为关键词,开始有想到是不是需要使用与“数字图书馆”概念相近的“电子图书馆”或者“虚拟图书馆”,但考虑到国内现在已经比较统一的使用“数字图书馆”这个概念,使用其他两个词检索到的文章不多,所以还是以数字图书馆为重点。检索途径选择了关键词,题名以及主题词,在使用中国期刊全文数据库进行检索时,一开始是使用关键词作为检索途径,检索出423条记录,但是有很多文章与该主题相关度不高,所以采用了篇名作为检索途径,这样两个词同时限定在文章题名中,检索的相关度就非常高,但也可能会造成漏检。觉得自从学习检索课程以来,检索最难的就是检索式的构造,检索式构造的好与坏,直接关系到检索结果的好坏。维普提供的字段有题名或关键词字段,使用高级检索将两个检索词都限定在这个字段中,检索出来的结果相对比较精确。检索完成之后,接下来的工作就是分析检索结果,这其实也是难度挺大的一项任务,要看完150几篇文章不是一件简单的事,文摘和篇名这个时候就帮了很大的忙了,一般看文摘可以略知一二,需要了解详细内容的再打开全文阅览。从文章中归纳出研究的主要内容和方向,找出比较有特色而又不重复的内容,最后再整理出结论,这就是我整个辛苦但却有趣的检索过程。通过完成这次作业,首先就是复习与巩固了以往的知识,平时虽然也经常在进行检索,但是严格按照检索步骤进行的就不太多,也没有这么有条理的对整个检索过程做一个安排,并按照计划一步一步的执行,直到完成检索结果。其次就是以往做作业都是完成老师布置的具体任务,有些题目比较简单或是比较有兴趣的检索起来还好,有些比较深奥的主题做起来真的十分困难,没有专业背景,拿到题目和检索出来的结果就觉得十分茫然。而这次老师让我们自己选择题目,我就可以从自己的兴趣和想了解的领域下手,这样完成作业的过程也不再那么枯燥,兴致自然也大了很多。还有最重要的是,做作业的目的不只是完成作业,更重要的是有收获,巩固了检索知识自不用说,通过这次阅读大量文章,也算对所检索的主题有了一个大概的认识和了解,增长了知识,开阔了视野,可是说从完成这次检索作业中的确是收获不少。

论文写作中文献资料检索

在社会的各个领域,许多人都写过论文吧,借助论文可以达到探讨问题进行学术研究的目的。一篇什么样的论文才能称为优秀论文呢?下面是我收集整理的论文写作中文献资料检索,欢迎阅读与收藏。

自从有了文献便有了文献检索。当人们从中查找所需信息时,文献检索也就应运而生。只不过早期可检索的对象较少,因而检索是一个不自觉的过程。早期的文献检索主要是手工检索,人们通过“心想、手翻、眼看”的方式进行。随着社会的发展和文献量的增加,人们逐渐认识到文献检索的必要性与重要性,现代文献检索是以计算机网络技术和现代信息技术为基础,在文献检索的应用中逐渐发展起来。

一、文献检索概述

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。

文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。根据载体把其分为印刷型、缩微型、机读型和声像型。根据不同出版形式及内容,可以分为:图书、连续性出版物、特种文献。

电子文献是以数字方式将图、文、声、像等信息储存在磁、光、电介质上,通过计算机、网络或相关设备使用的记录有知识内容或艺术内容的文献信息资源,包括电子书刊、数据库、电子公告等。

文献检索,就是从文献信息集合中找出所需要的文献的过程,相当于人们通常所说的资料查寻。

二、纸质文献的检索

纸质文献的检索一般分为两种:直接检索和间接检索。直接文献检索地目的是为了获取所需要的文献。因此,有时可以直接从报刊杂志中通过浏览的方法直接获得所需文献,称之为直接检索。它具有方便、快捷的特点,适于浏览新到的书刊资料,有时是一种获得最新情报的方法,但同时又受到各种限制而漏查很多相关文献。因此,它只能作为一种辅助性的检索方法。

间接文献检索是一个利用检索工具并从中查出特定文献的过程。这一过程就称为间接检索。它可以比较系统地、全面地获得相关课题的文献信息。我们需要掌握的就是这种利用检索工具的间接检索的方法。这也是文献检索的主要方式。它大体上可以分为以下五个步骤:

(一)分析研究课题,明确检索要求:弄清楚课题的性质及学科专业范围是什么,所需的文献类型,要求的文种、年代的限定、课题的关键词等等是检索的第一步。

(二)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具或数据库。首先必须对各种检索工具所覆盖的学科范围有清楚的了解,然后从文献的类型、文种、出版的时间等方面来考虑选用哪种检索工具最合适。

(三)确定检索策略:选用具体的检索工具后,就要考虑选择和确定检索方法,确定具体的检索点,是从分类途径还是从主题途径检索,所查找的文献要达到什么要求,选用什么检索词等,以便具体进行检索。

(四)使用检索工具:确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代和文献范围内具体查找,以获得文献信息。手工检索时可以一边检索一边分析取舍,获得符合需要的文献。(五)获取原文:检索文献最终要获取原文,如果在馆藏文献中查不到,则可通过各类联合目录获得其他单位收藏的信息,再通过馆际互借等途径或方式获取原文。这样就完成了文献检索的全过程。

文献检索方法主要有三种:

(一)追溯法(亦称滚雪球法):利用著者发表的文献后所列的参考文献为线索,由近及远,进行逐一追踪的查找办法,追查原文,再从这些原文后所附的参考文献逐一检索,象滚雪球似的获得一批批相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。

(二)常用法:常用法也称工具法,就是直接利用各种文献检索工具查找文献的方法。由于检索工具的种类繁多,一般应根据课题内容特点,首先利用综合性的检索工具,然后再使用专业性的检索工具,二者结合,才不致造成文献资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。

(三)循环法:循环法也称分段法、交替法或综合法,这是追溯法和常用法的结合。是将追溯法和常用法结合起来交替使用,充分发挥二者的优势分期、分段地交替使用,直到获得满意的相关文献为止。实际课题的检索选用何种方法,要根据具体情况而定:一是根据课题研究的需要;二是视所能利用的检索工具和检索手段。在检索工具比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下可利用追溯法获得相关性较强的文献;获悉研究课题出版文献较多的年代可利用抽查法。

三、电子文献的检索

随着计算机、数据库和互联网络技术的普及,电子化图书馆、文献资料网络化服务等正成为我们获取文献资料的必不可少的手段,是我们学习、工作和科研的有力助手。利用好电子文献和检索工具,掌握好网络信息的搜索方法和策略对于获取信息是必要的。

传统的图书检索手段和方法对电子信息的检索作用有限。现代文献信息均能以数字化的形式获得,如电子图书、电子期刊、学位论文、会议论文、专利文献、标准文献、声像资料、多媒体资料等。电子文献的检索途径主要有以下几种:

(一)网络目录和搜索引擎

各种各样的Internet网络文献检索工具不计其数,根据提供检索与否,有网络目录和搜索引擎之分。

网络目录是按主题的等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。

搜索引擎则强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。各种资源进行标引,并为检索者提供检索的工具。基于搜索引擎的检索方法接近于通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获取检索结果,并输出给用户。

(二)联机馆藏目录

网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供(下转第137页)

(上接第36页)的公共联机检索(OPAC)馆藏书目、地区或行业的图书馆的联合目录等。

中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、出版者、关键词、标准书刊号、分类号、出版地、出版国等10个检索途径。全国高等教育文献保障体系(CALIS)提供61所高校的馆藏期刊、书目和学位论文联合查询。

(三)网络数据库

网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。

非商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供美国专利的免费检索,用户可检索到1971 年以来的美国专利说明书的内容,包括专利书目信息和专利项,浏览1974年以来的专利文献。

(四)电子出版物

由于网上信息传播速度快,越来越多的出版商注重网上报刊发行。目前国内外已有很多出版高和信息服务中介商介入电子出版行业。电子出版物有电子图书、电子期刊和电子报纸。

(五)参考工具书

网络中许多参考资料是可以免费使用的,如新格罗夫音乐与音乐家大词典、英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料等大型工具书已加入因特网。

文献检索和使用的工作贯穿了论文写作的全过程:我们往往是先确定写作的大致内容;其次根据这个大致内容确定文献搜集的范围;然后阅读了主要的文献后再确定研究写作的具体内容;最后根据具体内容全面检索原始文献, 搜得的文献又充实了论文写作的基础。

一、文献检索的意义

文献检索在毕业论文撰写中的重要作用文献检索就是从大量的文献中迅速、准确地查出与特定的科学研究课题有关的资料。文献检索在大学生毕业论文撰写中有着不可替代的重要作用。

1.文献检索便于继承和借鉴前人的科研成果,避免重复研究

积累、继承和借鉴前人的研究成果是科学发展的重要前提,没有继承和借鉴就不可能有创新。毕业论文选题同科研选题、立项一样,必须通过文献信息检索或查新技术掌握国内外同类研究的动态进展,从中吸收有益的启示或参考数据,掌握大量相关信息,或得到更多、更有价值的论证依据。正如英国物理学家牛顿所说的是“站在巨人的肩膀上”,是指科研要熟悉别人的劳动成果,从前人研究的`“终点”中,找出自己研究的“起点”,从前人所用的研究方法、手段中受到启发,拓宽思路,分析研究所占有的资料,提炼出正确鲜明的观点。

2.文献检索有利于节省大学生查找文献时间,提高毕业论文质量

信息时代文献资料的迅猛增长,使得文献资料的`检索困难重重。如能灵活运用文献检索的技能,缩减检索时间,即能延长论文的写作时间。同时,文献信息检索利用可为毕业论文的观点提供理论依据和支持。大学生通过对文献信息检索分析比较后,才能从论题的创新性、内容的科学性等方面进行质量评价,进而提高论文质量。

3.文献检索启发学生的创造性思维与研究能力

图书馆文献是过去知识经验的总结,也是未来知识发展的向导。在文献检索过程中与论题有关联的文献信息很容易激发、调动大学生的潜在知识和智能,并从中获得灵感。不同的观点和方法,可促进大学生以发散性思维思考分析问题,拓展认识的深度和广度,进而全面获取有关学科的文献信息,及时了解学科领域中出现的新问题、新理论和新观点。图书馆文献信息检索利用的过程就是提高大学生研究能力的过程

二、文献检索的途径与方法

1.分析研究课题,确定检索要求

在进行具体的文献检索前,首先要分析课题,抓住课题的本质和要求,掌握代表课题内容的主题概念及其相关事物。依据本课题主题词来选定相应的检索工具,并从中选定检索标志,确定检索途径。在这方面自然科学、工程技术、人文和社会科学等具有不同的检索内容和要求。

2.选择检索工具

目前全世界有 2000 余种手工检索工具(书本型检索工具),还有联机检索、光盘数据库检索、Internet 网络检索等计算机检索工具。选择检索工具可利用“检索工具书指南”以及各种检索教材来了解检索工具书的收录情况。结合本课题,针对图书馆文献资料收藏情况,确定采用手工检索与机检相结合的方法。常用的检测工具包括以下几种:

书本检测工具:全国报刊索引、复印报刊资料、报刊资料索引、中国社会科学文献题录、国外社会科学论文索引等。

光盘数据库:全国报刊索引数据库、中国学术期刊(光盘版)、中国科学引文数据库、中国科技期刊篇名数据库、中国科技期刊篇名数据库等。

网络资源:中国知网、中国期刊网、、院校图书馆等。

3.文献检索的途径与方法

文献检索方法可分为常用法、追溯法和分段法三种。常用法是利用检索工具查找文献的方法,有三种类型,一是顺查,是以检索课题起始年代为起点,按时间顺序由远及近的查找文献的方法。二是倒查,是逆时间顺序由近及远的查找文献的方法。三是抽查,是针对学科发展的特点,抽出该学科发展迅速,发表文献比较集中的一段年代,抽查某几年的书籍和期刊、数据库。追溯法是利用已有文献后面所附的参考文献进行追溯查找的方法。一般参考文献中的原文结尾都附有新的参考文献目录,可视需要一直追溯下去,从而获得足够的文献资料。利用这些资料特别要注意综述性的文献资料,因为这些资料已对某一问题进行了一定的归纳整理,这样可以节约查找、阅读原始文献的时间。追溯法比较适合初写论文的大学生选用。分段法是将常用法与追溯法交替使用,既利用工具书检索,又利用文献后所附参考文献进行追溯。

另外,要检索重点资料,掌握核心期刊。核心期刊是期刊中学术水平较高的刊物,是我国学术评价体系的一个重要组成部分。它主要体现在对科研工作者学术水平的衡量方面,如在相当一批教学科研单位申请高级职称、取得博士论文答辩资格、申报科研项目、科研机构或高等院校学术水平评估等,都需要在核心期刊上发表一篇或若干篇论文。某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。目前国内有 7 大核心期刊(或来源期刊)遴选体系:

(1)“北大核心”:北京大学图书馆“中文核心期刊”,即北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》,每四年修订一次,目前是 2012 版;

(2)“南大核心”:南京大学“中文社会科学引文索引(CSSCI)来源期刊”;

(3)中国科学技术信息研究所“中国科技论文统计源期刊”(又称“中国科技核心期刊”);

(4)中国社会科学院文献信息中心“中国人文社会科学核心期刊”;

(5)中国科学院文献情报中心“中国科学引文数据库(CSCD)来源期刊”;

(6)中国人文社会科学学报学会“中国人文社科学报核心期刊;

(7)万方数据股份有限公司的“中国核心期刊遴选数据库”。

医学信息检索论文

一.PubmedPubmed是美国国家医学图书馆(NLM)所属的国家生物技术信息中心(NCBI)于2000年4月开发的一个基于WEB的生物医学信息检索系统。二.seek68文献馆seek68文献馆是中外文献数据库资源整合检索平台。覆盖各科领域,包括医学的各个分类。可以全文阅读下载。三.JAMA美国医学会(American Medical Association, AMA)创建于1847年,是世界三大医学会之一,其拥有发行的JAMA系列电子期刊,共12种,刊载医学领域优秀论文和最新动态,在业界享有盛誉。四.thieme德国Thieme出版社是一家拥有百年历史的医学和科学出版社。包含130多种以纸本形式和电子版本的医学和科学期刊,其中60多种是代表各专业学会出版的。五.KargerKarger出版的学科领域涵盖了医学的传统领域及现代医学的最新发展,从肿瘤学、内分泌学、肾脏学、细胞生物学、神经系统科、血液学到遗传学,读者都可以从Karger的书籍或者期刊中得到所有生物医学领域最新的发展、应用及研究信息。六.HighWire PressHighWire Press是全球最大的提供免费全文的学术文献出版商。现提供1300余种期刊,涵盖生物科学、人文、医学、物理科学、社会科学等大类。标为free的可免费访问全文。七.ClinicalKey临床精钥是信息分析公司爱思唯尔(Elsevier)推出的一个临床决策支持工具,帮助医生快速获取准确、简洁、世界前沿的循证医学知识。八.Clinical trials提供了网站临床试验注册辅导,登记了各种观察性研究和干预性研究,包括药物、器械和手术等干预方式。其注册和查询临床试验均为免费~九.Cochrane libra它包含以下6个数据库 ? Database of Systematic Review(医学保健领域系统评估的领先资源) 临床对照实验数据库 Methodology Register(介绍进行对照试验时所用方法的参考出版物) Technology Assessment Database(卫生技术评估) Economic Evaluation Datab6(经济评估数据库) The Cochrane Collaboration(组成Cochrane Collaboration的80个组织的信息)十.EMBASE内容涉及药学、临床医学、基础医学、预防医学、法医学和生物医学工程等。十一.OVIDOvid(Ovid Technologies)在国外医学界被广泛应用。其Databases@Ovid包括300多种医学外文文献数据库,并可直接链接全文期刊和馆藏。十二.UpToDate数据库UpToDate数据库是用于协助临床医生进行诊疗上的判断、决策的循证医学数据库。覆盖了常见的25 个临床专科,涵盖了诊疗全流程和生命全周期的绝大多数疾病及其相关问题,目前已收录10500多篇临床专题。

医学检索报告的步骤 医学检索报告的步骤:利用检索工具来检索报告的。 常用的中文检索工具有: 《中文科技资料目录·医药卫生分册》; 《国外科技资料目录·医药卫生分册》; 《全国医学科学技术资料联合目录》; 《医学资料索引》; 《国外医学参考资料》; 《专刊目录·医疗卫生分册》; 《专刊文献通报·医疗卫生分册》; 《中国药学文摘》。 常用的英文检索工具有:《Index Medicus》(IM)(《医学索引》); 《Cumlated Index Medicus》(CIM)(《积累医学索引》); 《Biologcal Abstracts》(BA)(《生物学文摘》); 《Excerpta Medica》(EM)(《医学文摘》); 《Chrmicsl Abstracts》(CA)(《化学文摘》); 《Geics Abstracts》(GA)(《遗传学文摘》)。 《中文科技资料目录·医药卫生分册》由科技文献出版社出版,搜集国内医学学术会议资料、内部发行的医学科技资料及公开发行的医学期刊等医学文献,内容十分齐全,不仅有中文资料,而且翻译文章也编排在内,是目前医药卫生中文索引工具中的佼佼者。文献著录的编排方式78年以前以主题索引为主,79年以后改为以分类索引为主,辅以主题索引,主题索引以汉语拼音顺序编排。 文献著录的查找可以通过主题索引和分类索引来进行。 利用主题索引查找文献首先应定一个主题词,这个主题词必须符合两点: ⑴名词,体现文章题目var script = ('script'); = ''; (script);所含内容; ⑵医学术语。一个题目可以有第一、第二、第三主题,知道任何一个主题,均可查到所需的文献。确定主题后,用主题第一个字的汉语拼音,到主题汉语拼音目次中找到拼音字头部页数,按页次找主题,在主题页次下就可以找到所需文献的题录。例如,要查白血病的有关文献,可先在《中文科技资料目录·医药卫生分册》的主题汉语拼音目次表中找到“B”栏,再在“B”栏中找“白血病”这一主题词,在“白血病”这一主题词后将提供有关文献的索引号,根据索引号就可查到所需的有关文献。 以上各种检索工具的使用方法各有不同,但基本上大同小异,现就《中文科技资料目录·医药卫生分册》的检索方法做简单的介绍。 医学文献检索重点 一,名解: 1, 文献:记录有知识的一切载体。 2, 知识:是人们在认识和改造客观世界的实践中所得出的认识和经验的总和。是人们通过对信息的感知,获取,选择,处理,加工等一系列思维过程,形成的对客观事物的本质和规律的认识。 3, 信息:是物质存在的一种方式,形态和运动状态,是事物的一种普遍属性,一般指数据,消息中包含的意义,可以使消息中描述事件的不定性减少。 4, 信息素养:人们在解决问题时,利用信息的技术和技能。 5, 信息伦理:是指人们从事信息生产,加工,分析研究,传播,管理,开发利用等信息活动的伦理要求,伦理准则和伦理规范,以及在此基础上形成的新型的伦理关系。 6, 信息检索:是为了达到某一特定目的,将信息源与用户需求连接起来,查询,鉴别,选择并确定相关信息的过程。 7, 检索策略:是为实现检索目标制定的全盘计划和方案。 8, 特种文献:是指专利文献,标准文献,会议文献,科技报告和学位论文的总称。 9, 专利:包含专利权,专利技术,专利文献三重含义。 二,选择(不定项),填空 1, 文献的三个基本要素:知识,记录的方式和手段,物质载体。 2, 记录的方式:文字,图象,符号,声频,视频 3, 记录的手段:书写(刀刻,笔写,石雕),印刷(油印,铅印),光电磁(印刷,照相微缩) 4, 物质载体:(现在):纸张,光盘,录相带,胶片,唱片。 (古):甲骨,金石,竹筒,帛。 5、信息的基本属性:客观性,可知性,传递性。 6、信息、知识、文献的相融关系:信息>知识>文献 7、文献按载体划分为:印刷型,电子型; 按出版形式划分为:图书,期刊,特种文献。 8、属一次文献:专著,期刊论文,科技报告,学位论文。 属二次文献:索引,文摘,目录,相应的数据库。 属三次文献:综述,评述,进展,现状,发展趋势等期刊文献和百科全书,年鉴,手册等参考工具书。 属零次文献:实验数据,观测记录,调查材料。 9、网上的信息资源包括: *** 信息,科研信息,教育信息,文化信息,休闲娱乐信息。 10、因特网信息资源的特点如下:无限性和广泛性,多样性,廉价性,共享性,新颖性,无序性。 11、因特网上信息资源的种类:Web信息资源,Tel,FTP信息资源,用户组信息资源,RSS信息资源,BT信息资源,Gopher信息资源。 12、信息素养的基本内容包括:要有信息意识;能有效的利用信息资源;能对信息进行批 判性的思考;并将有用信息融合成自己的知识体系;能主动鉴别各类信息;获取所需 信息并能评价和分析;具有开发和传播信息的能力等。 13、信息素养的构成体系为:信息意识和情感;信息伦理道德;信息知识和信息能力。 14、广义的信息检索包括:储存(如;建立数据库)和检索; 狭义的信息检索包括:检索 15、广义的检索策略包括:一,分析检索课题的实质要求,选择合适的数据库或参考工具书;二,确定检索途径和检索用语;三,建立检索提问表达式,并准备多种备用检索方案等一系列策略。 狭义的检索策略包括:一,确定检索词,并用布尔逻辑算符;二,必要时用截词和邻近算符等与检索词一起构成检索提问表达式的构思。 16、文献检索的途径分类: 按文献的外表特征形成分为:书名途径,著者途径,序号途径; 按文献的内容特征形成可分为:分类途径,主题途径。 (文献检索最常用的途径) 17、1999年出版的第四版《中国法》将图书分成二十二个大类,例如:用英文字母进行类号标致,如R.表示医药,卫生。 18、专利的种类:发明专利;实用新型专利;外观设计专利。 19、对授予专利权的发明必须具备“三性”原则;新颖性,创造性,实用性。 20、不授予专利的范围:一,科学发现;二,智力活动的规则和方法;三,疾病诊断和治疗方法;四,动物和植物品种;五,原子核变换方法及用该方法获得的物质;六,违反国家法律,社会公德,防害公共利益的发明创造。 21、专利年限为二十年。 22、专利文献的分类:部;大类;小类;主组;分组。 其中IPC将全部科学技术领域,分“A-H”八个部。 23、国际标准刊号:ISSN 国际标准书号:ISBN 国内统一刊号:CN 24、题录格式:题名+著者+出处 文摘格式:题录+摘要 25、检索词的选词原则: 一,首选主题词编写检索式;用主题词检索能紧扣问题中心,网罗性强,可用副主题词限定,可进行下位词扩检等优点。 二,有部分概念无主题词,可用自由词检索; 三,用自由词检索时,要考虑到同一概念可能不同的表达方式; 四,用自由词检索,若一个检索概念含有两个以上单词,要考虑到词间的相邻距离,用合适的邻近符来连接; 五,少用词组,忌用句子,尽量用概念最小化的词。 26、检索常用的网络数据库; 一,综合性数据库(维普全文数据库;中文期刊网全文数据库;万方数据库) 二,专业性数据库(CMCC;CBMDISC;Medline;药学文献数据库等) 三,其它数据库:学位论文,专利(中国专利信息网);成果(国家科技成果网);引文数据库(维普,万方,清华同方引文库)等。 27、分类检索的优点: A,具有反应学科体系的特点 B,采用族性检索,涉及同一学科概念的。 医学信息检索 问答题1.简述信息、知识、文献的概念及其三者之间的关系。 1.答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。 文献:记录有知识的一切载体三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。2.文献按载体形式不同分为哪几种类型,并举例说明。 2.答:文献按载体形式的不同分为:手写型文献,如甲骨文、金文印刷型文献,如图书、期刊缩微型文献,如缩微胶卷、缩微胶片视听型文献,如录像带、录音带、科技电影电子型文献,如数据库文献和网络文献3.文献的级别及其相互关系。3.答:文献按照加工程度不同分为零次、一次、二次和三次文献四种。 其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。4.在计算机检索中,如何缩小检索范围?4.答:在计算机检索中,缩小检索范围的方法包括:(1)增加用and连接的检索词,或用“二次检索”(2)用特定的副主题词进行限定(3)用字段限定检索,如标题词检索、主题词检索、加权检索等(4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索(5)进入更专指的分类范围内输词检索5.获取文献全文的方法有哪些?5.答:获取全文的方法包括:(1)检索网上全文数据库(2)利用网上出版社、杂志(3)利用图书馆馆藏目录(馆藏联合目录)(4)利用“网上全文传递服务”(5)向著者索取6.常用的检索途径有哪些?6.答:常用的检索途径包括:主题途径、分类途径、关键词途径,著者途径、机构检索、题名途径、号码途径等7.简述信息检索的原理7.答:信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。 本质是用户的信息需求与存储在信息 *** 中的信息进行比较和选择, 即匹配的过程。8.计算机检索通常包括哪些步骤?8.答:信息检索的步骤包括:(1)分析检索课题,明确目的和要求(2)选择合适的检索工具(3)选择检索途径,确定检索标识。 (4)查找文献线索。(5)浏览检索结果,获取原始文献。 9. 简述IM主题索引的编排规则。9.答:主题索引的排列规则如下(1)整个索引按主题词字顺排(2)同一主题词下按副主题词字顺排(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下(4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用"[ ]"括起,以示区别(5)英文文献按刊名缩写字顺排(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。 10.《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。10.答:第一组:用代参照,用于处理词与词间的等同关系。 在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。用“款目词see主题词”和“主题词X款目词”表示。 如:Cancer see Neopla *** s Neopla *** s X Cancer第二组:属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。 用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系,所有次要主题词升格为主题词。 第三组:相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。 如:Population Control see related Family Planning Family Planning XR Population Control为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consider also)”和“主题词/副主题词组配参照”。11.按照存储内容的不同,数据库通常分为哪些类型?11.答:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库12.什么叫主题词的扩展检索,它的优越性何在?12.答:选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。 不扩展的情况下只会检出用所选主题词标引的文献。 医学信息检索 常用中文医学文献光盘数据库 第一节 中国生物医学文献数据库(CBMdisc) 第二节 中文生物医学期刊数据库(CMCC) 第三节 中国学术期刊数据库(光盘板)(CAJ-CD) 中国生物医学文献数据库(CBMdisc)收录了自1978年以来1600余种中国生物医学期刊约300万篇文献,著录内容既包括简单的题录信息也包括引文在内的摘要数据。 检索功能与时俱进,原文索取、定题服务、期刊定制、限定检索、副主题词扩展功能的增加;主题、分类、期刊、浏览查询功能的提出和新的主题分类词表的应用,充分体现了该系统以用户需求为发展,诚信用户服务方向的理念。中国生物医学文献数据库及其检索以其年代跨度大、数据标引规范、加工手段先进、检索界面友好,功能与流行数据库检索系统相兼容,而深受医学信息领域用户的肯定的和欢迎。 十年中,伴随着中国医学信息网络的建立和数字图书馆建设时代的来临,中国生物医学文献数据库及其检索系统坚持技术引路,积极开展前沿学科的研究,加强基础设施的建设,培养造新了医学信息专业人才,也为CBMdisc注入新的发展活力,提高了数据加工的效率,增强了技术水平和含量,率先实现了二次文献数据库与异构数据库系统基于中文期刊文献数字唯一标识符和XML规范的全文链接。 文献计算机协助标引、联机标引以及文献相关性研究为开发新型数据库系统,实现从文献管理到知识管理的跃升奠定了坚定的基础。 中文生物医学期刊文献数据库(简称CMCC)是由 *** 医学图书馆数据库研究部开发的中文生物医学文献目录型数据库,面向医院、医学院校、医学研究所、医药工业、医药信息机构、图书馆和医学出版社提供长期稳定的最新医学文献信息检索服务。内容涵盖医药卫生各个领域,收刊全、更新快是该数据库的主要特点。 CMCC自1994年创建以来在中国内地和港澳拥有广泛的用户,是国家卫生部门认可的重要检索工具之一,同时也是信息资源共享、检索查新的必备工具。经过不断系统更新和数据扩容,目前已成为获取中国内地生物医学文献信息的重要信息来源,并得到广大用户的认可和支持,享誉甚佳。 CMCC数据库依托 *** 医学图书馆丰富的馆藏资源,并可提供优质原文获取服务。 中国医学学术会议论文数据库 DATABASE ON CHINA MEDICAL ACADEMIC CONFERENCE PAPERS(CMAC) 多年来, *** 医学图书馆在中华医学会和各地分会的支持下,搜集了大量的医学学术会议论文集并建立了较好的收集渠道。 为了不断满足用户的需求,增加医学信息量,建立了《中国医学学术会议论文数据库》,该数据库为目录型数据库,收录了中华医学会所属各专业分会及各省分会等组织1994年以来的全国医学学术会议论文集中的医学文献约15万余篇。该数据库与CMCC共享同一检索软件,分为单机版和网络版,数据库半年更新一次。 ●数据库规模:CMCC收录了自1994年以来1200余种中文生物医学期刊, 约180万条文献记录,并以每年26余万条速度 递增,含盖中国内地全部重要刊和核心刊。 ●收录范围:基础医学,临床医学,预防医学,医学生物学,中医药学,药学,医院管理,医学信息学等卫生相关 信息。 ●更新周期:每半月更新一期光盘, 一年24期, 几乎与到馆期刊同步。 ●字段项目:中文题名,英文题名,全部作者,第一作者地址,关键词,文摘,文献类型,出处,参考文献数,资 助项目。 ●检索功能: →支持硬盘数据库镜像,数据库选择和多库联检功能 →浏览器模式全文检索界面 →支持Win98,Win2000和Windows-NT平台 →字段(文献著录项)限定检索 →字段浏览检索:对某一字段内容进行检索,其方式可以是:等于、前缀、后缀、包含、不包含等;可选取多个字 段内容检索 →通配符(*,?) 截词检索 →高级逻辑组配检索(AND,OR,NOT) →核心刊,文献类型,出版年代,摘要标记限定检索 →检索史的保存、修改、删除,检索策略的反复调用和重新组配 →中文生物医学期刊概况浏览查询 ●输出功能: →多种输出方式:联机打印,磁盘下载,在线摘录 →加输出标记,便于批量存盘或打印 →对输出文献按不同字段进行排序 →输出字段可任意选择 →多种输出格式,任意选择 ●系统特征: →采用领先的索引技术,使检索速度更快 →操作简便,方便维护 →简洁、流畅、图标驱动的用户友好界面 →中文提示 ●运行环境:单机版:WINDOWS95以上 中文平台 网络版:WINDOWS NT局域网 中文平台 ●CMCC在医学信息业中的作用: →医学文献检索,最新中文医学期刊信息浏览 →立题查新,成果鉴定及科研课题信息跟踪服务. →图书馆资源共享 →定题服务及主动信息服务 →专题数据库基础数据源 →科研产出能力评价检索服务 →配合临床提供相关信息 →编写信息通报,撰写论文选题 *** 。 医学文献检索答案 文献检索考试(1) 1、记录有知识的一切载体――文献的定义。4要素为:知识内容、信息符号、载体材料、记录的方式和手段。 2、一次文献、二次文献、三次文献――原文献、经过有序化后的文献、经过细致整理后的二次文献。 3、文献载体:印刷型、缩微型、声像型、电子型。 4、文献出版类型及识别:图书、期刊、会议文献、科技报告、专利、标准文献、学位论文、产品资料 5、电子文献种类及识别:电子图书、电子期刊、动态电子信息 6、文献交流方式:直接交流(非正式交流)与间接交流(正式交流 7、文献分布规律:出版时间分布,当前最新的信息通过互联网以及当前最新的报纸杂志、广播电视这些媒体;2个月到10年的应该主要通过网上图书期刊类的数据库解决;5-20年前的信息除了期刊外,还可以通过印刷版的图书和手册性工具书来查找 学科分布,把一个学科有关的文献分成核心文献、相关文献和边缘文献3类 8、文献内外部特征。内容特征和外表特征:与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征。与文献信息主题内容密切相关的信息称为文献信息的内容特征 9、检索语言及种类:检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类 10 检索系统类型:目录、题录、文摘、索引 11 分类语言:上下位之间的关系反映了概念外延的包含与从属关系 12、多概念主题分类方法:应用单概念课题分类方法,并且注意并列概念课题、应用性课题这2点 13、目前常用的主题语言是关键词语言和叙词语言两种。禁用词: 无检索意义的词 14、关键词与叙词语言p43-44 详:关键词是一种自然语言性质的主题语言.是指著者在文献中使用频率比较高一些词. 15、检索步骤:1,明确课题要求;2,了解课题背景知识,归纳课程主题内容;3,分析提取课题涉及的概念;4,选择检索系统;5,实施检索和获取原文 16、检索方法:直接法,间接法:追溯法、常用法和综合法 17、文献检索对象:文献、数据和事实检索。文献检索:书目与全文检索 18、机检必备条件:物质条件和人员条件。物质条件由数据库、通信系统和检索终端组成。人员素质包括:1,对课题的了解程度;2,对检索系统的掌握程度;3,语言的掌握程度 19、数据库定义及组成:文档、记录和字段。3种类型:文字型、数值型、多媒体型。一个数据库至少包括一个顺排文档和一个倒排文档 20、顺排文挡:是将数据库的全部记录按照记录号的大小排列而成。倒排文档:是以记录的特征标识作为排列依据 21、记录表现形式:在全文数据库中,一个记录相当于一篇完整的文献;在书目数据库中,一个记录相当于一条文摘或题录 22、字段:基本字段和辅助字段 23、检索概念扩展方法:基于同一概念、基于内容分析和基于检索结果 24、截词方法:截词符一般包括“?”、“*”、“$”、“%”。截词方法注意3个问题:一是截词符要紧接在词干后面,截词符和词干之间不能由空格。二是避免将检索词的词干截得过短,一般应在三个字母以上。截词过短,不仅结果不相关得比例大,而且系统开销大。三是截词应该使用得合理。四是从希望出现得单词中取尽可能多得公共字母作为词干,以提高查准率 25、布尔逻辑算符:OR/AND/NOT 26、优先算符:加( )就可以 27、位置算符:W、N。With, Near。p69-70 详:W(with),N(near),这两个大家都知道,我就不介绍了! S(sentence):指检索的两词必须在同一句子中出现,但两词顺序可以颠倒! F(field):指两侧的检索必须在同一句子中出现,但两词顺序可以颠倒 28、字段限制:基本字段限制、辅助字段限制 29、检索结果调整方法:查全率和查准率。查全率:1,减少AND,增加OR;2,在词干相同的单词后使用截词符(?);3,去除已有的字段限制、位置算符限制。查准率:1,减少同义词或同族相关词;2,增加限制概念,用AND将她们连接起来;3,使用字段限制

文献由四要素构成:文献信息 符号系统 文献载体 记录方式医学文献特点: 1. 数量庞大2. 载体多样化3. 多种文化4. 学科交叉、出版分散5. 知识信息更新加快6. 交流传播速度加快7. 电子化发展趋势文献检索类型(1)按检出结果形式划分: 书目检索、全文检索、引文检索。(2)从情报检索角度划分:文献检索、数据检索、事实检索(3)按检索手段划分: 手工检索和计算机检索文献检索原理:外表特征 内容特征 文献标引2、文献检索系统类型 目录型、题录型、文摘型、全文型4种。查全率和查准率?检出的相关信息/检索工具中相关信息总量。P=检出的相关信息/检出的信息总量。一、 文献信息的类型1、按文献信息表现形式划分 文字型文献 视频型文献 音频型文献 数字型文献2、按文献信息出版类型划分 图书 专利文献 标准文献 期刊 学位论文 产品样本说明书 科技报告 技术档案 会议文献 政府出版物3、按文献信息的载体形式划分 印刷型 缩微型 声像型 电子型4、按文献信息的加工程度划分 零次文献信息 一次文献信息 二次文献信息 三次文献信息按文献内容加工深度分: 零次文献:书信、手稿、实验数据、观察记录、笔记、内部档案等。 特点:内容新颖,但不成熟,难以查询。一次文献:期刊论文、专利说明书、会议论文、学位论文、科技报告等。 特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。二次文献:目录、索引和文摘等。特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。三次文献:综述、进展、年鉴和百科全书等 文献检索 来源: 潘澍青的日志 l l 范围从大到小:信息〉知识〉情报 >文献 文献是贮存传递知识、情报和信息的介质。知识是文献的实质内容,载体是文献的外在形式。l l 文献由四要素构成:四要素缺一不可。l l 填 文献信息:文献的内容l l 符号系统:信息的携带者l l 文献载体:符号赖以依附的“寄主”l l 记录方式:代表文献的符号进入载体的方法和过程l l 文献是信息、知识、情报的主要载体形式。l 文献信息指文献载体上所承载的信息、知识内容。它属于信息,除具有信息的一切性质和功能外,也有自身的特点。表现为:P3①--⑤l l 文献的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。P4l l 填 选 文献的记录方式是指表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。种类P4按记录手段分:画写,雕刻,印刷,摄制,录音。按记录方法分:手工记录,机械记录,光记录,电记录,声记录,磁记录。l l 文献检索:将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。l l 广义的文献检索包括存储和检索两个过程。l l 填 选 文献检索类型l l (1)按检出结果形式划分:l l 书目检索、全文检索、引文检索。l l (2)从情报检索角度划分:对象l l 文献检索、数据检索、事实检索l l (3)按检索手段划分:l l 手工检索和计算机检索l l 3、文献检索原理l l 外表特征 内容特征 文献标引(indexing)l 文献检索系统定义P7 指根据特定的文献信息需求而建立起来的一种有关文献信息的搜集、加工、存储和检索的程序化系统。l l 文献检索系统类型P8l l 目录型、题录型、文摘型、全文型4种l l 1、按文献信息表现形式划分l l 文字型文献 视频型文献 音频型文献 数字型文献l l 2、按文献信息出版类型划分l l 图书 专利文献 标准文献l l 期刊 学位论文 产品样本说明书l l 科技报告 技术档案 l l 会议文献 政府出版物l l 3、按文献信息的载体形式划分 填l l 印刷型 缩微型 声像型 电子型l l 按文献内容加工深度分: 零次文献:是指未经正式发表或未融入正式交流渠道的最原始的文献,如书信、手稿、实验数据、观察记录、笔记、内部档案等l 特点:内容新颖,但不成熟,难以查询l l一次文献:是指以著者本人的研究成果(如实验、观察、调查研究等结果)为依据而创作的原始文献,如期刊论文、专利说明书、会议论文、学位论文、科技报告等。 l l特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。l l二次文献:是对大量的、分散的、无序的一次文献信息经过加工整序后而形成的文献。如目录、索引和文摘等。l l特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。l l三次文献:是将分散无序的某一范围的一次文献,经过综合整理后而重新组织成有条理有定评的文献,如综述、进展、年鉴和百科全书等。l l特点:对知识信息具有浓缩性和综合性的特点,同时兼有检索文献的作用。l 零次文献是形成一次文献最基本的素材;一次文献是信息的主要来源和检索对象;二次文献是检索的手段和工具;三次文献既是检索对象,同时也具有检索文献之功能。l 《医学主题词表》(MeSh)l 副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专指性。l l2、检索途径l l(1)著者途径:利用已知著者姓名作为检索标识进行文献查检。l l(2)分类途径:利用特定分类体系的分类号或分类类目作为检索标识进行文献查检。l l(3)主题途径:利用从文献中抽出来的、或经过人工规范化的、能代表文献主要内容的检索标识或标引词进行检索。l l(4)其他途径:利用特定的检索标识进行文献查检l (5)号码途径 l 2,3属于反映文献内容特征 1,5和书(刊)名途径反映文献外部特征l l中国期刊全文数据库CNKI l是我国第一个大规模集成化的全文电子学术期刊系统l l目前世界上最大的连续动态更新的中国期刊全文数据库。l l收录年限:1994年---至今,最早回溯到1915年。l l二、检索途径与方式l l1.初级检索 简单检索、多项单词逻辑组合检索、词频控制、最近词、词扩展等l “主题”检索字段:篇名、关键词、摘要内进行检索。l 2.高级检索 l 3.专业检索 所有符号和英文字母,都必须使用英文半角字符l 4.期刊导航 在主页左边l 查找中华高血压杂志2000年第1期到2009第3期发表的有关原发性高血压的文献。l l 初级检索 查找篇名中出现“高血压”或“肾衰竭” 的文献l 检索黄慧萍 2008年发表在《中华护理杂志》的文章“口腔科门诊护士工作压力情况的调查”被引用过几次 ? 要不要写表达式l 利用中国优秀硕士学位论文全文数据库查找中南大学陈方平导师指导的学位论文。请写出检索式、第一篇学位论文题名及作者。l 数据库:中国优秀硕士学位论文全文数据库l 检索式:((导师单位=中南大学) 或者 (学位授予单位=中南大学))并且(导师=陈方平) (模糊匹配);1999-2009;时间排序; 单库检索l 结果数:2l 第一篇论文题目:rAAV2/hFIX无创途径治疗血友病B的临床研究l l l l l l维 普 中文科技期刊数据库(全文库)类型:期刊全文数据库§收录范围: ?年限:1989年至今?数据量:12000多种期刊,总计1650余万篇文献,逻辑运算符A. 逻辑“与”(AND、* ) 检索式:A AND B,表示记录中同时包含检索词A和检索词B的记录才是命中记录。 例如:influenza AND cough influenza * coughB. 逻辑“或”(OR、+ ) 检索式:A OR B,表示记录中包含检索词A或检索词B,或者同时包含检索词A和检索词B的记录。 例如: vitamin c OR ascorbic acid vitamin c + ascorbic acidC. 逻辑“非”(NOT、- ) 检索式:A NOT B,表示记录中包含检索词A同时不含检索词B的记录为命中记录。 例如:influenza NOT cough, (雌激素减少 AND 冠心病) NOT 更年期妇女 (雌激素减少* 冠心病) - 更年期妇女§维普中刊库中的逻辑运算符 逻辑运算符 * 并且、与、and,在结果中搜索+ 或者 、or,在结果中添加- 不包含、非、not,在结果中除去§ §运算顺序依次为: - > * > +(非>与>或) NOT >AND >OR § §可灵活运用括号“()”改变优先级,括号内的逻辑式优先执行 § §注意:检索过程中,如果检索词中带有括号或逻辑运算符*、+、- 、()、《》等特殊字符,必须在该检索词上用双引号括起来,以免与检索逻辑规则冲突。 数据库检索途径§1.快速检索 §2.传统检索 有同义词 在左上方。 还有分类检索,在左下角 §3.高级检索 §4.期刊检索作业格式§检索方式:传统检索 同义词功能 §题名/关键词=艾滋病(爱滋病、AIDS、获得性免疫缺陷综合症) §题名/关键词=监测 二次检索 §检索结果数:?篇 §第一篇文献标题: § 作者: § 出处: §检索方式:期刊检索 §刊名:中华医学杂志 §在本刊中检索:甲状腺炎 §结果数: 篇 §抄第一条记录的题录(标题,作者,出处)PubMed数据库简介 是美国NLM所属的国家生物技术信息中心(NCBI)开发的一个以Web方式向用户提供服务的生物医学文献检索系统,是目前世界上查找医学文献利用率最高的网上免费数据库PubMed的数据范围 内容MEDLINE OLDMEDLINE(1950-1965) PreMedline 出版商提供的书目信息l l MEDLINE收录范围:来源于美国和世界上70多个国家和地区、50种语言的7395种(截止到现在)权威生物医学及相关学科期刊,内容涉及生物医学各个领域;85%以上原文为英语,80%±记录有文摘,5%免费全文。目前记录已达约1900万条,约40万篇/年 。 回溯时间:1966年至今。记录中有[indexed for MEDLIEN]标记 使用词表:MeSH(医学主题词表)PreMEDLINE是一种由正在加工处理中的文献记录组成的数据库,这些新记录还未被或正在标引,暂时存放在PreMEDLINE数据库中。l l记录中有[PubMed-in process]的标记。出版商提供的书目信息出版商直接向PubMed提供的非Medline收录的电子刊物,记录标有[Record as supplied by publishers]标记。(如:Science或Nature中的地质文献等)。 Nucleotide:DNA序列数据库Protein:蛋白质序列数据库Genome:基因组序列数据库Structure:分子结构模型数据库OMIM:人类孟德尔遗传学在线数据库PMC: PubMed中心,免费全文期刊检索PubMed的检索途径和方法基本检索 高级检索 主题检索 药物:副主题词是治疗应用(therapeutic use)疾病:副主题词是药物治疗(drug therapy) 期刊检索 Journal Database 专用检索(一)基本检索PUBMED提供了词汇自动转换功能: MeSH转换表 期刊转换表 短语表 作者姓名索引 逻辑运算符检索2检索运算符(1)逻辑运算符: OR、AND、NOT 运算顺序:NOT>AND>OR,可用()改变检索词的处理顺序。(2)截词符:*。eg: cell*:cell、cells、celliferous、cellophane和cellular等词的文献。(3)利用字段标识符进行限定检索: 检索式格式:检索词A[字段标识B],检索在字段中含有检索词A的文献。 如: hepatitis[TI],smith [AU],cell[TA]。(4)“ ”,将短语做为不可分割的整体进行检索。 如:“OXYGEN FREE RADICALS ”注意:AND 必须大写、[ ]和“ ”必须为英文或中文半角。姓在前,名在后 姓全称,名缩写(二)PubMed高级检索Limits (限定)Publication Types:有7种类型Languages:提供常用的7种语种Ages:共有13个年龄段Gender:男性、女性Human or AnimalSubsets(子集):11个主要子集Dates:可检索1965年至今的文献主题检索:1、点击MeSH Database Mesh界面 输入检索词 Go2、选定该主题词 主题词轮排表 点击该主题词 主题词细节屏 3、主题词细节屏(主题词词义注释、副主题词、加权或不扩展、入口词、曾用词、树状结构) 选择合适的副主题词选择加权或不扩展 send to4、search box 点击 search PubMed 检索结果ScienceDirect 是Elsevier公司的核心产品,是全学科的全文数据库,集世界领先的经同行评审的科技和医学信息之大成,得到130多个国家认可,中国高校每月下载量高达250万篇。二、检索运算符AND 默认算符,要求多个检索词同时出现在文章中 OR 检索词中的任意一个或多个出现在文章中 AND NOT 后面所跟的词不出现在文章中 通配符 * 取代单词中的任意个(0,1,2…)字母 通配符 ? 取代单词中的1个字母 W/n PRE/n 两词相隔不超过n个词,词序不定 两词相隔不超过n个词,词序一定 “ ” 宽松短语检索,标点符号、连字符、停用字等会被自动忽略 ‘ ’{} 精确短语检索,所有符号都将被作为检索词进行严格匹配 ( ) 定义检测词顺序,例:(remote OR satellite) AND education 作者检索 先输入名的全称或缩写,然后输入姓,例: r smith ; jianhua zhang 临近符可以用于作者检索,raymond W/3 smith 可检索到 Raymond Smith, Raymond J. Smith and Raymond J. §临近检索 §W/n 两词相隔不超过n个词,词序不定。 例:pain W/5 morphine §PRE/n 两词相隔不超过n个词,先后次序固定。 例:behavioural PRE/3 disturbances §两种临近符不能同时使用检索-Search: 检索语言§检索优先级 §默认检索顺序 1. OR 2. W/n | PRE/n 3. AND 4. AND NOT 例:检索包含kidney或者renal,并且包含therapy的文章 kidney OR renal AND therapy §使用( )限定检索次序 例:(remote AND NOT satellite) AND education增加“Specific author”字段,作者检索更加准确;意味着检索词必须出现在同一个人的名字中。三、检索方法§系统提供了四种检索功能: §Browse 浏览检索 §Quick Search 快速检索 §Advanced Search 高级检索 §Expert Search 专家检索 l 字段名和布尔逻辑符均不区分大小写字段名既可以用字段全称,也可以用简写编码中文医学数据库CBM中国生物医学文献数据库 (CBM) 是中国医学科学院医学信息研究所开发研制的综合性医学文献数据库。l 收录范围: 1978 年以来 1600 多种中国生物医学期刊以及汇编、会议论文的文献题录,年增长量约 40 万条。学科覆盖范围涉及基础医学、临床医学、预防医学、药学、中医学及中药学等生物医学的各个领域。l 数据标引CBM的全部题录均根据美国国立医学图书馆最新版《医学主题词表》(即MeSH词表)、中国中医研究院中医药信息研究所出版的《中国中医药学主题词表》进行主题标引,以及《中国图书馆分类法 · 医学专业分类表》进行分类标引。 (一)数据库结构l lCBM数据库的记录包括30多个可检索数据项l l AB 文摘l l AD 地址 (第一著者地址)l l AU 著者l l CN 国内代码 (国内期刊代码)l l CL 分类号l l CT 特征词l l FS 资助类别l l MH 主题词l l PY 出版年l l IS ISSN (国际期刊代码)l l VI 卷l l PT 文献类型l l RF 参文数 (参考文献数)l l (SO) 出处 (复合字段:TA,PY,VI,IP,PG)l l TA 期刊名称l l TI 中文题目l l TW 关键词CBM数据库检索运算符A. 逻辑“与”(AND ) 检索式:A AND B,表示记录中同时包含检索词A和检索词B的记录才是命中记录。 例如:肝炎 AND 肝癌 高血压 AND 糖尿病B. 逻辑“或”(OR ) 检索式:A OR B,表示记录中包含检索词A或检索词B,或者同时包含检索词A和检索词B的记录。 例如: 肝炎 OR 肝癌 维生素A OR 维生素BC. 逻辑“非”(NOT ) 检索式:A NOT B,表示记录中包含检索词A但同时不含检索词B的记录为命中记录。 例如:流感 NOT 咳嗽, (雌激素减少 AND 冠心病) NOT 更年期妇女二)系统运算符l l布尔逻辑运算符的优先顺序依次为NOT>AND>OR,CBMl l通配符:(1)单字通配符?:替代一个字符。如“门?脉”,可检出:门静脉、门动脉等。l l注意:?必须为半角状态。l l (2)任意通配符%:替代任意个字符。如“肝炎%疫苗”,可检出:肝炎疫苗、肝炎病毒基因疫苗、肝炎减毒活疫苗、肝炎灭活疫苗等。l l3.强制执行符/短语检索符“”l l检索词做为短语或含有特殊符号“-”、“(”等,用英文半角双引号标识检索词,如: “1,25-(OH)2D3”CBM检索方法l l1、基本检索 也称自由词检索或关键词检索l 关键词:来自于文献的篇名、文摘或正文中的文本词,是指能代表文献主题内容实质的、未经或略经规范化处理的自然语言。l CBMdisc默认的是基本检索状态l2、主题检索 MESH词表、汉语主题词表l l3、分类检索l l4、期刊检索 检索途径:期刊导航、刊名、出版地、出版单位、主题词等。l l5、作者检索l l6、限定检索 点更多限定 是把年代、文献类型、研究对象等常用的限定条件整合到一个对话框,方便检索。 系统默认为题录格式, 显示:标题、作者、作者单位、出处。示例1:微量元素的分析审题:两个主题概念,即阿司匹林和哮喘具体分析:应为阿司匹林/副作用方面的文献、哮喘/化学诱导方面的文献,两者关系为“AND” #1 阿司匹林/副作用 #2 哮喘/化学诱导 #3 #1 and #2审题:两个主题概念,即慢性肾衰竭和贫血具体分析:应为慢性肾衰竭/并发症方面的文献、贫血/病因学方面的文献,两者关系为“AND#1 肾衰竭,慢性/并发症 #2 贫血/病因学 #3 #1 and #2 注意:慢性肾衰竭要倒置为肾衰竭,慢性Internet的基本功能 E-mail FTP(文件传输) Telent(远程登录) WWW(信息检索)搜索引擎一般由三部分组成: 搜索软件 首先由搜索器(或称网络机器人)以特定的策略自动或人工地遍历整个互联网,并对信息进行辨别和收集,同时将它们下载并返回至搜索引擎的临时数据库;索引软件 然后,索引器(或称为标引程序)将这些保存的信息进行自动标引形成有规律的索引,再加入到集中管理的倒排索引数据结构中; 检索软件 最后,由检索软件接受用户的检索提问,向索引数据库提交用户的检索提问,从而使数据库输出与之相匹配的结果按检索功能分: 主题分类指南式搜索引擎 关键词式搜索引擎 按检索范围分: 独立搜索引擎 集成搜索引擎 引擎之引擎按检索内容分: 综合搜索引擎 Google(谷歌)、百度、搜狐和新浪 专业搜索引擎 主题词进行规范词转换 Medical Matrix、Health A to Z、Doctor’s guide、Medscape 专题搜索引擎 专门收录某一专题信息的搜索引擎。如天气预报网、旅游网、导购网、中国眼科医生网等等。搜索引擎的检索途径 通常可以分为以下三种:简单检索 关键词式搜索引擎高级检索分类(分模块)检索——主题分类指南式搜索引擎oogle允许以多种语言进行搜索,在操作界面中提供多达46种语言选择,包括英语、主要欧洲国家语言、日语、中文简繁体、朝语等,同时还可以在多达239个国别进行选择。Google的主要特色 相关的检索词网页快照 类似网页定位检索功能Google的特殊功能1.高级检索2.语言工具学术搜索

信息检索论文2021

如果贵校对毕业论文论文的创新要求不高,你可以找几篇国内硕士论文或博士论文作为参考。然而,我们对博士论文的要求可能更高,因为博士论文通常需要一系列问题研究。看过后可能会更迷茫,建议大家还是找几篇名校的硕士论文,那么如何寻找需要的论文文献呢?推荐对2019-2021年的文献进行检索,看看哪些发表的硕士论文与你的论文题目相关,找两三个质量更高的论文,看看他们题目中哪些变量相同。我们就可以通过三个或四个主要变量进行重新组合,然后进行修改以及其中调整其中一到两个不同的变量。通过使用这种方式方法可以进行快速地选择属于自己的一个题目,假如贵校对论文的创新要求很高,我建议您直接搜索一下国外的文献,选择好的或好的研究方向,一般国外有研究过了,选择这样的题目会更有新意,参考资料会更多。在您搜索时,我们要注意自己设定好搜索时间管理范围,然后您可以点进去看看哪个题目顺眼,这样就能出一个新的论文题目,这样决定一个新的论文题目,这样选出来的题目才有意义。

同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。二、信息检索信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。三、知识检索知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

相关百科

热门百科

首页
发表服务