信息检索的学术论文

“信息资源共享”课程检索报告一检索课题数字图书馆个性化服务研究现状二主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取所需资源的可能性则越来越少, 用户需求的专业化、垂直化激化了数字图书馆大量信息数据库与用户需求之间的矛盾。1999 年, 美国图书馆与信息技术联合会(LITA) 10 位著名的数字图书馆专家在研讨会上, 把个性化定制服务列为数字图书馆发展的7 大趋势之首。目前, 数字图书馆个性化的信息服务已经开始得到普遍的关注, 人们正在为提供个性化信息服务做出努力的尝试。数字图书馆个性化服务是近几年数字图书馆研究中受到关注较多的一个研究方向，数字图书馆个性化服务是基于信息用户的信息使用行为，习惯，偏好，特点及用户特定的需求，来向用户提供满足其个性化需求的信息内容和系统功能的一种服务。关于数字图书馆个性化服务研究现状，该主题涉及到：（1）数字图书馆个性化服务的有哪些介绍（2）数字图书馆个性化服务的模式有什么（3）数字图书馆个性化服务的技术研究有哪些（4）数字图书馆个性化服务研究的最新进展（2005年-2007年）三检索情况（一）检索工具1．维普中文期刊数据库（1989-2007）2．中国期刊全文数据库（1994-2007）（二）检索过程1．检索途径关键词题名主题词2．检索用词数字图书馆关键词或题名、主题词个性化服务关键词或题名、主题词3．检索策略（1）维普中文期刊数据库(题名或关键词=数字图书馆)*(题名或关键词=个性化服务) 在高级检索中选择题名或关键词字段，输入“数字图书馆”和“个性化服务”两个检索词进行限定，年代限定在2005-2007年，共检索出78条记录。（2）中国期刊全文数据库（题名或关键词=数字图书馆）* (题名或关键词=数字图书馆)在高级检索中选择篇名字段，输入“数字图书馆”与“个性化服务”，年代限定在2005-2007，共检出89条记录。四检索结果分析（一）检索结果经检索上述两个数据库，有关数字图书馆个性化服务的研究论文众多，现选出其中具有代表性，研究主题未重复的文献。1．中国期刊全文数据库（1）数字图书馆个性化信息服务系统研究刘燕平图书情报工作 2006/S2（2）数字图书馆个性化服务系统分类体系问题叶红科技信息(学术研究) 2007年13期（3）浅析智能搜索引擎技术及其在数字图书馆个性化信息服务中的应用王林廷高校图书情报论坛 2006年01期（4）数据挖掘技术在数字图书馆个性化服务中的应用朱冰冰科技情报开发与经济 2006年24期（5）数字图书馆个性化信息服务发展研究马维华郑州大学学报(哲学社会科学版) 2006年06期（6）智能推送技术在数字图书馆个性化服务中的应用石岩情报探索 2006年11期（7）基于文本过滤的数字图书馆个性化服务技术张帆计算机工程与应用 2006年31期（8）数字图书馆信息门户的个性化服务模式何平中国信息导报 2006年08期（9）网络信息技术下的数字图书馆个性化服务张丹林区教学 2006年07期（10）MyLibrary——数字图书馆个性化服务新趋势杨华农业图书情报学刊 2006年08期（11）基于Web服务组合的数字图书馆个性化动态定制服务构建张晓青情报学报 2006年03期（12）校园网中数字化图书馆个性化服务的实现朱江峰科技经济市场 2006年01期（13）数字图书馆的个性化推送服务白雪松图书馆杂志 2005年09期（14）Web日志挖掘在数字图书馆个性化服务中的应用王英培科技情报开发与经济 2005年22期（15）国内外数字图书馆个性化信息服务系统的功能与特征比较研究张俊情报理论与实践 2005年06期（16）基于知识管理的数字图书馆个性化服务机制研究郭琳四川图书馆学报 2004年05期2．维普中文期刊数据库（17）基于Web挖掘的数字图书馆个性化技术研究王艳张帆情报杂志 2007年1期（18）基于文本过滤的数字图书馆个性化服务技术张帆杨炳儒计算机工程与应用 2006年31期（19）数字图书馆信息门户的个性化服务模式何平陈有志中国信息导报 2006年8期（20）个性化服务深度与广度解决方式探讨刘月胜数字图书馆论坛 2006年6期（21）个人数字图书馆模式的分析石德万李军现代情报 2005年9期（22）数字图书馆个性化信息环境与服务构建杜安平韶关学院学报 2005年3期（23）数字图书馆个性化信息服务的技术实现张云瑾许春漫农业图书情报学刊 2005年6期（24）个性化信息服务的模式研究及策略分析杜春光国家图书馆学刊 2005年2期（二）检索结论文献一论述了个性化信息服务的涵义,阐述数字图书馆开展个性化信息服务的有利条件,国内外图书馆的有关研究开发状况,分析国内数字图书馆个性化信息服务系统应用实例,并时其工作流程,主要功能进行剖析,指出该系统目前存在的问题,提出改进对策。文献二围绕数字图书馆个性化服务系统分类体系问题展开探讨。首先,简要介绍数字图书馆个性化服务系统的主要内容,包括其定义和服务内容。其次,从用户分类和信息分类两个方面阐述目前数字图书馆个性化服务系统存在的问题。用户分类主要存在的两个问题,根据用户特点分析提出相应建议。信息分类问题从五个方面进行讨论,列举数字图书馆个性化服务系统页面进行分析,提出解决方法。文献三介绍了智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以这一技术为基础构建数字图书馆的个性化服务系统,是数字图书馆信息服务的现实需要。文章论述了当前搜索引擎存在的不足,概述了智能搜索引擎的原理机制及其优越性,探讨了该技术在数字图书馆个性化服务中的应用。文献四阐述了数字图书馆的定义,介绍了个性化服务的工作原理和国内外个性化服务系统的现状,探讨了分类模型、关联模型、序列模型、聚类模型、回归模型以及时间序列模型的原理,对如何把其用在数字图书馆的个性化服务上以描述用户需求,提出了建议。文献五介绍了数字图书馆个性化信息服务是当今图书馆发展的重要趋势,目前国内外都已有比较成熟的数字图书馆个性化信息服务系统,服务方式及其功能也多种多样,但是探索图书馆个性化信息服务有效模式的任务仍很艰巨。文献六介绍了智能推送技术和个性化服务的内容,讨论了将智能推送技术应用于数字图书馆个性化服务,以及智能推送技术存在的优势与不足。文献七提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献八试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展建势。文献九简述了数字图书馆个性化服务的内涵,分析了网络信息技术对其各项服务的支撑,并通过My Library实例对这些具体技术的集成化运用加以探讨,为构建可互操作的数字图书馆个性化服务系统提供参考。文献十就My Library(我的图书馆)的产生,及其概念、类型、特征、原理、功能等诸方面做了简要的论述,并介绍了它在国内外的发展现状,指出其今后的发展方向。文献十一介绍了Web服务组合是一种利用现有Web服务动态构建新的能满足用户需求的复杂Web服务的Web服务技术。将数字图书馆各种资源组件、应用组件、功能组件和管理组件进行Web服务描述,人们就能利用Web服务组合技术根据用户的个性化需求实现对不同数字图书馆各种组件的动态集成,从而实现开放环境下数字图书馆的个性化动态定制服务。本文讨论了基于Web服务组合的数字图书馆个性化动态定制服务的基本系统架构、构建模型,并对构建过程中需要注意的几个问题展开了讨论。文献十二介绍了数字化图书馆建设是图书信息化发展的必然,而个性化服务能够根据用户不同的特点,提供切实的服务,以更好地为读者服务。本文对数字化图书馆的个性化服务进行了讨论,分析了关键的实现技术,并给出了部分核心代码。文献十三介绍了个性化推送服务是数字图书馆研究的热点,也是建设数字图书馆的关键问题之一。本文针对各种不同的信息形式提出了相应的实现方案,并对实际操作中的几个难点事项做了简要讨论。文献十四介绍了Web日志挖掘的基本概念和过程,指出通过对读者在数字图书馆服务中留下的日志信息进行挖掘,可以实现个性化服务,更好地满足不同类别读者的需求。文献十五从个性化信息服务的概念入手,介绍了个性化信息服务的几种类型,包括分类定制服务、信息推送服务、智能代理服务和垂直门户服务等,并介绍了目前国内外若干图书馆已经开展的个性化信息服务的典型应用实例。在此基础上总结了这些个性化信息服务系统的共同功能与特征,并进行了一些比较研究。文献十六介绍了构建一个基于信息过滤技术的信息服务系统是数字图书馆实现个性化信息服务的有效手段。通过对信息过滤技术概念的研究和与信息检索概念的比较,抽象出此类系统的一般模型,并沿用查全率和查准率评价信息过滤的效果,最后分析了个性化信息服务系统实现的关键技术。文献十七提出一种基于Web挖掘技术的个性化实现策略，针对数字图书馆资源的文献，改进了经典的算法，分别从Web内容挖掘、结构挖掘和日志挖掘出发，建立用户动态的兴趣特征模型，使之更具有实用性和针对性。文献十八提出在数字图书馆的应用中，个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术，通过在向量空间内建立用户兴趣模型和文本内容特征模型，计算它们的相似度后，将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法，最后给出了在实际的数字图书馆工程中的验证结果。文献十九试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展趋势。文献二十提出数字图书馆的个性化服务决定了它在借助网络技术的基础上向学科馆和联盟制方向发展，以提高资源的利用率和解决个性化服务的深度与广度问题。文献二十一根据个人数字图书馆文献信息资源存储位置的不同．把个人数字图书馆划分为远程个人数字图书馆和本地个人数字图书馆两种模式，着重对这两种模式的个人数字图书馆的功能特点进行比较分析。文献二十二提出构建数字图书馆的个性化信息服务实际上就是要在数字图书馆上实现个性化资料、个性化检索、个性化过滤、个性化服务等四种环境．数字图书馆可以开发个人图书馆、检索帮助、个性化信息咨询、信息代理、垂直门户等多种个性化信息服务。文献二十三阐述了数字图书馆个性化信息服务的概念、研究与应用的现状，并分析了实现数字图书馆个性化信息服务所需的技术。文献二十四强调个性化信息服务在数字图书馆中有其特定的定义，也是数字图书馆发展中的必需。根据网络环境下图书馆信息服务的内容及用户行为的不同，可以有多种个性化服务模式，有策略地开展服务。（三）结果分析从2005-2007年所发表的关于图书馆学个性化服务的论文可以看出，研究的主题和方向主要集中在以下几个方面：1．数字图书馆个性化服务的概念研究。在中国期刊全文数据库检索到的89篇文章中，有40篇是论述图书馆个性化服务概念的研究。在这些文章中作者都对数字图书馆个性化服务概念有自己的认识，对于这个概念的研究也越来越深入。2．数字图书馆个性化服务的方式研究。对于数字图书馆个性化信息服务模式, 也在摸索实践中。目前有以下几种方式：（1）信息分类定制服务方式。分定制是指信息用户可以按照自己的目的和需求，在某一特定的系统功能和服务形式中，自己设定信息的资源类型、表现形式，选取特定的系统服务功能等。（2）信息推送服务方式。是运用推送技术（push technology）来实现的一种个性化主动信息服务的方式。（3）信息智能代理服务方式。它是一种能够完成委托任务的计算机系统，能模仿人的行为执行一定的任务，不需要或很少需要用户的干预和指导。通过跟踪用户在信息空间中的活动，自动捕捉用户的兴趣爱好，主动搜索可能引起用户兴趣的信息并提供给用户。（4）信息垂直门户服务方式。通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工，以满足用户基于专业的深入的信息需求。（5）信息帮助检索服务方式。如何帮助用户进行高效的信息检索也是当今数字图书馆信息服务向纵深发展的一个重要内容。（6）数据挖掘服务方式。从数据库中发掘人们感兴趣的知识，这些知识是隐含的、潜在的，目的是帮助用户寻找数据间潜在的关联。（7）信息呼叫中心服务方式。主要利用电话、传真等方式来服务客户，处理简单的呼叫流程。在这些方式中，现在比较热门的个人图书馆（My library）是上述部分个性化服务方式的具体应用，是当前开发应用较为成熟的图书馆个性化服务模式系统，也是一个完全个性化的私人信息空间。3．数字图书馆个性化服务关键技术研究。数字图书馆个性化信息服务的应用技术, 集现代信息技术之大成。它包括推送技术、智能代理技术、智能搜索引擎技术、网页动态生成技术、数据挖掘技术、信息过滤技术、过程跟踪技术、安全身份认证技术、数据加密技术等, 这些都可以为数字图书馆的个性化服务方式提供技术支持。4．国内外数字图书馆个性化服务现状研究。还有一部分论文是主要介绍当今国内外数字图书馆个性化服务的现状，通过介绍这些先进的技术和模式来指导我国数字图书馆个性化的服务。5．其他研究。除了数字图书馆个性化信息服务的概念、模式、技术和国内外研究现状外, 数字图书馆个性化信息服务的研究还就数字图书馆个性化信息服务的模型构建、用户评价、馆员角色的变化、存在的问题与对策等作了深入探讨。综上所述，这两年国内有关数字图书馆个性化服务的研究可谓是硕果累累，随着对数字图书馆个性化信息服务理论研究和实践的不断深入，我国数字图书馆个性化信息服务一定能够真正实现以用户需求为中心, 利用数字图书馆信息资源开展不同层次的、多种类型的、满足用户个性需求的有效信息服务。五检索情况总结由于这个学期开了数字图书馆这门课，对于数字图书馆有一些简单的了解，特别是对个性化信息服务这部分内容有兴趣，课本上涉及得比较少，所以就把这个内容作为了检索主题。在选择检索工具时选择了平时最常用的两个检索工具，本来还选用了中文Google，想找一下国内在研究这个主题的项目或者网站，但是检索到的内容数量实在太庞大，而且检索到的大量结果都来自各个数据库的论文，最后就放弃了使用搜索引擎。在构造检索策略时，因为该主题比较简单，不用构造很复杂的检索式，就选择了“数字图书馆”和“个性化服务”作为关键词，开始有想到是不是需要使用与“数字图书馆”概念相近的“电子图书馆”或者“虚拟图书馆”，但考虑到国内现在已经比较统一的使用“数字图书馆”这个概念，使用其他两个词检索到的文章不多，所以还是以数字图书馆为重点。检索途径选择了关键词，题名以及主题词，在使用中国期刊全文数据库进行检索时，一开始是使用关键词作为检索途径，检索出423条记录，但是有很多文章与该主题相关度不高，所以采用了篇名作为检索途径，这样两个词同时限定在文章题名中，检索的相关度就非常高，但也可能会造成漏检。觉得自从学习检索课程以来，检索最难的就是检索式的构造，检索式构造的好与坏，直接关系到检索结果的好坏。维普提供的字段有题名或关键词字段，使用高级检索将两个检索词都限定在这个字段中，检索出来的结果相对比较精确。检索完成之后，接下来的工作就是分析检索结果，这其实也是难度挺大的一项任务，要看完150几篇文章不是一件简单的事，文摘和篇名这个时候就帮了很大的忙了，一般看文摘可以略知一二，需要了解详细内容的再打开全文阅览。从文章中归纳出研究的主要内容和方向，找出比较有特色而又不重复的内容，最后再整理出结论，这就是我整个辛苦但却有趣的检索过程。通过完成这次作业，首先就是复习与巩固了以往的知识，平时虽然也经常在进行检索，但是严格按照检索步骤进行的就不太多，也没有这么有条理的对整个检索过程做一个安排，并按照计划一步一步的执行，直到完成检索结果。其次就是以往做作业都是完成老师布置的具体任务，有些题目比较简单或是比较有兴趣的检索起来还好，有些比较深奥的主题做起来真的十分困难，没有专业背景，拿到题目和检索出来的结果就觉得十分茫然。而这次老师让我们自己选择题目，我就可以从自己的兴趣和想了解的领域下手，这样完成作业的过程也不再那么枯燥，兴致自然也大了很多。还有最重要的是，做作业的目的不只是完成作业，更重要的是有收获，巩固了检索知识自不用说，通过这次阅读大量文章，也算对所检索的主题有了一个大概的认识和了解，增长了知识，开阔了视野，可是说从完成这次检索作业中的确是收获不少。

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来，互联网得到了迅速的发展，网上信息资源愈来愈庞大，且信息具有量大、分散、异构等特性，因此，传统的Web信息检索工具开始暴露出它性能低下的一面，具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录，根本无法从中再细找，或者找到的内容和要找的内容不是一个专业领域的，造成信息无效的现象。但随着人们信息意识的增强，对信息内容及信息服务的需求也在不断的演变和发展，对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务，使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构，它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理，为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计网格计算是近年来国际上兴起的一种重要信息技术，其目的是将网上各种资源组织在一个统一的大框架下，为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台，实现互联网上所有资源的全面连通，实现信息资源的全面共享。为解决不同领域复杂科学计算与海量信息服务问题，人们以网络互连为基础构造了不同的网格，他们在体系结构，要解决的问题类型等方面各不相同，但网格计算至少需要具有三种基本功能：资源管理、任务管理、任务调度。本文设计的信息检索体系结构，围绕网格计算的基本功能及信息检索的特点，主要有以下三个层次组成：见图1（1）网格结点：结点是网格计算资源的提供者，本系统主要是由一系列的集群系统组成，它们在地理位置上是分布的，构成了一个分布检索群体，作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理，维护和查询。（2）网格计算中间件：中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分，它根据用户的信息请求任务，在整个网格内负责信息资源的匹配、定位，实现用户任务到集群系统的映射。（3）网格用户层：主要为用户应用提供接口，支持用户对所需要的信息资源进行描述、创建、提交等。图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统，集群系统对集群内的资源进行管理和任务调度，再利用网格中间件对各集群系统进行管理，从而形成对整个网格资源的管理，并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略，又可利用中间件在全局意义上对网格信息资源进行管理。集群系统的设计由于Web信息资源数量十分庞大，用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题，往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体，并使其从客户端看来就如同一台服务器在服务，这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略，将Web信息资源按地区按专业内容分割，一方面使信息资源数量相对缩小，便于数据的组织、管理和维护，另一方面按专业内容易于制定一个公用的XML规范，便于集群内各类信息资源的描述，从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent，基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。资源服务Agent根据信息资源请求任务，利用XML信息集成系统提供的数据，为用户提供实际的资源检索操作，并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法：XML（the eXtensible Markup Language）是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准，它是一种可以对信息进行自我描述的语言，它允许开发人员通过创建格式文件DTD（Document Type Definitions）定制标记来描述自己的数据，DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本，因此具有跨平台的优点，XML的优点在于（1）简单、规范性：XML文档基于文本标签，有一套严谨而简洁的语法结构，便于计算机、用户理解；（2）可扩展性：用户可以自定义具有特定意义的标签，自定义的标签可以在任何组织、客户、应用之间共享；（3）自描述性：自描述性使其非常适用不同应用间的数据交换，而且这种交换是不以预先定义一组数据结构为前提，因此具有很强的开放性；（4）互操作性：XML可以把所有信息都存于文档中传输，而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用，因此它为基于特定专业内容的表达提供了一种极好的手段，可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类：存入仓库法（the ware-housing approach）和虚拟法(the virtual approach)，可使用这两类方法利用XML在数据组织和交换方面的优越性，采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射，建立基于XML的Web信息集成系统，其结构与获取信息的工作过程参见文献[2]。图网格中间件的设计图3所示的网格中间件的主要功能是（1）消除不同用户与集群系统之间数据表达的差异，使信息资源数据对用户来说是透明的；（2）管理、维护Web上分布的各集群系统，网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息，对关系数据库的操作可维护集群系统的分布式逻辑，使本结构在可变性和扩充性上具有柔性；（3）接受用户的信息请求任务，能快速定位于满足要求的集群系统，通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下：（1）接收Agent模块：主要用于登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。（2）关系数据库及数据服务Agent：关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。（3）格式转换Agent模块：提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的，各用户对同一数据有不同的表示方法（对信息资源描述存在差异）由于XML文档中这种格式差异体现在与之相关的DTD/Schema上，因此经过格式转换，可使信息资源的格式对用户是透明的。（4） XML文档分析Agent模块：提取格式转换后的XML文档中各个标签，通过查询网格中间件中的关系数据库，实现用户信息请求任务与集群系统的对应关系，并得到满足条件的集群系统的相关信息，获取各集群系统的接口参数。（5）发送Agent模块：将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术，Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征，代表用户完成用户的任务，并能动态适应环境的变化更好地满足用户的需求，提高信息检索的能力。文秘杂烩网

学术论文信息检索的关键

问答题1.简述信息、知识、文献的概念及其三者之间的关系。1.答：信息：是事物存在方式、运动状态及其特征的反映，是事物发出的信号、消息。知识：是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析，加工提炼，经过系统化、理论化的结果。文献：记录有知识的一切载体三者从概念范畴上看，信息大于知识大于文献，知识是信息的一部分，是理论化系统化的信息，文献是知识中记载下来的那部分。2.文献按载体形式不同分为哪几种类型，并举例说明。2.答：文献按载体形式的不同分为：手写型文献，如甲骨文、金文印刷型文献，如图书、期刊缩微型文献，如缩微胶卷、缩微胶片视听型文献，如录像带、录音带、科技电影电子型文献，如数据库文献和网络文献3.文献的级别及其相互关系。3.答：文献按照加工程度不同分为零次、一次、二次和三次文献四种。其中零次文献是指未公开出版的实验记录、原始录音（像）、书信、手稿、口头交流的信息或实物等；零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献；根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩，后形成的文献就是二次文献；利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。4.在计算机检索中，如何缩小检索范围？4.答：在计算机检索中，缩小检索范围的方法包括：（1）增加用and连接的检索词，或用“二次检索”（2）用特定的副主题词进行限定（3）用字段限定检索，如标题词检索、主题词检索、加权检索等（4）进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索（5）进入更专指的分类范围内输词检索5.获取文献全文的方法有哪些？5.答：获取全文的方法包括：(1)检索网上全文数据库(2)利用网上出版社、杂志(3)利用图书馆馆藏目录（馆藏联合目录）(4)利用“网上全文传递服务”(5)向著者索取6.常用的检索途径有哪些？6.答：常用的检索途径包括：自由词检索、主题词检索、分类检索、著者检索、机构检索、引文检索、限定检索等7.简述信息检索的原理7.答：信息检索的原理是：将描述特定用户所需信息的提问特征，与信息存储的检索标识进行异同的比较，从中找出与提问特征一致或基本一致的信息。本质是用户的信息需求与存储在信息集合中的信息进行比较和选择，即匹配的过程。8.计算机检索通常包括哪些步骤？8.答：信息检索的步骤包括：(1)分析检索课题，明确目的和要求(2)选择合适的检索工具(3)选择检索途径，确定检索标识。(4)查找文献线索。(5)浏览检索结果，获取原始文献。9. 简述IM主题索引的编排规则。9.答：主题索引的排列规则如下(1)整个索引按主题词字顺排(2)同一主题词下按副主题词字顺排(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下，专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下(4)同一主题词或副主题词下的文献题录，先排列英文文献，后排列非英文文献，非英文文献的英译标题用"[ ]"括起，以示区别(5)英文文献按刊名缩写字顺排(6)非英文文献先按文种缩写字顺排，同一文种下按刊名缩写字顺排。10.《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。10.答：第一组：用代参照，用于处理词与词间的等同关系。在MeSH词表中，对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词，其它的词作为非主题词（即款目词）。用“款目词see主题词”和“主题词X款目词”表示。如：Cancer see Neoplasms Neoplasms X Cancer第二组：属分参照，用于处理词与词之间的等级关系，即整体与部分，上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词，包含在某些范畴较大的主题词之下，内容范围较广的词是主题词，其下的内容范围较窄的词不作主题词，只作为次要主题词。用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如：Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系，所有次要主题词升格为主题词。第三组：相关参照，用于处理词间的相关关系，达到扩大检索，提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。如：Population Control see related Family Planning Family Planning XR Population Control为提高查全率和方便检索，MeSH词表于1991年和1992年又先后增设了“还应考虑参照（consider also）”和“主题词/副主题词组配参照”。11.按照存储内容的不同，数据库通常分为哪些类型?11.答：书目数据库、事实数据库、数值数据库、全文数据库、图像数据库12.什么叫主题词的扩展检索，它的优越性何在？12.答：选择主题词的扩展功能可以同时检索主题词和它的所有下位词，这样就可检出用所选主题词和更专指主题词标引的所有文献，可以更好的提高检索的查全率。不扩展的情况下只会检出用所选主题词标引的文献，不会检出它的下位词，即那些更专指主题词标引的文献。13.什么是查全率和查准率，二者之间有何关系?13.答：查全率是指系统在进行某一检索时，检出的相关文献量与系统文献库中相关文献总量的比率，它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。查全率=【检出相关文献量/文献库内相关文献总量】×100%查准率是指系统在进行某一检索时，检出的相关文献量与检出文献总量的比率，它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。查准率=【检出相关文献量/检出文献总量】×100%查全率与查准率是呈互逆关系的。要想做到查全，势必会要对检索范围和限制逐步放宽，则结果是会把很多不相关的文献也带进来，影响了查准率。企图是查全率和查准率都同时提高，不是很容易的。强调一方面，忽视另一方面，也是不妥当的。应当根据具体课题的要求，合理调节查全率和查准率，保证检索效果。14.影响查全率和查准率的因素有哪些?14.答：（1）影响查全率的因素影响查全率的因素从文献存储上来看，主要有：文献库收录文献不全；索引词汇缺乏控制和专指性；词表结构不完整；词间关系模糊或不正确；标引不详；标引前后不一致；标引人员遗漏了原文的重要概念和用词不当等。此外，从情报检索来看，主要有：检索策略过于简单；选词和进行逻辑组配不当；检索途径和方法太少；检索人员业务不熟悉和缺乏耐心；检索系统不具备截词功能和反馈功能，检索时不能全面地描述检索要求等。（2）影响查准率的因素影响查准率的因素主要有：索引词不能准确描述文献主题和检索要求；组配规则不严密；选词及词间关系不正确；标引过于详尽；组配错误；检索时所使用检索词专指度不够，检索面宽于检索要求；检索系统不具备逻辑“非”功能和反馈功能；检索式中允许容纳的词数量有限；截词部位不当，检索式中使用逻辑“或”不当等。15.独立型搜索引擎的工作原理是什么？15.答：独立式搜索引擎的工作原理是：定期运行搜索软件（或人工），搜集网络信息。利用索引软件进行自动标引，建立数据库。以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面，由用户输入检索式。通过检索软件进行检索，匹配，按相关度排序输出。16.如何提高检索的查全率？16.答：提高查全率的方法：（1）降低检索词的专指度，选出一些上位词和相关词补充到检索式中。（2）调节检索式的网罗度，减少逻辑“与”的组配面。（3）进行族性检索，可采用分类检索，或用一组同义词、近义词和相关词，用“或”连接在检索式中。（4）采用截词技术，取消某些限制过严的限制符。17.如何提高检索的查准率？17.答：提高查准率的方法：（1）提高检索词的专指度，换用专指度较强的规范词或自由词。（2）增加“与”连接，进一步限定主题概念。（3）限定检索词所在的可检字段，用位置算符控制检索词的词间顺序与位置。（4）限制输出文献的外部特征，如限制年限、语种、文献类型等。（5）用逻辑“非”限制与提问不相关的文献的输出。（6）用主题词检索，不用或少用自由词检索。18.依据我国专利法专利有哪几种类型各种类型的专利有效期为多长？18.答：依据专利法保护对象分三种类型:发明专利、实用新型专利、外观设计专利发明专利，是专利法主要的保护对象。发明专利权有效期各国不同，我国为自申请之日起20年。实用新型专利，在我国实用新型专利权有效期为自申请之日起10年。外观设计专利，在我国外观设计专利权有效期为自申请之日起10年。19.信息检索系统的基本要素是什么？19.答：信息检索系统的构成包括：（1）检索文档，即文献检索标识的有机集合。（2）技术设备，即能存储信息及其标识，并实现存储和检索操作的各种技术设备。（3）作用于系统的人如：文献加工者、用户、系统维护人员、管理人员。（4）检索工具如：检索语言、文献标引规则、输入输出标准等。20.何谓数据库的顺排文挡和倒排文挡？20.答：顺序文档(Sequential file)是以文献记录作为信息存储单元，按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档，由于它存储有关于每篇文献的最完整信息，所以通常又把它称为主文档（Master File），相当于印刷型检索工具的正文部分。倒排文档（Inverted file）就是把记录中一切可检字段或属性值抽出，按某种顺序重新加以组织后所得到的一种文档。倒排档从主文档中派生出来，所以，又叫做辅助文档。21.获取网络信息资源的主要工具有哪些？21.答：获取网络信息资源的主要工具包括：（1）电子邮件（2）FTP（3）Archie（4）Telnet（5）Gopher（6）Usenet（7）www浏览器（8）搜索引擎22. 核心期刊的主要特点是什么？22.答：少数刊载某一学科大量高质量专业论文的期刊称为核心期刊，其主要特点为：（1）刊载专业文献密度高，信息含量高；（2）水平较高，代表本学科的最新发展水平；（3）出版相对稳定，所载文献寿命较长；（4）利用率和被引率较高。23.试述因特网搜索引擎的概念、类型。23.答：搜索引擎是Internet上具有查询功能的网页的统称，即允许用户递交查询，检索出与查询相关的网页结果列表，并且排序输出。根据检索内容分为：综合性搜索引擎和专业性搜索引擎；根据检索功能分类：目录式搜索引擎、全文式搜索引擎、智能式搜索引擎；根据检索范围分类：独立搜索引擎和元搜索引擎。24.简述会议论文的概念和特点，国内和国外会议论文的检索系统有哪些？24.答：会议文献是指各种科学技术会议上所发表的论文、报告稿、讲演稿等与会议有关的文献。会议文献的主要特点是：传播信息及时、论题集中、内容新颖、专业性强、质量较高，数量较大，出版类型多种多样，往往代表某一学科或专业领域内最新学术研究成果，基本上反映了该学科或专业的学术水平、研究动态和发展趋势。会议文献是科技查新中重要的信息源之一。国外会议论文检索工具包括：ISI的Proceedings(ISTP+ISSHP)；Papers First(OCLC first search的一个子库)；IEEE/IEE Electronic Library；AIPCofference Proceedings国内可以进行会议论文检索的系统包括：中国学术会议论文全文数据库（万方数据）；中国重要会议论文全文数据库（CNKI）25. 周红同学在检索一个课题时，第一次检索的结果有 172 条文献，你建议一下她采用何种方式来缩小检索范围？25.答：缩小检索范围的方法包括：(1)提高检索词的专指度，换用专指度较强的规范词或自由词。(2)增加“与”连接，进一步限定主题概念。(3)限定检索词所在的可检字段。(4)用位置算符控制检索词的词间顺序与位置。(5)限制输出文献的外部特征，如限制年限、语种、文献类型等。(6)用逻辑“非”限制与提问不相关的文献的输出。(7)用主题词检索，不用或少用自由词检索。和Pubmed有什么区别？26.答：Pubmed和MEDLINE的区别主要体现在：（1）文献的收录范围：Pubmed除了收录MEDLINE数据库之外，还收录了PREMEDLINE数据库，以及出版商直接提供给Pubmed的数据。（2）数据库的更新时间：MEDLINE联机数据库为周更新，MEDLINE光盘的报道时差为1-3个月，而Pubmed为每天更新（3）检索机理：MEDLINE的检索途径只有两个主题和作者，掌握Mesh表是检索的首要条件，而Pubmed具有词汇自动转换匹配功能和主题词自动扩展功能。（4）连接功能：Pubmed具有与原文链接、相关文献链接、相关图书链接、相关分子生物学数据库链接的功能（5）免费全文：Pubmed提供超过60中期刊的免费全文浏览和检索功能。（6）费用：MEDLINE光盘需每年租赁数据库，Pubmed免费。27.专利文献的概念及特点是什么？27.答：专利文献是实行专利制度的国家及国际组织在审批专利过程中产生的官方文件及其出版物的总称。专利文献具有以下特点：（1）专利文献集技术、法律和经济信息于一体，是一种数量巨大、内容广博的战略性信息资源；（2）利文献传播最新技术信息；（3）专利文献的格式统一规范，高度标准化，并且具有统一的分类体系，便于检索、阅读；（4）专利文献对发明创造的揭示完整详尽，技术内容相对可靠。28.如果要查找有关“乙型肝炎流行病学”方面的中外文文献，可以选择哪些数据库？请选择其中一种数据库，简要检索策略。28.答：查找“乙型肝炎的流行病学”的文献可选用的中文检索系统包括：CNKI、维普、万方、CBM等，可选的外文检索系统包括：MEDLINE、Pubmed、EDSCO、springerlink、Open Access等其中，在CNKI中的检索策略为：检索项：篇名；检索词：乙型肝炎；逻辑：或者检索项：篇名；检索词：乙肝；逻辑：并且检索项：主题；检索词：流行病学在CBM中的检索策略为：肝炎，乙型/[扩展全部树]流行病学29.通过哪些检索系统可以查明济宁医学院图书馆是否有“computer communications”这本期刊？29.答：可以选用的检索系统包括：图书馆联机检索系统、超星数字图书、书生数字图书馆30. 请列出5个Google高级检索语法，并举例说明其用法。30.答：可在下列语法中任选5个举例（1）“link”运算符: 查找与某一特定网页建立链接的所有网页，亦可在高级检索模式下实现（2）“related”运算符:自动查找与某一网页处于同一级别的相似网页，亦可通过高级检索模式及检索结果界面的“类似网页”实现（3）“info”运算符：可获取Google库存的有关某一网页的全部信息（4）“site”运算符: 将检索结果限制在某一网域中，也可以通过高级检索界面的“网域”选项来（5）“Allintitle”运算符:要求提问词全部在网页标题中出现（6）“allinurl”运算符：要求提问词全部在URL中出现（7）“inurl”运算符：要求提问词部分在URL中出（8）“filetype:”运算符是Google开发的非常强大实用的一个搜索语法。后面接文档类型，可限制获取某一文档类型的网页，后可接文献类型举例。31. 在版中的查找某作者发表的文献有几种方式？分别是什么？31. 答：有四种“基本检索”中的著者检索有三种方式：一是在“检索入口”下拉彩旦中选择“作者”字段，然后在检索提问框内输入著者姓名；二是直接在检索提问框内输入著者姓名，后加“in au”；三是直接在检索提问框内输入“au=”，后跟著者姓名，“作者检索”方式：直接在检索提问框内输入著者姓名。32. 循证医学证据的主要类型有哪些？32.依据按质量和可靠程度大体可分为以下五级(可靠性依此降低)：一级：按照特定病种的特定疗法收集所有质量可靠的随机对照试验后所作的系统评价或Meta分析；二级：单个的样本量足够的随机对照试验结果；三级：设有对照组但未用随机方法分组的研究；四级：无对照的系列病例观察；五级：专家意见或基于生理、病理生理和基础研究的证据。33. 列举6种可以检索引文的数据库。33.答：可以检索引文的数据库有：（任写以下6种均可）（1） SCI（2） SSCI（3） H＆ACI（4）《中国科技论文与引文数据库》（CSTPC）（5）《中国科学引文数据库》（6）《中文社会科学引文索引》（7）《中文科技期刊引文数据库》（8）中国知识基础设施工程中的中国引文数据库（9）《中国生物医学文献数据库》34.信息检索的类型及特点。34.答（1）个人信息源：聚集大量从事某工作领域的个人信息及有关各种事物的发展动态信息。（2）组织机构信息源：主要指组织机构中的内部信息源。（3）实物型信息源：以实物如文物、产品样本、模型、雕塑等形式表现的信息资源。（4）文献型信息源：以文字、图片、符号等各种方式记录在各种载体上的知识和信息资源。1）图书：图书也称为书籍，是指内容比较成熟、资料比较系统、有完整定型装帧形式的出版物。2）期刊：期刊也称杂志，是指那些定期或不定期出版，汇集了多位作者论著的连续出版物。3）学位论文：是本科生、研究生为取得学位资格而撰写的专业性研究论文。4）科技报告：是作为科研成果的正式报告。5）专利文献：由政府专门机构出版、有创造发明的设计、制作工艺的详细说明，表明在一定时限内发明所有者享有制造、使用、销售占有权的法律性文献。6）标准文献：由权威机构批准、颁发的、可供人们执行的技术规格的规范性文献。7）产品样本：厂商为介绍推销其产品而印发的文献。8）会议文献：是指在国际和各国国内专业学术会议上所发表的论文和报告。9）政府出版物：由政府机构制作指定出版机构出版的文献。（5）电子型信息源：主要是指通过使用电子技术实现信息存储和传播的信息。35.数据库的组成。35.答：数据库由文档、记录和字段组成。（1）文档：是按一定结构组织的相关记录和结合。（2）记录：是构成文档的基本数据单元。（3）字段：是比记录更小的单元，是组成记录的基本单元。36.分类语言。36.答：分类语言是按文献的学科属性，给予相应的分类号，用分类号来表达文献的主题概念，根据分类表中的顺序编排成分类索引，提供分类途径共检索文献使用。分类语言是运用逻辑分类原理，按文献内容的学科、专业集中文献，从知识分类的角度揭示各类文献在内容上的区别和联系。分类语言较好地体现了学科和专业的系统性。分类语言可分为体系分类语言和组配语言两种，目前国内普遍采用前者。36.主题语言。37.答：主题语言是以高度概括的语词解释文献的主题，并以此为标识组织检索系统的语言。主题语言分为标题词、元词、关键词和叙词。（1）标题词：是从自然语言中选取并经过规范化处理，表示事物概念的词、词组或短语。（2）元词：是指能够用以描述文献所论及主体的最小、最基本词汇。（3）叙词：使用能表达文献主题并经过严格规范化的词语。（4）关键词：是直接从文献的标题，文献或全文中抽选具有实质意义、能表达文献主题概念，未经规范化处理的自然词语词汇。38.信息检索途径。38.答：1.分类文献：是按文献内容所属的学科类别来检索文献的途径，通过分类号或类别进行检索。2.主题途径：是通过反应文献内容主题的词语来检索文献的途径。3.关键词途径：是用非规范化词语自由标引，直接取自原文中能够表达文献内容主题、起关键作用的词语。4.著者途径：是指按文献的作者、编者、译者的姓名或机构团体名称字顺检索文献的途径。5.题名途径：是指按书名、刊名或文章篇名的字顺进行检索的一种途径。6.号码途径：是利用文献代码、序号编排成的“号码索引”的一种途径。39.信息检索素养的内涵。39.答：1.信息意识：指信息在人脑中的反应即人对各种信息的自觉心里反应，反应人在信息活动中对信息的认识、态度、价值趋向和一定需求。2.信息知识：是指与信息有关的理论、知识和方法。3.信息能力：是指有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。4.信息道德：是指在信息获取、使用、创造和传播过程中应该遵守一定的伦理规范。40.信息检索策略。40.答：1.分析检索课题，明确目的要求。信息检索总是按照一定的课题需要进行的，每一项检索课题都有明确的目的和具体的要求，因此在进行检索之前，首先要对检索课题进行认真而细致的分析研究，明确检索的目的和要求。因为目的不同，要求也不同，选择连锁工具、连锁方法等就有所不同。2.检索系统和数据库的选择。信息检索和数据库的选择主要主要考虑其所收录的学科范围、存贮年限、更新周期、标引质量、独特性、所需费用、系统性能和辅助服务等方面考虑，还要注意综合性和专业性数据库配合使用。3.选择检索途径、确定检索标识。所谓检索途径也就是数据库中的检索项（字段），是指从哪个角度或哪个方向入手进行检索。检索标识是指确切表达文献信息内容及外表特征使用的符号或词语，如分类号、主题词、关键词、作者姓名、期刊刊名等，检索时要求准确找出检索标识，以避免误检。4.编辑检索表达、调整检索策略。检索表达式是用来表达检索提问的逻辑检索表达式，有选择好的检索标识根据检索要求运用不同的运算符号进行组配，以达到较为理想的检索效果。但是实际的检索过程中，用既定的检索表达式检出的结果往往不能一次就达到满意，这就需要根据检索情况分析原因及时调整检索策略。5.获得原始文章。（1）检索网上全文数据库。（2）利用网上出版社、杂志。（3）利用图书馆馆藏目录（馆藏联合目录）。（4）利用“网上全文传递服务”。（5）直接向著者索取。通过上述步骤的查找获得的如不是文献全文，可通过以下方式获得。

（1）期刊论文，中国知网并不是唯一的选择，同类型的数据库有维普和万方。但中国知网在期刊收录的全面性和更新的及时性方面有明显的优势。万方数据知识服务平台收录期刊8133种，优先出版期刊只有39种。只要是中国知网获得独家授权的期刊，万方数据均不能提供全文（以往若干年的可能有）；即收录的期刊，其更新要比中国知网晚1个月以上。维普网（维普期刊资源整合服务平台）其中有大量的非学术期刊，而且更新速度不如中国知网，对辑刊的收录不如中国知网。此外，国家哲学社会科学文献中心（）提供免费的期刊论文下载。只是更新较慢，滞后1年以上。目前能获得的最新数据是2016年第1期的。采用（主题）关键词途径，不如直接用题名途径，在题名字段进行全文检索（不作完全匹配，作任意匹配），通常称为题名关键词。⑵ 学位论文⑶ 报纸论文《中国重要报纸全文数据库》⑷ 会议论文《中国重要会议论文全文数据库》《国际会议论文全文数据库》⑸ 年鉴《中国年鉴网络出版总库》，收录3663种，30157卷年鉴。检索内容包括：⑹ 专利《中国专利全文数据库（知网版）》《海外专利摘要数据库（知网版）》可以通过申请号、申请日、公开号、公开日、专利名称、摘要、分类号、申请人、发明人、优先权等检索项进行检索，专利说明书全文链接到欧洲专利局网站。⑺ 外文文献中文文献检索能直接获取全文；外文文献检索的结果只能是题录（有全文链接，如本馆已采购了该资源，则为有效链接，可获取全文）。中国知网的外文文献检索支持检索词的中英自动翻译（即输入中文检索词进行检索）。同样，在进行中文文献检索时，也支持输入英文检索词。下面，以期刊论文的检索为例，我们讨论一下中国知网的检索功能。中国知网提供多个检索模式：简单检索（单条件检索）、高级检索、专业检索、作者发文检索、句子检索、一框式检索。⑴ 简单检索中国知网的简单检索不支持布尔逻辑式“刑事诉讼制度AND改革 AND 审判”，“刑事诉讼制度改革审判”代表的是“刑事诉讼制度 OR 改革 OR 审判”（这与上一讲中我们讨论的书目检索语法不同）。我们采用二次检索的方法：先检索“刑事诉讼制度”，再在第一次的结果中检索“改革”，再在第二次的结果中检索“审判”。篇名+关键词+摘要。⑵ 高级检索：相同的检索条件，高级检索比简单检索精确。对于期刊论文，作者是重要的检索途径，其他的限定条件也很重要：年份/卷期（出版年份）、更新年份来源期刊一是进行单刊刊内检索（可直接输入刊名/ISSN/CN，也可以在8411种学术期刊中勾选）。二是进行一类刊内的检索：①在专辑专题内检索，每个专辑内又有若干专题；② 收录来源，即为各种权威引文数据库收录情况，如CSCD 中国科学引文数据库来源期刊、CSSCI 中文社会科学引文索引，代表期刊的学术价值；③ 核心期刊各编（七编）各类，代表期刊的学术价值。来源类别核心期刊和CSSCI。5个选项均不选是不作限定支持基金中英文扩展同义词扩展（对于提高查全率[1]非常有用）① 内容检索，一般以“主题”为检索途径，匹配方式一般选“精确”。② 勾选同义词扩展（中英文扩展与同义词扩展只能勾选一个，相比之下，同义词扩展的意义更大一些），以提高查全率。③ 如果采用“全文”途径，使用“词频”限定，以提高查准率[2]。④ 如果通过作者途径检索，一定要通过作者单位进行限定（如果作者单位名有变更，须全部列出）。⑤ 如有要求，无论是来源期刊和支持基金，都用勾选方式，不要手工输入。⑷ 作者发文检索：最多可支持8个作者单位检索，而且作者单位条件不依赖于作者⑸ 句子检索：必须输入两个检索词，可限定在同一句或同一段中出现，检索词可以是一个句子。最多支持两重条件。⑺ 出版物检索第一种：出版来源导航通过来源名称（刊名）、主办单位、出版者、ISSN、CN、ISBN[3]进行检索。第二种通过期刊导航。在中国知网中检索，如果要涵盖所有论文，要选择文献标签进行跨库检索时，一定要勾选学术辑刊。⑵ 影响因子——期刊学术价值指标即某期刊前两年发表的论文在该报告年份（JCR year）中被引用总次数除以该期刊在这两年内发表的论文总数。，IF（2016年） = 该期刊2014年至2015年所有文章在2016年中被引用的次数 /该期刊2014年至2015年所有文章数影响因子在发展的过程中形成了两个指标：复合影响因子和综合影响因子。复合影响因子是以期刊综合统计源文献、博硕士学位论文统计源文献、会议论文统计源文献为复合统计源文献计算。综合影响因子主要是指文、理科综合，是以科技类期刊及人文社会科学类期刊综合统计源文献计算。⑶ H指数——学者的学术价值指标其目的是量化科研人员作为独立个体的研究成果。Hirsch的原始定义是，一名科学家的h指数是指其发表的Np篇论文中有h篇每篇至少被引h次、而其余Np-h篇论文每篇被引均小于或等于h次h代表“高引用次数”（high citations）。一个人的h指数是指他至多有h篇论文分别被引用了至少h次。查出某个人发表的所有论文，让其按被引次数从高到低排列，往下核对，直到某篇论文的序号大于该论文被引次数，那个序号减去1就是h指数。③ 相似文献④ 读者推荐⑵ 命中结果的总体情况① 总体趋势分析通过发文量的变化，展现了这个研究专题受关注程度的变化。显然，2014-2015年是一个高峰点（历时两年，专家组报告裁决中国败诉）② 关键词共现网络、三、人大复印资料全文数据库人大复资料是一种权威的索引工具，而不是全文数据库。四、中文社会科学引文索引CSSCI中文社会科学引文索引英文全称为“Chinese Social Sciences Citation Index”，缩写为CSSCI。 CSSCI是一个索引数据库，自身不提供全文下载，但此处有全文链接，通过点击，我们发现，这不是真实的全文下载（链接至百度学术，百度学术提示哪些数据库资源有全文，只有获取下载权限后才能下载）。通过被引文献检索，可以找出客观上学术价值高的文献（被来源文献引用多的文献）。[1] 查全率，是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标，即检出的相关文献量与检索系统中相关文献总量的比率。普遍表示为:查全率=(检索出的相关信息量/系统中的相关信息总量)x100%。[2] 查准率(精度)是衡量某一检索系统的信号噪声比的一种指标，即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100%。[3] 国际标准书号(International Standard Book Number)，简称ISBN，是专门为识别图书等文献而设计的国际编号。现在，采用ISBN编码系统的出版物有:图书、小册子、缩微出版物、盲文印刷品等。分四个部分:组号(国家、地区、语言的代号)，出版者号，书序号和检验码。

主要区别有以下几点

1、检索针对性不同：

题名是检索文章的题目

关键词是通过检索每篇文献中的关键词来检索出文献

摘要是检测出与搜索句式意思相近的文章

主题是通过检索每篇文章的主旨来检索文章

全文是指文章中任何部分出现要检索的字词都会被检索出来

2、检索精确度不同：题名检索的精确程度最高，全文检索的精确程度最低。根据自己的需要选择合适的精确度检索。

3、应用场景不同：对于检索确切的文章应选择题名检索，检索相关主题时应用主题检索，查找特定词汇或语句时关键词、全文检索更加合适。

在进行文献检索时，检索的条件往往不是唯一的。可以通过题名、关键词、主题等进行模糊或精确检索。

扩展资料

文献检索（Information Retrieval）是指根据学习和工作的需要获取文献的过程。近代认为文献是指具有历史价值的文章和图书或与某一学科有关的重要图书资料，随着现代网络技术的发展，文献检索更多是通过计算机技术来完成。

文献概念的发展经历了三个阶段：

最早见于《论语八佾》，宋代朱熹解释为：文指典籍，献指熟知史实的贤人。

近代一般理解为具有历史价值的文章和图书或与某一学科有关的重要图书资料。

现代学者认为，文献是记录有人类知识和信息的一切载体。它由四个要素构成：文献内容、载体材料、信息符号、记录方式。

计算机检索

以计算机技术为手段，通过光盘和联机等现代检索方式进行文献检索的方法。与手工检索一样，计算机信息检索应作为未来科技人员的一项基本功，这一能力的训练和培养对科技人员适应未来社会和跨世纪科研都极其重要。

一个善于从电子信息系统中获取文献的科研人员，必定比不具备这一能力的人有更多的成功机会，美国报道生活新方式的期刊POV也将交互网络检索专家作为未来十大热门职业之一，这些情况都说明了计算机文献检索越来越重要，故值得大家对这一技术予以重视。

参考资料来源百度百科——文献检索

1、摘要

摘要是文章主要内容的摘录，要求短、精、完整。字数少可几十字，多不超过三百字为宜。

随着计算机技术和因特网的迅猛发展，网上查询、检索和下载专业数据已成为当前科技信息情报检索的重要手段，对于网上各类全文数据库或文摘e799bee5baa6e79fa5e98193e58685e5aeb9339数据库，论文摘要的索引是读者检索文献的重要工具，为科技情报文献检索数据库的建设和维护提供方便。

摘要是对论文综合的介绍，使人了解论文阐述的主要内容。论文发表后，文摘杂志或各种数据库对摘要可以不作修改或稍作修改而直接利用，让读者尽快了解论文的主要内容，以补充题名的不足，从而避免他人编写摘要可能产生的误解、欠缺甚至错误。所以论文摘要的质量高低，直接影响着论文的被检索率和被引频次。

2、参考文献：

一篇论文的参考文献是将论文在研究和写作中可参考或引证的主要文献资料，列于论文的末尾。参考文献应另起一页，标注方式按《GB7714-87文后参考文献著录规则》进行。

中文：作者—标题—出版物信息（版地、版者、版期）

英文：作者—标题—出版物信息

3、关键词：

关键词是从论文的题名、提要和正文中选取出来的，是对表述论文的中心内容有实质意义的词汇。关键词是用作计算机系统标引论文内容特征的词语，便于信息系统汇集，以供读者检索。每篇论文一般选取3-8个词汇作为关键词，另起一行，排在“摘要”的左下方。

主题词是经过规范化的词，在确定主题词时，要对论文进行主题分析，依照标引和组配规则转换成主题词表中的规范词语。（参见《汉语主题词表》和《世界汉语主题词表》）。

扩展资料：

撰写论文摘要的注意事项：

(1)整理你的材料使其能在最小的空间下提供最大的信息面。

(2)用简单而直接的句子。避免使用成语、俗语或不必要的技术性用语。

(3)请多位同僚阅读并就其简洁度与完整性提供意见。

(4)删除无意义的或不必要的字眼。但也不要矫枉过正，将应有的字眼过份删除，如在英文中不应删除必要的冠词如a'' an'' the等。

(5)尽量少用缩写字。在英文的情况较多，量度单位则应使用标准化者。特殊缩写字使用时应另外加以定义。

参考资料来源：百度百科 - 论文格式

参考资料来源：百度百科 - 论文摘要

论文的写作格式、流程与写作技巧广义来说，凡属论述科学技术内容的作品，都称作科学著述，如原始论著（论文）、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。

但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要，但都是加工的、发展的、为特定应用目的和对象而撰写的。

下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。

主要谈的是论文写作中容易发生的问题和经验，是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。

（一）论文——题目科学论文都有题目，不能“无题”。论文题目一般20字左右。

题目大小应与内容符合，尽量不设副题，不用第1报、第2报之类。论文题目都用直叙口气，不用惊叹号或问号，也不能将科学论文题目写成广告语或新闻报道用语。

（二）论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。

严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人，应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上，那就应该以贡献大小依次排列。

论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者，也可以一般致谢。

行政领导人一般不署名。（三）论文——引言是论文引人入胜之言，很重要，要写好。

一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。

要复习必要的文献、写明问题的发展。文字要简练。

（四）论文——材料和方法按规定如实写出实验对象、器材、动物和试剂及其规格，写出实验方法、指标、判断标准等，写出实验设计、分组、统计方法等。这些按杂志对论文投稿规定办即可。

（五）论文——实验结果应高度归纳，精心分析，合乎逻辑地铺述。应该去粗取精，去伪存真，但不能因不符合自己的意图而主观取舍，更不能弄虚作假。

只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因，不能在总结处理时因不合常态而任意剔除。

废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃，不能只废弃不合己意者。实验结果的整理应紧扣主题，删繁就简，有些数据不一定适合于这一篇论文，可留作它用，不要硬行拼凑到一篇论文中。

论文行文应尽量采用专业术语。能用表的不要用图，可以不用图表的最好不要用图表，以免多占篇幅，增加排版困难。

文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代，不要随意丢弃。

（六）论文——讨论是论文中比较重要，也是比较难写的一部分。应统观全局，抓住主要的有争议问题，从感性认识提高到理性认识进行论说。

要对实验结果作出分析、推理，而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论，表明自己的观点，尤其不应回避相对立的观点。

论文的讨论中可以提出假设，提出本题的发展设想，但分寸应该恰当，不能写成“科幻”或“畅想”。（七）论文——结语或结论论文的结语应写出明确可靠的结果，写出确凿的结论。

论文的文字应简洁，可逐条写出。不要用“小结”之类含糊其辞的词。

（八）论文——参考义献这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉，便于查找，同时也是尊重前人劳动，对自己的工作有准确的定位。

因此这里既有技术问题，也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。

如论文引言中应引上对本题最重要、最直接有关的文献；在方法中应引上所采用或借鉴的方法；在结果中有时要引上与文献对比的资料；在讨论中更应引上与论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意，不查文献；故意不引，自鸣创新；贬低别人，抬高自己；避重就轻，故作姿态的做法都是错误的。

而这种现象现在在很多论文中还是时有所见的，这应该看成是利研工作者的大忌。其中，不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。

有些做法则比较隐蔽，如将该引在引言中的，把它引到讨论中。这就将原本是你论文的基础或先导，放到和你论文平起平坐的位置。

又如科研工作总是逐渐深人发展的，你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是，某年某人对本题做出了什么结果，某年某人在这基础上又做出了什么结果，现在我在他们基础上完成了这一研究。

这是实事求是的态度，这样表述丝毫无损于你的贡献。有些论文作者却不这样表述，而是说，某年某人做过本题没有做成，某年某人又做过本题仍没有做成，现在我做成了。

这就不是实事求是的态度。这样有时可以糊弄一些不明。

论文的关键词又称叙词或主题词，指在论文题目、摘要或正文中，表达中心内容，具有实质性意义的词。

知论文关键词应是具检索意义的学科专用名词或名词词组。论文关键词应该依据文献的题名和前言、结语、目次等不同部分，归纳出中心主题因素与修饰限定主题因素，根据需要道进行精选和取舍；避免主观性，强调客观标准；应注意主题词的全面性和专指性。

内所以关键词的选择须概念清楚、确切，避免多义性。中教数据容库中有很多论文有相关示例，多看几篇也就知道怎么写了。

中教数据库里有免费论文范文，最新发布的首发论文，免费论文可供大家写论文时作为参考依据。

关键词是科技论文的文献检索标识，是表达文献主题概念的自然语言词汇。

科技论文的关键词是从其题名、层次标题和正文中选出来的，能反映论文主题概念的词或词组。关键词是为了适应计算机检索的需要而提出来的，位置在摘要之后。

早在1963年，美国Chemical Abstracts从第58卷起，就开始采用电子计算机编制关键词索引，提供快速检索文献资料主题的途径。在科学技术信息迅猛发展的今天，全世界每天有几十万篇科技论文发表，学术界早已约定利用主题概念词去检索最新发表的论文。

作者发表的论文不标注关键词或叙词，文献数据库就不会收录此类文章，读者就检索不到。关键词选得是否恰当，关系到该文被检索和该成果的利用率。

1 关键词分类关键词包括叙词和自由词。 1）叙词——指收入《汉语主题词表》、《MeSH》等词表中可用于标引文献主题概念的即经过规范化的词或词组。

2）自由词——反映该论文主题中新技术、新学科尚未被主题词表收录的新产生的名词术语或在叙词表中找不到的词。 2 关键词标引为适应计算机自动检索的需要，GB/T 3179—92规定，现代科技期刊都应在学术论文的摘要后面给出3~8个关键词（或叙词）。

关键词的标引应按GB/T 3860-1995《文献叙词标引规则》的原则和方法，参照各种词表和工具书选取；未被词表收录的新学科、新技术中的重要术语以及文章题名的人名、地名也可作为关键词标出（自由词）。所谓标引，系指对文献和某些具有检索意义的特征如：研究对象，处理方法和实验设备等进行主题分析，并利用主题词表给出主题检索标识的过程。

对文献进行主题分析，是为了从内容复杂的文献中通过分析找出构成文献主题的基本要素，以便准确地标引所需的叙词。标引是检索的前提，没有正确的标引，也就不可能有正确的检索。

科技论文应按照叙词的标引方法标引关键词，并尽可能将自由词规范为叙词。 3 标引关键词应遵循的基本原则专指性原则一个词只能表达一个主题概念为专指性。

只要在叙词表中找到相应的专指性叙词，就不允许用词表中的上位词（S项）或下位词（F项）；若找不到与主题概念直接对应的叙词，而上位词确实与主题概念相符，即可选用。例如：“飞机防火”在叙词表中可以找到相应的专指词“专机防火”，那么就必须优先选用。

不得用其上位词“防火”标引，也不得用“飞机”与“防火”这两个主题词组配标引。组配原则叙词组配应是概念组配。

概念组配包括2种类型：交叉组配。系指2个或2个以上具有概念交叉关系的叙词所进行的组配，其结果表达一个专指概念。

例如：“喷气式垂直起落飞机”，可用“喷气式飞机”和“垂直起落飞机”这2个泛指概念的词确切地表达叙词表中没有的专指概念；“肾结石”可用“肾疾病”和“结石 ”这2个叙词表示一个专指概念。方面组配。

系指一个表示事物的叙词和另一个表示事物某个属性或某个方面的叙词所进行的组配，其结果表达一个专指概念。例如：“信号模拟器稳定性”可用“信号模拟器”与 “稳定性”组配，即用事物及其性质来表达专指概念；“彩色显像管荧光屏涂履”，可用“ 彩色显像管”、“荧光屏（电子束管）”和“涂覆”3个词组配，即用事物及其状态、工艺过程3个方面的叙词表达一个专指概念。

在组配标引时，优先考虑交叉组配，然后考虑方面组配；参与组配的叙词必须是与文献主题概念关系最密切、最邻近的叙词，以避免越级组配；组配结果要求所表达的概念清楚、确切，只能表达一个单一的概念；如果无法用组配方法表达主题概念时，可选用最直接的上位词或相关叙词标引。自由词标引下列几种情况关键词允许采用自由词标引。

a.主题词表中明显漏选的主题概念词。 b.表达新学科、新理论、新技术、新材料等新出现的概念。

c.词表中未收录的地区、人物、产品等名称及重要数据名称。 d.某些概念采用组配，其结果出现多义时，被标引概念也可用自由词标引。

自由词尽可能选自其他词或较权威的参考书和工具书，选用的自由词必须达到词形简炼、概念明确、实用性强。采用自由词标引后，应有记录，并及时向叙词表管理部门反映。

4 关键词的标引步骤首先对文献进行主题分析，弄清该文的主题概念和中心内容；尽可能从题名、摘要、层次标题和正文的重要段落中抽出与主题概念一致的词和词组；对所选出的词进行排序，对照叙词表找出哪些词可以直接作为叙词标引，哪些词可以通过规范化变为叙词，哪些叙词可以组配成专指主题概念的词组；还有相当数量无法规范为叙词的词，只要是表达主题概念所必需的，都可作为自由词标引并列入关键词。在关键词标引中，应很好地利用《汉语主题词表》和其他《叙词表》，标引过程应该查表；切忌主题概念分析和词的组配有误；要控制自由词标引的数量。

有英文摘要的论文，应在英文摘要的下方著录与中文关键词相对应的英文关键词（Key words ）。

一般按照规定,论文选取 3～8个关键词 ,根据期刊统计结果,用3个与4个关键词的各占40%,其余用5个或以上的关键词。根据统计某国际会议的论文发现4个关键词最多，占50%以上。所以建议采用4个关键词。同时，各关键词之间用分号隔开，最后不加标点。关键词一般从标题、摘要中选择。前二个关键词一般定义研究领域或研究对象,例如有1篇论文是关于采用红外报警器进行博物馆自动监控的。可以选前2个关键词为:“博物馆、报警”,后2个关键词一般选择研究手段、研究方法。例如上例可选“红外传感器、单片机”这样4个关键词基本上覆盖了论文的主要领域,读者从各个角度都容易检索到作者的论文。还举上例,如果作者选择了“单片机、编程、显示、自动”就没有很好的反映论文的主要内容。注意选择关键词不能用过于一般的,例如用“电路”、“器件”、“系统”、“分析”、“测量”等,这些关键词没有特定性。也不能用过于琐碎枝节的,这样读者可能想不到用那样的关键词去检索。

信息检索技术的使用论文

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来，互联网得到了迅速的发展，网上信息资源愈来愈庞大，且信息具有量大、分散、异构等特性，因此，传统的Web信息检索工具开始暴露出它性能低下的一面，具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录，根本无法从中再细找，或者找到的内容和要找的内容不是一个专业领域的，造成信息无效的现象。但随着人们信息意识的增强，对信息内容及信息服务的需求也在不断的演变和发展，对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务，使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构，它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理，为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计网格计算是近年来国际上兴起的一种重要信息技术，其目的是将网上各种资源组织在一个统一的大框架下，为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台，实现互联网上所有资源的全面连通，实现信息资源的全面共享。为解决不同领域复杂科学计算与海量信息服务问题，人们以网络互连为基础构造了不同的网格，他们在体系结构，要解决的问题类型等方面各不相同，但网格计算至少需要具有三种基本功能：资源管理、任务管理、任务调度。本文设计的信息检索体系结构，围绕网格计算的基本功能及信息检索的特点，主要有以下三个层次组成：见图1（1）网格结点：结点是网格计算资源的提供者，本系统主要是由一系列的集群系统组成，它们在地理位置上是分布的，构成了一个分布检索群体，作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理，维护和查询。（2）网格计算中间件：中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分，它根据用户的信息请求任务，在整个网格内负责信息资源的匹配、定位，实现用户任务到集群系统的映射。（3）网格用户层：主要为用户应用提供接口，支持用户对所需要的信息资源进行描述、创建、提交等。图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统，集群系统对集群内的资源进行管理和任务调度，再利用网格中间件对各集群系统进行管理，从而形成对整个网格资源的管理，并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略，又可利用中间件在全局意义上对网格信息资源进行管理。集群系统的设计由于Web信息资源数量十分庞大，用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题，往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体，并使其从客户端看来就如同一台服务器在服务，这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略，将Web信息资源按地区按专业内容分割，一方面使信息资源数量相对缩小，便于数据的组织、管理和维护，另一方面按专业内容易于制定一个公用的XML规范，便于集群内各类信息资源的描述，从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent，基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。资源服务Agent根据信息资源请求任务，利用XML信息集成系统提供的数据，为用户提供实际的资源检索操作，并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法：XML（the eXtensible Markup Language）是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准，它是一种可以对信息进行自我描述的语言，它允许开发人员通过创建格式文件DTD（Document Type Definitions）定制标记来描述自己的数据，DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本，因此具有跨平台的优点，XML的优点在于（1）简单、规范性：XML文档基于文本标签，有一套严谨而简洁的语法结构，便于计算机、用户理解；（2）可扩展性：用户可以自定义具有特定意义的标签，自定义的标签可以在任何组织、客户、应用之间共享；（3）自描述性：自描述性使其非常适用不同应用间的数据交换，而且这种交换是不以预先定义一组数据结构为前提，因此具有很强的开放性；（4）互操作性：XML可以把所有信息都存于文档中传输，而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用，因此它为基于特定专业内容的表达提供了一种极好的手段，可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类：存入仓库法（the ware-housing approach）和虚拟法(the virtual approach)，可使用这两类方法利用XML在数据组织和交换方面的优越性，采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射，建立基于XML的Web信息集成系统，其结构与获取信息的工作过程参见文献[2]。图网格中间件的设计图3所示的网格中间件的主要功能是（1）消除不同用户与集群系统之间数据表达的差异，使信息资源数据对用户来说是透明的；（2）管理、维护Web上分布的各集群系统，网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息，对关系数据库的操作可维护集群系统的分布式逻辑，使本结构在可变性和扩充性上具有柔性；（3）接受用户的信息请求任务，能快速定位于满足要求的集群系统，通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下：（1）接收Agent模块：主要用于登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。（2）关系数据库及数据服务Agent：关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。（3）格式转换Agent模块：提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的，各用户对同一数据有不同的表示方法（对信息资源描述存在差异）由于XML文档中这种格式差异体现在与之相关的DTD/Schema上，因此经过格式转换，可使信息资源的格式对用户是透明的。（4） XML文档分析Agent模块：提取格式转换后的XML文档中各个标签，通过查询网格中间件中的关系数据库，实现用户信息请求任务与集群系统的对应关系，并得到满足条件的集群系统的相关信息，获取各集群系统的接口参数。（5）发送Agent模块：将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术，Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征，代表用户完成用户的任务，并能动态适应环境的变化更好地满足用户的需求，提高信息检索的能力。文秘杂烩网

网络信息检索方法与应用这个原创。联系看我资料

我给你找了一篇，摘要如下:随着Internet在全世界范围内迅猛发展，网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此，对网络信息的检索技术及其发展趋势进行探讨和研究，是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究，并对网络信息检索的发展趋势进行了预测，旨在寻找提高网络信息检索的手段和方法的有效途径，并最终提高网络信息的检索效果，使得网络信息资源得到充分有效地利用。全文主要包括六个部分，第一部分为网络信息检索述评，主要是阐述了网络信息检索所涉及到的有关概念，如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等，旨在弄清网络信息检索的技术支撑，为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述，主要从其检索机制入手，分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括，并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限，主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本，贴在下面:网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展，网上信息资源也以指数形式增加，网络信息资源作为一种新型的信息资源，发挥着越来越重要的作用，其内容几乎无所不包，涉及政治、经济、文化、科学、娱乐等各个方面；其媒体形式多种多样，包括文本、图形、图像、声音、视频等；其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来，并根据信息用户的信息需求查找所需信息的过程和技术，所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程，也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中，通过人工查找索引找到对应的文献索引号再获取文献原文；②联机信息检索。这其中也存在一个发展过程，由检索结果来看，从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文；由检索方法来看，从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中，全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速，成为深受人们关注的一种非常有效的信息检索技术，它是从大容量文档库中精确定位所需信息的最有效手段l3]。.信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br，singsystelns)。只要能够进入hitemct就能够通过浏览器，利用HTTP协议提供的WV乃万服务，浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点，它是以一定的技术和策略在intemet中搜集和发现网络信息，并对网络信息进行理解、提取和处理，建立数据库，同时以认倪b形式提供一个检索界面，供用户输入检索关键词、词组或短语等检索项，代替用户在数据库中查找出与提问相匹配的记录，同时返回结果且按相关度排序输出，从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息，另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要，所以它是面向用户的，采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。网络信息检索效果评价目前，得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式，其中以查全率和查准率最为重要。现代信息科学技术的发展，为人们提供了多种多样的信息获取和传送方法及技术，从“信源”与“用户”的关系来看，可分为两种模式:“信息推送”模式(InformationPush)，由“信源”主动将信息推送给“用户”，如电台广播；“信息拉取”模式(InformationPull)，由“用户”主动从“信源”中拉取信息，如查询数据库。信息推送技术“推”模式网络信息服务，是基于网络环境下的一种新的服务形式，即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术，是因为借助该技术使网络信息服务具有主动性，不仅可以直接把用户感兴趣的信息推送给用户，而且可有效地利用网络资源，提高网络吞吐率；再者，Push技术还允许用户与提供信息的服务器之间透明地进行通信，极大地方便了用户。所谓Push技术，又称“推送”技术、Web广播(Webeasting)技术，实质上是一种软件，这种软件可以根据用户定义的准则，自动搜集用户最可能发生兴趣的信息，然后在适当的时候，将其传递至用户指定的“地点”。因而从技术上看，“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件，该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息)，还能够主动从网上搜寻信息，并经过筛选、分类、排序，然后按照每个用户的特定要求，主动推送给用户141。(l)信息推送方式。信息推送方式分两类，即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式，它将某些页面定义为浏览器中的频道，用户可像选择电视频道那样接受有兴趣的网播信息；邮件式推送，用电子邮件方式主动将所推送信息发布给各用户，如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户，如某企业、某组织、某个人的网页；专用式推送。采用专门的信息发送和接收软件，信源将信息推送给专门用户，如机密的点对点通信。智能推送方式有:操作式推送(客户推送式)，由客户数据操作启动信息推送。当某客户对数据进行操作时，把修改后的新数据存入数据库后，即启动信息推送过程，将新数据推送给其他客户；触发式推送(服务器推送式)，由ll硕士学位论文MASTER，5THESIS⑧数据库中的触发器启动信息推送过程，将新数据推送给其他客户，当数据发生变化，如出现增加(Insert)、删除(Delete)、修改(update)操作时，触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而，主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说，Push技术可以针对用户的特定信息需求进行检索、加工和推送，并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至，Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索，收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性，控制搜索的深度，过滤掉不必要的信息，将认飞b站点的资源列表及其更新状态配以客户代理完成。因而，网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动，有效地利用网络带宽，比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要，灵活地设置连接时间，通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现，不仅需要信息技术设备，而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段，“推”技术还存在很大的缺陷，比如:不能确保信息发送，没有状态跟踪，缺乏群组管理功能等等。因此，国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制)，摒弃了Push的诸多缺点之，2硕士学位论文MASTER，5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户，同时保持连续性的用户资料，随时可以知道谁收到了信息，信息是否为该用户定制，用户环境是否适当等等[刀。信息拉取技术常用的、典型的信息拉取技术，如数据库查询，是由用户主动查询数据库，从数据库中拉取所需信息。其主要优点是:针对性好，用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上，用户面对的不止是一个数据库，而是拥有海量信息的hitemet环境，因此，各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点，在实际中常常是将两者的结合起来，常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息)，再有针对性地拉取所需的信息。这样，便于用户注意信息变化的新情况和趋势，从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息，然后根据用户的兴趣，再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中，允许用户随时中断、定格在所感兴趣的网页上，作进一步的搜索，主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中，根据用户输入的关键词，信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务，又可以减轻网络的负担，并便于扩大用户范围[8]。因此，信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。挖掘技术随着功temet的发展，W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时，又使得人类的信息环境更加复杂，人硕士学位论文MASTER，5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决，相反，随着信息技术的发展，信息量的激增，造成了个人实际所需信息量与研触b上的海量信息之间的矛盾，因而也就造成了个人利用信息的困难。在这种情况下，虽然出现了叭范b环境下的专门检索工具，但是由于搜索引擎是由传统检索技术发展而来，在当前用户要求不断提高的情况下，传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源，W七b挖掘作为新的知识挖掘的手段，为Web信息的利用提出了新的解决方案叨。，1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料，从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段，它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识，以实现Web资源的自动检索，提高web数据的利用效率。随着Intemet的进一步延伸，Web数据越来越庞大，种类越来越繁多，数据的形式既有文本数据信息，也有图像、声音、视频等多媒体数据信息，既有来自于数据库的结构化数据，也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而，对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度，主要研究如何处理文本格式和超级链接文档，这些数据是非结构化或半结构化的。处理非结构化数据时，一般采用词集方法，用一组组词条来表示非结构化的文本，先用信息评价技术对文本进行预处理，然后采取相应的模型进行表示。另外，还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时，可以利用一些相关算法给超级链接分类，寻求认七b页面关系，抽取规则。同处理非结构化数据相比，由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构，使得表示半结构化数据的方法更加丰富。二是从数据库的角度，主要处理结构化的W匕b数据库，也就是超级链接14⑧蕊誉蕊文档，数据多采用带权图或者对象嵌入模型(OME)，或者关系数据库表示，应用一定的算法，寻找出网站页面之间的内在联系，其主要目的是推导出Web站点结构或者把W匕b变成一个数据库，以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化，研究认触b上的高级查询语言，使其不局限于关键字查询；二是信息的集成与抽取，把每个W七b站点及其包装程序看成是一个认范b数据源，通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成；三是叭几b站点的创建与重构，通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘，主要指的是通过对W七b文档的分析，从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系，W七b结构挖掘关注的则是网站中的超级链接结构之间的关系，找到隐藏在一个个页面之后的链接结构模型，可以用这个模型对W七b页面重新分类，也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据，页内结构可以用超文本标记语言等表示成树型结构，此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系，如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类，可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息，通过研究W亡b页面内部结构，可寻找出与用户选定的页面集合信息相关的其它页面信息模式，以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析，从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式，它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点，使得在认七b网上进行内容挖掘比较困难，它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构，当信息用户访问web站点时，与访问相关的页面、时间、用户ro等信息，日志中都作了相应的记录，因而对其进行信息l5硕士学位论文MASTER，5THESIS⑥挖掘是可行的，也是有意义的。在技术实践过程中，一般先把日志中的数据映射成诸种关系信息，并对其进行预处理，包括清除与挖掘不相关的信息等。为了提高性能，目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度，行为挖掘也应用到站点结构信息和页面内容信息等方面。挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程，由于用传统的信息检索技术对W己b文档的处理不够深入，因此，可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善，具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息，然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息，就可以对W七b网页的信息有大致的了解，决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别，利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围，大大提高查准率。目前，己经出现了很多文本分类技术，如TFIFF算法等，由于文本挖掘与搜索引擎所处理的文本几乎完全一样，所以可以直接将文本分类技术应用于搜索引擎的自动分类之中，通过对大量页面自动、快速、有效的分类，来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反，文本聚类指的是将文档集合中的文档分为更小的簇，要求同一簇内的文档之间的相似性尽可能大，而簇与簇之间的关系尽可能小，这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别，从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比，它的分类更加迅速、客观。同时，文本聚类可与文本分类技术相结合，使得信息处理更加方便。可以对检索结果进行分类，并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构，一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理，所以搜索引擎一般不处理这些信16硕士学位论文MASTER，S竹正515⑧息，而是将叭触b页面作为平面机构的文本进行处理。但是，在从触b结构挖掘中，通过对研触b文档组织结构的挖掘，搜索引擎可以进一步扩展搜索引擎的检索能力，改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容，通过研触b行为挖掘，不仅可以发现多数用户潜在共同的行为模式，而且还可以发现单个用户的个性化行为，对这些模式进行研究，可以更好地对搜索引擎的检索效果进行反馈，以便进一步改进搜索策略，提高检索效果。挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示，都不能完全解决W七b数据的非结构性问题，特别是汉语句子格式繁多，虚词、实词没有绝对的界限，切分词难度大，这些是造成无法对数据进行完全自动标引的根本性问题，因此，从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储，并最终实现智能化、自动化的数据表示和标引，以供搜索之用。通常数据的表示和数据的利用形式是相互关联的，因此，设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引，这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展，网站的内容也越来越丰富，结构也越来越庞杂，用有向图表示巨型网站链接结构将不能满足数据处理的需要，需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流，那么，对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等，不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3)，eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性，客户端、代理服务器端缓存的存在，使用户访问日志分别存在于服务器、代理服务器和客户端，因此，从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理，形成一个个用户一次的访问期间。通常来讲，对于静态W七b网站，服务器端的日志容易取得，客户端和代l7理服务器用户访问日志不容易取得；其次，由于一个完整的W匕b是由一个个图片和框架页面组成的，而用户访问服务器也有并发性，在确定用户访问内容时，必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外，由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的，在处理海量Web用户访问日志中也需要重新设计算法结构〔41。信息过滤技术hitemet开放式的环境，为人们检索和利用信息提供了极大的方便，但同时，网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为，第一，网络环境中信息的来源复杂多样，随意性大，任何人、任何单位不管其背景和动机如何都可以在网络上发布信息，信息的产生和传播没有经过筛选和审定，因此信息的可靠性、质量和价值成为用户普遍担心的一大问题；第二，目前大多数据搜索工具的检索范围是综合性的，它们的Robots尽可能地把各种网页抓回来，经过简单加工后存放在数据库中备检；第三，搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配，返回给用户的就是所有包括关键词的文献，这样的检索结果在数量上远远超出了用户的吸收和使用能力，让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视，它的目的就是让搜索引擎具有更多的“智力”，让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中，从关键词的选择、检索范围的确定到检索结果的精炼，帮助用户在浩如烟海的信息中找到和需求真正相关的资料。信息过滤模型信息过滤其实质仍是一种信息检索技术，因此它仍依托于某一信息检索模型，不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中，它以文献中是否包含关键词来作为取舍标准，因此，它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时，用户提交关键词。

现代信息检索论文: 现代信息检索方法的探讨要想充分利用这些浩如烟海的文献信息资源，必须借助各种各样的检索工具。同时，因特网信息资源的骤增及其异构性、动态性，不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理，从本质上变革信息资源检索方法，已成为现代化信息知识检索理论研究的热点。实践证明，将人工智能技术与信息技术结合，发挥人工智能的作用，是一条成功的经验。下面就知识检索与信息检索的关联和发展，作初步的探讨。一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配，是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种，分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式，计算机将根据提问式与系统中的记录进行匹配，当两者相符时则命中，并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”，表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”，表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”，表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。检索中逻辑算符使用是最频繁的，对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求，除要掌握检索课题的相关因素外，还应在布尔算符对检索结果的影响方面引起注意。另外，对同一个布尔逻辑提问式来说，不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。二、信息检索信息检索起源于图书馆的参考咨询和文摘索引工作，从19世纪下半叶首先开始发展，至20世纪40年代，索引和检索已成为图书馆独立的工具和用户服务项目。信息检索通常指文本信息检索，包括信息的存储、组织、表现、查询、存取等各个方面，其核心为文本信息的索引和检索。它是基于信息组织形式，如字符串、结构化数据库，应用信息处理方法，如排序数据查找、字符匹配，实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术，改进了基本检索功能，但缺点是对精确的提问不能给出精确的回答。从历史上看，信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前，信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容；信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众，他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。三、知识检索知识检索的基本思想是，模拟扩展人类关于知识处理与利用的智能行为和认识思维方法，是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如：抽象思维方法，形象思维方法。知识检索具有明显的优势：①实现信息服务向知识服务的转化，向用户提供潜在内容知识，以及分析预测后的超前性领域成果或知识。②提供主动服务方式，自动优化用户需求，主动提供个性化检索。③面向用户，依据用户的需求及其变化，能灵活选择理想的检索策略和技术，并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术，全面提高检索效率。知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术，基于知识和知识组织，融合知识处理和多媒体信息处理等多种方法与技术，充分表达和优化用户需求，能高效存取所有媒体类型的知识源，并能准确精选用户需要的结果。

信息检索论文范文艺术学院

你要的文章高分急求一篇文献检索报告范文题目不限我已经在上找到啦,有好多类似的文章，你自己去选吧

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来，互联网得到了迅速的发展，网上信息资源愈来愈庞大，且信息具有量大、分散、异构等特性，因此，传统的Web信息检索工具开始暴露出它性能低下的一面，具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录，根本无法从中再细找，或者找到的内容和要找的内容不是一个专业领域的，造成信息无效的现象。但随着人们信息意识的增强，对信息内容及信息服务的需求也在不断的演变和发展，对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务，使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构，它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理，为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计网格计算是近年来国际上兴起的一种重要信息技术，其目的是将网上各种资源组织在一个统一的大框架下，为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台，实现互联网上所有资源的全面连通，实现信息资源的全面共享。为解决不同领域复杂科学计算与海量信息服务问题，人们以网络互连为基础构造了不同的网格，他们在体系结构，要解决的问题类型等方面各不相同，但网格计算至少需要具有三种基本功能：资源管理、任务管理、任务调度。本文设计的信息检索体系结构，围绕网格计算的基本功能及信息检索的特点，主要有以下三个层次组成：见图1（1）网格结点：结点是网格计算资源的提供者，本系统主要是由一系列的集群系统组成，它们在地理位置上是分布的，构成了一个分布检索群体，作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理，维护和查询。（2）网格计算中间件：中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分，它根据用户的信息请求任务，在整个网格内负责信息资源的匹配、定位，实现用户任务到集群系统的映射。（3）网格用户层：主要为用户应用提供接口，支持用户对所需要的信息资源进行描述、创建、提交等。图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统，集群系统对集群内的资源进行管理和任务调度，再利用网格中间件对各集群系统进行管理，从而形成对整个网格资源的管理，并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略，又可利用中间件在全局意义上对网格信息资源进行管理。集群系统的设计由于Web信息资源数量十分庞大，用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题，往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体，并使其从客户端看来就如同一台服务器在服务，这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略，将Web信息资源按地区按专业内容分割，一方面使信息资源数量相对缩小，便于数据的组织、管理和维护，另一方面按专业内容易于制定一个公用的XML规范，便于集群内各类信息资源的描述，从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent，基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。资源服务Agent根据信息资源请求任务，利用XML信息集成系统提供的数据，为用户提供实际的资源检索操作，并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法：XML（the eXtensible Markup Language）是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准，它是一种可以对信息进行自我描述的语言，它允许开发人员通过创建格式文件DTD（Document Type Definitions）定制标记来描述自己的数据，DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本，因此具有跨平台的优点，XML的优点在于（1）简单、规范性：XML文档基于文本标签，有一套严谨而简洁的语法结构，便于计算机、用户理解；（2）可扩展性：用户可以自定义具有特定意义的标签，自定义的标签可以在任何组织、客户、应用之间共享；（3）自描述性：自描述性使其非常适用不同应用间的数据交换，而且这种交换是不以预先定义一组数据结构为前提，因此具有很强的开放性；（4）互操作性：XML可以把所有信息都存于文档中传输，而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用，因此它为基于特定专业内容的表达提供了一种极好的手段，可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类：存入仓库法（the ware-housing approach）和虚拟法(the virtual approach)，可使用这两类方法利用XML在数据组织和交换方面的优越性，采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射，建立基于XML的Web信息集成系统，其结构与获取信息的工作过程参见文献[2]。图网格中间件的设计图3所示的网格中间件的主要功能是（1）消除不同用户与集群系统之间数据表达的差异，使信息资源数据对用户来说是透明的；（2）管理、维护Web上分布的各集群系统，网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息，对关系数据库的操作可维护集群系统的分布式逻辑，使本结构在可变性和扩充性上具有柔性；（3）接受用户的信息请求任务，能快速定位于满足要求的集群系统，通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下：（1）接收Agent模块：主要用于登记、接收、管理各种信息资源请求任务，并提供安全认证和授权。（2）关系数据库及数据服务Agent：关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。（3）格式转换Agent模块：提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的，各用户对同一数据有不同的表示方法（对信息资源描述存在差异）由于XML文档中这种格式差异体现在与之相关的DTD/Schema上，因此经过格式转换，可使信息资源的格式对用户是透明的。（4） XML文档分析Agent模块：提取格式转换后的XML文档中各个标签，通过查询网格中间件中的关系数据库，实现用户信息请求任务与集群系统的对应关系，并得到满足条件的集群系统的相关信息，获取各集群系统的接口参数。（5）发送Agent模块：将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术，Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征，代表用户完成用户的任务，并能动态适应环境的变化更好地满足用户的需求，提高信息检索的能力。文秘杂烩网

信息检索报告―――毕业论文《新型防水涂料的研究》文献检索报告课题分析防水涂料根据其用途可以分成很多种类,我本人毕业论文主要是研究其中应用最为广泛的建筑防水涂料.建筑防水涂料以合成高分子材料,沥青,聚合物改性沥青,无机材料等为主体掺入适量的助剂,改性材料,填充材料等加工制成.与防水卷材相比,防水涂料施工简单方便,适用于任何形状的基面,并可形成致密无缝的涂膜,因此,防水涂料已广泛应用于各种防水工程中,并取得了迅速的发展.对本课题研究主要分三个阶段.研究新型防水,需要做的前期准备工作:(1)了解目前防水涂料在国内外的研究状况,发展前景.(2)了解我国建筑防水涂料的应用状况,与国外相比存在缺点.(3)目前国内外在防水涂料上所做出的进一步相关研究.(4)新型防水涂料的研究状况以及应用状况.(5)防水涂料应用仍需要解决的问题.新型防水涂料研究制备(1)目前已有制备配方研究(2)实验室产品制备(3)产品性能检测(4)成本,大批量生产可行性,产品环保以及应用推广度进行综合核算评价.目前面临问题(1)实验室条件限制(2)各种原料的购买(3)性能检测的费用2.背景资料建筑防水涂料的概念建筑防水材料是建筑材料的一个重要组成部分,属于功能性材料,建筑物和构筑物之所以要采用防水材料其主要目的是为了防潮,防渗,防漏.建筑防水涂料,(简称防水涂料)是一种建筑防水材料.将涂料单独或与胎体增强材料复合,分层涂刷或喷涂在需要进行防水处理的基层表面,即可在常温条件下形成一个连续无缝整体且具有一定厚度的涂膜防水层,从而能满足工业与民用建筑的屋面,地下室,卫生间和外墙等部位防水抗渗要求.防水涂料一般是由沥青,合成高分子聚合物,合成高分子聚合物与沥青,合成高分子与水泥或以无机复合材料等为主要成膜物质,掺入适量的颜料,助剂,溶剂等加工制成的溶剂型,水乳型或反应型的,在常温下无固定形状的黏稠状液态或可液化的固体粉末状态的含高分子合成材料的复合材料,其发展概况见检索结果(1).目前防水涂料在研究和应用上仍待解决的问题(1)防水涂料大多数是溶剂型,对环境污染较大,而水乳型聚合物改性防水涂料的质量还不够稳定.(2)一些聚合物防水涂料在力学性能,防水性能和耐久性等方面尚不是十分理想.(3)部分厂家为了降低成本,偷工减料,以次充好,致使大量不合格的产品流入市场.3.解决的问题(1)检索建筑防水涂料制备的背景知识以及相关基础知识.(2)检索到国内建筑防水涂料研究状况检索建筑防水涂料制备的背景知识.(3)检索到建筑防水涂料目前的应用状况.(4)了解到目前建筑防水涂料迫切需要解决的问题.(5)了解到各种防水涂料的生产配方以及生产工艺.4.检索过程与方法检索过程中甬道的数据库以及搜索引擎(1)检索过程甬道中外文献数据库有:中国期刊网(CNKI),维普中文期刊全文数据库,万方数据库,中国专利数据库,EBSCO数据库,CSA数据库.(2)检索过程中使用的搜索引擎:Google, . 2检索途径关键词:防水涂料Google搜索引擎:搜索词汇有:① 防水涂料②在结果中搜索:建筑防水涂料研究发展③建筑防水涂料制备cnki数据库检索:①数据库:中国期刊全文数据库②搜索关键词:建筑防水涂料③文献分类:建筑化工④跨库检索:题名:建筑防水涂料匹配:模糊从1960到2006 目录:建筑化工万方数据库检索①搜索关键词:建筑防水涂料③文献分类:建筑化工维普中文期刊全文数据库检索关键词:建筑防水涂料主题:研究制备5.检索结果(1)【主题】我建筑防水涂料的现状与发展【作者】余剑英; 董连宝; 孔宪明;【作者单位】武汉理工大学; 济南钢铁集团总公司原料处; 石油大学(华东); 湖北武汉; 山东济南; 山东东营;【刊名】新型建筑材料, New Building Materials, 编辑部邮箱 2004年 10期期刊荣誉:中文核心期刊要目总览 ASPT来源刊中国期刊方阵 CJFD收录刊【关键词】建筑防水涂料; 现状; 发展;【摘要】介绍我国建筑防水涂料的现状及存在问题,提出我国建筑防水涂料的发展应由溶剂型向水乳型,由薄质型向厚质型,由深色向浅色,由低档向高弹性,高耐久性,功能性方向发展.大力研究开发和推广高性能,高耐候,环保型防水涂料和多功能防水涂料,研究开发防水涂料系列产品,重点发展环保型聚氨酯,丙烯酸,橡胶改性沥青和水泥基渗透结晶型防水涂料,提高中,高档防水涂料比例,加快施工机具的研制与推广.【DOI】 cnki:ISSN:(2)【主题】浅议我国的建筑防水涂料【作者】广厦; 【刊名】建材工业信息, , 编辑部邮箱 2003年 08期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】 cnki:ISSN:(3)【主题】建筑防水涂料【作者】叶林标;【刊名】建筑工人, Builders' Monthly, 编辑部邮箱 2006年 03期期刊荣誉:ASPT来源刊中国期刊方阵 CJFD收录刊【DOI】 cnki:ISSN:(4)【主题】环保型建筑防水涂料【作者】李长仁; 【报纸中文名】科技信息快报, 2000-06-23【版号】 002【栏目】技术市场【DOI】 CNKI:PCN:(5)【主题】硅橡胶建筑防水涂料【作者】谭玉春; 【刊名】砖瓦世界, Brick & Tile World, 编辑部邮箱 1993年 11期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】桂橡胶建筑防水涂料的主要用途为屋面,地下室,卫生间及各种储水构筑的防渗,存水,隔热等.它的特点是无毒,无味,抗龟裂,抗老桂橡胶建筑防水涂料的主要用途为屋面,地下室,卫生间及各种储水构筑的防渗,存水,隔热等.它的特点是无毒,无味,抗龟裂,抗老化,耐高温,耐低温,耐碱和无腐蚀性,1992年末通过鉴定.硅橡胶建筑防水涂料系湖北金龙防水材料有限公司从中国科学院化学研究所引进的最新成果,在湖北独家生产.经武汉大学物理系实验室主体建筑的防水工程等施工表明,该防水涂料性能优越.经湖北省建材产品质量监督检验中心站测试,其性能指标如下:【DOI】 cnki:ISSN:(6)【主题】建筑防水涂料的现状及发展趋势【作者】蓝仁华; 陈立军; 陈焕钦; 【作者单位】华南理工大学;【刊名】国外建材科技, Science and Technology of Overseas Building Materials, 编辑部邮箱 2004年 04期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水涂料; 现状; 发展趋势; 【摘要】防水涂料是一种建筑防水材料 ,广泛应用于屋面,地下室,厕浴间和外墙等的防水.介绍了防水涂料的概念及分类,防水机理以及国内外的研究现状 ,并对未来的防水涂料的发展进行了展望【DOI】 cnki:ISSN:(7)【主题】美国防水涂料的发展现状与特点【作者】叶林标; 曹乃明; 【作者单位】北京市建筑工程研究院; 100039;【刊名】建筑技术开发, Building Technique Development, 编辑部邮箱 2001年 12期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】cnki:ISSN:(8)【主题】健康型聚氨酯防水涂料研制【作者】戴永清; 李亚军; 【作者单位】北京市顺义鹏程防水材料厂; 【刊名】化学建材, Chemical Materials For Construction, 编辑部邮箱 2002年 05期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】聚氨酯; 健康型; 减量; 节能; 高性能; 防水涂料;【摘要】对聚氨酯防水涂料的原材料选择,配方设计,生产工艺等方面进行了研究 ,以期实现聚氨酯防水涂料达到健康型,减量,节能,多功能,高性能之目的.【DOI】 cnki:ISSN:(9)【主题】国外建筑防水涂料的发展【作者】赵军;【刊名】砖瓦世界, Brick & Tile World, 编辑部邮箱 1987年 22期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】在世界各国防水材料市场90%左右为沥青卷材和高分子片材的情况下,防水涂料仍以其多变的色泽,灵巧的施工,以及在特殊形状屋面,外墙及地下建筑的防水,防渗,防潮等方【DOI】 cnki:ISSN:(10)【主题】【英文篇名】Application and Development of Waterproof Coatings for Architectures in China【作者】徐峰;【英文作者】 XU Feng;【作者单位】安徽省建筑科学研究设计院;【刊名】现代涂料与涂装, Modern Paint & Finishing, 编辑部邮箱 2006年 07期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水涂料; 环保涂料; 施工机具;【英文关键词】 waterproof coatings; environmentally friendly coatings; application machines;【摘要】简要介绍了我国防水涂料的主要种类和应用发展情况.我国防水涂料的发展将主要集中在高性能防水涂料的发展与应用,环保型防水涂料的开发,多功能防水涂料以及新型施工机具等方面.【英文摘要】 Main catergories,applications and development of waterproof coatings for architectures in China are introduced development thereof will mainly focus on the reseach and application of high-performance,environmentally friendly,multi-functional waterproof paints and the new type application machines.【DOI】 cnki:ISSN:(11)【主题】一种较好的新型建筑防水涂料【作者】肖新莲;【作者单位】四川攀枝花市十九冶建研所;【刊名】中国建筑防水, China Building Waterproofing, 编辑部邮箱 1990年 02期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】氯丁胶乳沥青防水涂料是以氯丁橡胶和沥青为基料,经加工而成的一种水乳型建筑防水涂料.特点它兼有橡胶和沥青的双重优点,具有成膜快,强度高,耐候性好,难延燃,基本无毒,无味,不污染环境,冷作业施工,操作方【DOI】 cnki:ISSN:(12)【主题】建筑防水涂料试验方法—标准操作探讨【作者】朱志远;【作者单位】国家建材局建筑防水材料产品质量监督检验中心;【刊名】中国建筑防水, CHINA BUILDING WATERPROOFING, 编辑部邮箱 1998年 02期期刊荣誉:ASPT来源刊 CJFD收录刊【摘要】『建筑防水涂料试验方法』标准操作探讨朱志远1前言GB/T16777-1997《建筑防水涂料试验方法》为各种防水涂料产品提供了一个统一的尺码来衡量产品性能,规定了一致的试验方法作为产品检测的依据,有利于防水涂料产品质量的提高及推广应用.方法标准主要参考...【DOI】 cnki:ISSN:(13)【主题】新兴防水涂料在民用建筑中的应用【作者】熊君放;【作者单位】湖南省建筑工程集团总公司;【刊名】中外建筑, Chinese and Overseas Architecture, 编辑部邮箱 2004年 03期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水涂料的特性; 施工工法;【摘要】随着建筑事业的迅猛发展,新型建筑防水涂料在基础设施建设,住宅建筑,城市建设,市政建设等领域得到了广泛的应用,并取得了显著成效.本文结合工程实践,介绍几种新型建筑防水涂料的特性,施工工法及施工中存在的问题及对策.【DOI】 cnki:ISSN:(14)【主题】建筑防水材料的现状及新型防水卷材和涂料的应用【英文篇名】The present situation of waterproof materials andapplication of new-type waterproofingroll-roofing and waterproofing paint【作者】石磊; 李青;【英文作者】 Shi Lei Li Qing;【作者单位】茂名石比检修公司设计室;【刊名】茂名学院学报, Journal of Guandong College Petrochemical Technology, 编辑部邮箱 1996年 01期期刊荣誉:ASPT来源刊 CJFD收录刊【关键词】防水层; 防水材料; 防水卷材; 防水涂料;【英文关键词】 waterproof layer; waterproof materials; waterproofing roll-roofing; waterproofing paint;【摘要】该文介绍了新型防水卷材,防水涂料的特点和应用.【英文摘要】This paper introduces characters and application of new-type waterproofing roll-roofing, waterproofing paint.【DOI】 cnki:SCN:【作者】广厦;【刊名】建材工业信息, , 编辑部邮箱 2003年 08期期刊荣誉:ASPT来源刊 CJFD收录刊 96-01-011(15)【主题】防水涂料【刊名】涂料技术与文摘, , 编辑部邮箱 1995年 03期期刊荣誉:ASPT来源刊 CJFD收录刊【DOI】 cnki:ISSN:.小结虽然我我们是化学系,但与化工中的防水涂料还是相隔很远.选择这个题目来自于自己的一个生活体会.实习时正好学校刷油漆,同学对那种油漆味真是达到难以忍受的地步,油漆是钢材防水涂料.当时我就想能不能有一种环保型涂料来代替,没有这种难以忍受的味道,后来选题时候我看到了这个题目就毫不犹豫的选择了.与导师接触以后才知道这个题目不是很简单,要有很好的专业知识和研究精神.可对这个题目我可以说一无所知,就是其中最简单的成分也不清楚.学习了化学检索这门课程,对各大数据库的相互检索,我了解了建筑防水涂料的相关知识,制备方法和配方,一些相关涂料生产地,也知道了目前国外国内在这个方面做出一些相关研究,激起了我对这个题目兴趣,虽然自己还是外行,但我相信兴趣是成功的第一步,以后我会更好的利用信息检索这个工具,圆满的完成这个课题.但有些地方我还感到不足,和很多同学一样,那就是外文检索,对于这个专业的一些英文词语很陌生,这也是自己需要改进的地方,多熟悉相关的英文词语,中英文互通.7.建议学习文献检索课我受益非浅,对学校的数据资源库也不再是任其浪费,知道了怎么样去找自己需要的一些专业性的文献,对做毕业论文以及以后的课题研究有非常大的作用.而杨老师的课件更是做的很让人佩服,学习起来轻松多了.但在教学上,可能因人而异,仍有一些地方需要改进一下.课堂气氛有些时候仍然沉闷,我们应该营造一个轻松愉快的气氛,有利于所有的同学都来参与教学,尤其是大四的学生.老师在讲课的同时应该适当和同学一起完成文献检索,多用一些实例,少介绍一点理论的知识,文献检索是一门应用性非常强的课程,多让学生动手, 而少记一些理论知识.不过在这门课上我学到了很多,这和杨老师的努力是分不开的.

药学信息检索论文

1、分析课题：明确文献检索的目的；明确课题要解决的实质问题；明确有哪些主观概念；各主题概念之间的关系。

2、选择检索系统：专业性，即选择与学科专业相关的工具，特别注意跨学科领域内容；权威性，尽量选择该学科的权威性检索工具；了解检索工具收录的范围，包括时间跨度、地理范围、文献语种、类型、揭示深度等。

3、提炼检索词：准确、专业，不要将一些意义广泛的词作为检索词，如研究等。

4、构造检索式：检索式是检索策略的逻辑表达式，是用来表达用户检索提问的，由基于检索概念产生的检索词和各种组配算符构成。

5、文献检索及检索式的调整。

6、检索结果的处理：检索结果的处理包括文献信息的选择、下载、存盘以及文献的阅读与引用。

扩展资料：

由信息检索原理可知，信息的存储是实现信息检索的基础。这里要存储的信息不仅包括原始文档数据，还包括图片、视频和音频等，首先要将这些原始信息进行计算机语言的转换，并将其存储在数据库中，否则无法进行机器识别。

待用户根据意图输入查询请求后，检索系统根据用户的查询请求在数据库中搜索与查询相关的信息，通过一定的匹配机制计算出信息的相似度大小，并按从大到小的顺序将信息转换输出。

参考资料来源：

百度百科-信息检索

是医学,生命科学领域的数据库,旨在组织、分享科研领域信息。为用户提供文献检索,图片检索,影响因子查询,免费全文下载,国家自然科学基金统计分析等服务

内容涉及药学、临床医学、基础医学、预防医学、法医学和生物医学工程等。除了可以检索丰富的医学文献外，还支持药物和疾病检索。

library

Cochrane library（考克兰图书馆）是the Cochrane Collaboration的主要产品，目前是John Wiley & Sons国际出版社负责出版。

它包含以下6个数据库 ?

Database of Systematic Review（医学保健领域系统评估的领先资源）

临床对照实验数据库

Methodology Register（介绍进行对照试验时所用方法的参考出版物）

Technology Assessment Database（卫生技术评估）

Economic Evaluation Datab6（经济评估数据库）

The Cochrane Collaboration（组成Cochrane Collaboration的80个组织的信息）

trials

Clinical trials（美国临床试验数据库）是美国国立医学图书馆（NML）与美国食品与药物管理局（FDA）在1997年开发的数据库。里面提供了网站临床试验注册辅导，登记了各种观察性研究和干预性研究，包括药物、器械和手术等干预方式。其注册和查询临床试验均为免费~

5.万方医学网

是万方数据股份有限公司旗下的网站。拥有220多种中文独家医学期刊全文、1000多种中文医学期刊全文、4100多种国外医学期刊文摘（全文以电子邮件原文传递方式获得，核心期刊全部收齐），其中包括中华医学会、中国医师协会等独家合作期刊220余种；中文期刊论文近360万篇，外文期刊论文455万余篇。

6.知网中国知识资源总库提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。CNKI已集结了7000多种期刊、近1000种报纸、18万本博士/硕士论文、16万册会议论文、30万册图书以及国内外1100多个专业数据库。

如果是校外没有这些数据库账号，可以从seek68文献馆中找到。而且还省米。

可购买中国知网等知名网站，可查询各种各样的医学药学论文。

在医学领域中，中药学是实践性很强的专业学科，不仅要求学生掌握扎实的理论知识，还要求学生具有较强的动手、分析和解决实际问题的能力。下面是我为大家整理的中药学毕业论文，供大家参考。

浅谈临床中药学的学科建设与人才培养

临床中药学是指在传统中医药理论的指导下，以患者为主体，研究中药或其制剂在人体内的作用及机制与临床用药的合理性、有效性、安全性评价及应用规律的综合性学科。近年来，随着西药临床药学在各医疗机构的深入，临床药学在不良反应监测、合理用药及作用机制研究等多方面显示出独特的优势。

但是，由于中药与西药在结构、配伍、功能主治等各个方面的巨大差异，西药临床药学在中成药、中草药方剂方面的应用捉襟见肘，故以传统中医药理论与临床药学为背景的临床中药学应运而生[1-3]。临床中药学作为一个新兴学科，其学科建设及人才培养等方面均处于摸索阶段，本单位于2015年成立临床中药学硕士招生点，且于当年成功招生，现对该学科的学科建设、人才培养的方案及经验做一归纳总结，以供同仁参考引智。

1 培养对象及培养目标

与西药临床药学类似，临床中药学是以向医疗机构提供具有临床及科研能力的临床中药师为最终目标的学科，而为满足临床的需求，临床中药师需具有中医学、中药学及科研等多重教育背景及能力，故临床中药学的培养对象需至少具有中医学或中药学的本科教育背景，在培养过程中，需掌握为患者提供安全、有效、经济、合理化用药的方法与手段，并以在临床实践中发现中药问题、解决问题为最终培养目标[4-6]。

2 培养模式及培养方案

培养时限及安排

本学科的培养时限为3年(6学期)，第1学期于校本部完成理论课的学习，第2学期至第5学期于本单位着重进行临床实践及科研，第6学期完成学位论文及答辩，即“1+4+1”的培养模式。

培养方式

本学科由研究生导师、医院药学部门及行内专家组成导师组，对研究生进行指导及培养。自研究生入学始，导师组根据培养方案、课题背景及个人特点讨论并制定培养方案，并于研究生完成理论课学习后开始实施。研究生需定期向导师组汇报学习及课题进展情况，导师组对存在的问题进行指导或纠正，并组织专家进行开题、中期汇报、答辩等环节。

理论课培养方案

本学科的理论学习目标旨在思想政治端正的前提下，拥有基本的科研思路及专业理论知识，故将课程分为3种类型：公共必修课、专业必修课及专业选修课，见表1。公共必修课进行政治思想、自然辩证法及英语的学习;专业必修课进行科研思路及科研统计方法的培养;专业选修课则是根据研究方向的需求及个人兴趣，个性化地进行专业知识的储备(至少选修3门)。

值得一提的是，由于临床中药学正处于萌芽阶段，其课程类型并不丰富，无法满足各个研究方向对理论知识的摄取，故允许研究生于其他教育部直属院校修习相关专业选修课，成绩合格后，学分亦予以承认。此举不仅满足了各研究方向对理论知识的要求，更能促进该学科的迅速发展与完善。

临床实践培养方案

总体要求与目标临床中药学是与临床医学密不可分的学科，故需本专业研究生亲身融入到临床工作中去，这是整个培养历程中的重头戏，故临床实践的总学程为24个月(4学期)，并坚持理论与实践相结合且着重实践的原则，以研究生毕业后具备临床中药学实践技能及自主解决中药学问题的能力为总体目标，参照西药的《住院药师规范化培训标准》进行临床实践培养，由导师及轮转科室的临床教师对研究生进行临床实践培养[7-9]。

实践内容与安排本学科临床实践主要分为2个阶段，各阶段学程均为12个月。

(1)通科实践阶段

该阶段需研究生在医院药学部门各岗位轮转完成，其包括门诊药房、中草药房、病房药房、药库、药检室、制剂室等部门，旨在通过实践，熟悉并掌握临床中药师的主要职业技能。

①门诊药房培养方案研究生于该岗位需掌握处方审核、调配及发药的基本技能;需熟悉药品不良反应呈报方法及流程与“精、麻、毒、放”等特殊药品的管理办法与流程;需了解“药品管理法”、“处方管理办法”等法律法规文件，中成药的用药特点及用药原则，特殊人群用药特点及用药原则。

②中草药房培养方案研究生于该岗位需掌握中草药处方审核、调配及发药的基本技能;熟悉至少100种常用中药饮片的鉴别特点，特殊饮片的管理方法与流程;了解煎药规程、操作及设施维护，煎药成品的质量控制技术。于该岗位实习约3个月。

③病房药房培养方案研究生于该岗位需掌握常用中成药的名称、功能主治、规格、用法用量、适应证、禁忌证、不良反应及注意事项，与审核医嘱、调配及发药的基本技能，“麻、精、毒、放”等特殊药品的管理办法;需熟悉药品不良反应关联性评价方法，特殊人群用药特点及用药原则，药房自动化设备的使用及维护，需了解病区基数药品的管理办法。于该岗位实习约3个月。

④药库培养方案研究生于该岗位需掌握中药饮片的鉴别与保管方法，中成药采购、贮存工作流程和要求，特殊药品的贮存方法;需熟悉药品价格信息管理，医院药事制度及药品采购管理规程;需了解药物经济学基本知识。于该岗位实习约1个月。

⑤药检室培养方案研究生于该岗位需掌握药品的质量管理方法及常用医院制剂检验方法;需熟悉药品质量控制工作的内容及流程，“药品管理法”及《中国药典》中关于药品质量检测的相关内容，需了解药品质量问题追踪流程与评估报告。于该岗位实习约1个月。

⑥ 制剂室培养方案研究生于该岗位需熟悉中药煮提操作方法，中药前处理、提取、精制、制剂成型等技术;需了解中药材炮制方法，中药特色技术传承。于该岗位实习约1个月，需至少完成10个批次的制剂配制，需至少进行1次日常设配的维护。

(2)专科实践阶段

该阶段分别在临床中药学室与各临床科室完成，研究生通过在临床中药学室的学习，掌握临床中药师的基本工作流程与技能，再根据各导师的研究方向及课题背景，选择某个临床科室，进行较为深入的临床中药学专科实践。在导师与临床带教老师的指导下参与日常医疗活动，培养临床思维及处理临床中药问题的能力。

①临床中药学室培养方案研究生于该岗位需掌握审核医嘱及干预技能，治疗药物监测数据分析与评估，提供个体化用药建议，中药的治疗原则或治疗指南，药物信息检索和评估，药物咨询，患者教育，药历书写，与医护患的沟通技能;需熟悉药学监护计划的制定与实施方案，特殊人群用药特点及用药原则，临床中药学室工作内容和流程;需了解药学查房，临床会诊及病例讨论。

② 临床科室培养方案根据导师的研究方向或临床需要，将研究生派往相关临床科室，通过与医生、护士、患者的交流，发现及解决临床中的中药问题，在具体的临床实践中提高对临床中药学知识与技能的运用能力，同时通过专业化中药学服务，规范临床用药，促进医生与患者安全、有效、经济、合理地用药。

科研培养方案

研究生在导师的指导下，根据研究方向及课题背景，自主查阅文献资料，结合临床中药问题，确定选题，撰写开题报告及文献综述。于第三至第四学期在学院内进行开题考核，考核专家小组主要就研究课题的科学性、可行性及临床实用价值三方面进行评议。

根据考核专家小组的意见，进一步修改选题内容并制定详细的科研计划后，深入基层现场和中药学工作第一线，围绕中药临床应用研究与评价、个体化用药与实践、药物安全性与用药安全等方面展开研究，最终获得具有科学性、严谨性和一定实际参考价值的结论或解决方案，并撰写毕业论文。

3 思考与设想

学科建设与人才培养之间的关系相辅相成，它们均以“人”作为主体，学科建设的最终目的即为培养人才，培养出的人才更能推动该学科的迅猛发展[10-12]，对于临床中药学这一新兴学科更是如此。该学科的建设始终是以向医疗机构提供临床中药师作为出发点及最终目标，只有专业人才的输出与配置，才能真正规范临床合理用药，而临床中药师在临床实践及对研究生的“帮、传、带”中，又可促进该学科向规范化、合理化发展。就本单位对该学科的建设方案，提出以下几点思考与设想。

整合教学资源，扩大培养规模

诚然，临床中药学这一学科现阶段正处于摸索阶段，缺乏公认的、规范化的人才培养流程，故在本阶段的第一要务即为整合现有的全部临床、教学、科研资源，努力为研究生提供一个丰富、正规、严谨的培养环境，供其在学有所专、学有所长的基础上，开拓眼界，无缝接轨临床。第二方面，各医科院校应开设临床中药学专业，扩大招生份额，使本专业的人才数量呈梯度增长，以免出现人才断层。第三方面，应加速学科带头人的选拔与培养，发挥“领头羊”的作用，在个别单位形成优势学科，迅速推动该学科的建设。

政策适度支持，规范培养模式

作为一个新兴学科，没有政府卫生部门及各医疗单位的支持会举步维艰，而临床中药学能够促进临床安全、有效、经济、合理用药是有目共睹的，故望决策者们加大对该学科的建设，以促进其快速发展[13-15]。另一方面，临床中药学应参照西药临床药学的培养模式，于较有专业实力的三甲医院设立临床中药师培训基地，选拔各基层单位的中药师进行为期1年的规范化培训，结业后对考核合格者颁发临床中药师证书，以规范各单位的临床中药学工作。此外，还应大力开展各种在职培训及继续教育，这一方面可以迅速扩大临床中药学的培训范围，另一方面也促进了各单位中药师的技能提高及专业延伸。

吸纳多学科知识经验，发挥中医药独特优势

临床中药学本属一交叉学科，是中医学、中药学、西药临床药学、循证医学及临床科研等多学科结合的产物，故该学科的建设不应仅局限在现有师资的教学上，应根据不同研究方向的特点，制定个性化的培养方案，充分汲取其他学科优势，同时也丰富了本学科的内容与深度，本单位的理论课跨校选课即是在此方面的一大突破!

当然，临床中药学的立身之本乃传统中医药理论，故在学科建设与人才培养方面不能完全套用西药临床药学的培养模式，该学科必须依据传统中医药理论，发挥中医药的特点，围绕中成药配伍、中西药复方制剂与中西药配伍、中草药剂量与煎服法、不良反应监测、临床用药咨询及中药宣传与教育等方面开展工作，并以临床用药咨询、中成药处方点评为切入点，规范医护患安全、有效、经济、合理地使用中药。

结语

诚然，本单位于2015年刚刚开展临床中药学的学科建设与人才培养，其各个方面的建设均在摸索，恰恰与临床中药学在国内的现状相一致，但我们相信，通过大家不断的探索、挑战与尝试，最终会摸索出一条适合临床中药学快速发展的特色之路;临床中药师也会随着在临床的发光发热得到医生、护士、患者的信赖与支持!望同仁们共同努力，共铸临床中药学明日之辉煌!

浅谈中药学发展的前景

继承和发展是前提，发展是最好的继承，中药学发展离不开中西医药学结合。然而，无论是中药学发展还是中西医药学结合，在当前都还存在一些令人困惑不解的问题。其中既有理解的问题，也关系到科学观念的转变。现以中药学科学探讨对此问题作如下探讨。

1中药学现代研究的困惑与思考

中药西药化

以往所进行的中药学科学研究，大多探讨的都是中药西药化。因为无论它们是怎样表述的，其核心都是从现有的中药中寻找、分离及提纯所谓的“有效成分”或化学单体，其针对的大多都是西医学的疾病，而这不正是西药的发展历程吗?如青蒿素、黄连素等，大都失去了中医药学理论的表述和应用原则，我国《药典》也已将它们归入西药收载。中药西药化也许是新西药发现或创制的一条捷径，然而，其作为中药发展之路尚有明显的不足之处。其一，从已有的中药西药化的结果来看，其虽然有成功的范例，但与整个中药的数量比较就显得非常之少。其二，从西药目前的发展状况来看，现代西药的发展本身就似乎陷入了一个走不出的“迷宫”。鉴于已有药物的临床毒副作用和病原耐药性等问题，人们忍痛地否定了一批又一批药物的使用价值，不断寻求合成新的药物。

中西药合用

中西药合用最早可以追溯到张锡纯的《医学衷中参西录》。由于中药辨证与西药辨病治疗侧重和经验积累的不同，使中西药合用在很多情况下都收到了好于单纯中药或西药的临床疗效。然而，由于中西药分属于两个不同的医学理论体系，其临床适应症也各有不同，在没有合适的结合理论指导的前提下，尤其是在当今西医药学理论愈来愈强势，中医药学理论愈来愈弱化的条件下将它们合用，不仅难免发生用药理论和方法上的牵强附会与偏差，而且亦会常常影响它们的临床疗效，甚或导致严重的临床毒副反应发生。

2中医药学科特点认识

整体大于部分之和

“整体大于部分之和”是古希腊的一个哲学观念。然而，由于在“单因素线性分析” 上所取得的卓越成就，现代医药学乃至整个现代科学都将这一点忽略了。如现代医药学不仅注重对疾病发生的每一种因素的单独认识与把握，其虽然也用复方，或在处方中也常有两种以上的药物使用，但多是针对不同“病因”而各自为战的大拼盘;其也重视药物之间的相互作用，但其多局限于两种药物之间。而中医药学辨证施治不仅在诊断上强调要“四诊合参”，形成一个整体“证候”，而且在治疗上，也是采用君臣佐使理论将其多味中药组成为一个整体处方来进行试验与观察的。如研究发现，龙胆泻肝汤与关木通加六味地黄丸及关木通加滋阴药的配伍，能显著减少其煎液中的马兜铃酸A含量;关木通加利水药与关木通加清热药，其煎液中的马兜铃酸A含量减少不显著;而关木通加甘草与关木通加附子，均可显著地增加其煎液中的马兜铃酸A含量。关木通经过炒焦、与滑石粉炒和与麦麸炒后，其煎液中的马兜铃酸A含量均有显著性降低(P<)[1]。当代名医用附子，李可最大量一昼夜达600克，祝味菊最大量在45克，姜春华用9克，而李翰卿则用克治愈过心衰的患者，其间最大相差达到2000倍，而都取得了“起沉疴”的临床疗效[2]。这用传统科学的理念是无法理解的，对此应该引起我们足够的重视。

整体并不等于宏观

整体观念是中医药学的一大优势，但整体并不等于宏观。后者只是对宏观规律的认识与把握，前者则强调事物之间的相互联系与相互作用。由于事物之间的相互联系与相互作用，使整体具有了“非线性”与“整体大于部分之和”等复杂性科学的特点;从而使其整体的特性不仅取决于其物质的构成，而且更是由物质之间的关系与构成方式来决定的。如“蝴蝶效应”只能在特定的复杂气象条件下产生;由于中药的配伍、剂量与炮制等不同，使其处方的作用有很大区别等等。那么，中药学发展不仅要重视其有效成分等物质性研究，更不能忽视对其复方配伍、炮制及其临床辨证施治规律等的认识。中药的疗效与毒性，既不能唯成分而论，也不能简单地依据剂量的大小来确定;而是要综合考虑其辨证施治、处方配伍与药材炮制等诸多因素。

整体认识需要微观化但必须转变科学观念

整体认识不仅需要微观化，而且可以随着认识方法与观察指标的微观化而微观化，只是要以复杂性科学的观念为指导。这是因为：(1)证候状态的认识、分析与处理，不断需要新指标、新方法与新药物来提高、发展与丰富其水平、能力与手段。如有人将显微镜(及电子显微镜、X光、B超等)称为“放大眼”，把听诊器等叫做“放大耳”，它使我们看到和听到了以往未能见到的现象。再如温病学向称湿温缠绵难愈，因湿邪重着黏腻，湿与热合，如油入面;但诸如肠伤寒、钩端螺旋体病、布鲁氏杆菌病等湿温类温病，今天已知并非“缠绵难愈”，因为用特效抗生素治疗，多能迅速遏制病情[3]。(2)中医药学的辨证施治或对证候状态的认识、分析与处理，虽然说传统上以宏观指标与天然的动植物药物为主;但其并不是一成不变的，而且每一次随着新指标、新药物与新方法的引进，都给其临床疗效与辨证施治规律的认识带来了飞跃与发展。中医药学现代研究既要重视对每一种因素、每一种药物甚或单体物质的作用特点与规律的认识，更不能忽视对中药复方综合作用、处方配伍、剂量与炮制，尤其是其临床辨证施治规律的研究;并在新的历史条件下，在不断引进新指标、新药物与新方法的基础上，总结出新的辨证施治(证候状态分析与处理)规律，以更好地丰富与发展中医药学。

首页

> 期刊论文知识库

信息检索的学术论文