首页

> 学术发表知识库

首页 学术发表知识库 问题

数字检索与利用论文1500字

发布时间:

数字检索与利用论文1500字

网络信息检索方法与应用这个原创。联系看我资料

事实上,所谓“大数据时代”的说法并不新鲜,早在2010年,“大数据”的概念就已由美国数据科学家维克托·迈尔·舍恩伯格系统地提出。他在 大数据时代一书中说,以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了。比如,在飞机降落之后,票价数据就没有用了;一个网络检索命令完成之后,这项指令也已进入过去时。但如今,数据已经成为一种商业资本,可以创造新的经济利益。数据能够成为一种资本,与移动互联网有密切关系。随着智能手机、平板电脑等移动数码产品的“白菜化”,Wi-Fi信号覆盖的无孔不入,越来越多的人不再有“在线时间”和“不在线时间”之分,只要他们愿意,便可几乎24小时一刻不停地挂在线上;在线交易、在线支付、在线注册等网络服务的普及固然方便了用户,却也让人们更加依赖网络,依赖五花八门的网上平台。而随着科技的进步,以往需要几盒软盘或一张光盘保存的信息,如今只需一片指甲盖大小的芯片,即可全部储存而且绰绰有余;以往需要电脑、显示器、读卡器等专门设备才能读取的数码信息载体,如今或许只需一部智能手机和一个免费下载的APP第三方应用程序,便可将数据一览无余。大数据时代的科技进步,让人们身上更多看似平常的东西成为“移动数据库”,如带有存储芯片的第二代银行卡、信用卡,带有芯片读取功能的新型护照、驾驶证、社保卡、图书证,等等。在一些发达国家,官方为了信息录入方便,还不断将多种“移动数据库”的功能组合成一体。数字化时代使得信息搜集、归纳和分析变得越来越方便,传统的随机抽样被“所有数据的汇拢”所取代,基于随机抽样而变得重要的一些属性,如抽样的精确性、逻辑思辨和推理判断能力,就变得不那么重要,尽可能汇集所有数据,并根据这些数据得出趋势和结论才至为关键。简单说,以往的思维决断模式是基于“为什么”,而在“大数据时代”,则已可直接根据“是什么”来下结论,由于这样的结论剔除了个人情绪、心理动机、抽样精确性等因素的干扰,因此,将更精确,更有预见性。不过,一些学者指出,由于“大数据”理论过于依靠数据的汇集,那么一旦数据本身有问题,在“只问有什么,不问为什么”的模式下,就很可能出现“灾难性大数据”,即因为数据本身的问题,而做出错误的预测和决策。(如能帮到你,望您采纳!!谢谢!!)

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类...第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 .txt文本,贴在下面:1.1网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。1.2信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。.3.2web信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。1.4网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。2.2.1信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。2.2.2信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。2.3Web挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。2.3,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。2.3.2web挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。2.3.3web挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。2.4信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。2.4.1信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

世界包含的多得难以想象的数字化信息变得更多更快……从商业到科学,从政府到艺术,这种影响无处不在。科学家和计算机工程师们给这种现象创造了一个新名词:“大数据”。大数据时代什么意思?大数据概念什么意思?大数据分析什么意思?所谓大数据,那到底什么是大数据,他的来源在哪里,定义究竟是什么呢?

一:大数据的定义。

1、大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

互联网是个神奇的大网,大数据开发也是一种模式,你如果真想了解大数据,可以来这里,这个手机的开始数字是一八七中间的是三儿零最后的是一四二五零,按照顺序组合起来就可以找到,我想说的是,除非你想做或者了解这方面的内容,如果只是凑热闹的话,就不要来了。

2、大数据技术,是指从各种各样类型的大数据中,快速获得有价值信息的技术的能力,包括数据采集、存储、管理、分析挖掘、可视化等技术及其集成。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。

3、大数据应用,是 指对特定的大数据集合,集成应用大数据技术,获得有价值信息的行为。对于不同领域、不同企业的不同业务,甚至同一领域不同企业的相同业务来说,由于其业务需求、数据集合和分析挖掘目标存在差异,所运用的大数据技术和大数据信息系统也可能有着相当大的不同。惟有坚持“对象、技术、应用”三位一体同步发展,才能充分实现大数据的价值。当你的技术达到极限时,也就是数据的极限”。大数据不是关于如何定义,最重要的是如何使用。最大的挑战在于哪些技术能更好的使用数据以及大数据的应用情况如何。这与传统的数据库相比,开源的大数据分析工具的如Hadoop的崛起,这些非结构化的数据服务的价值在哪里。

二:大数据的类型和价值挖掘方法

1、大数据的类型大致可分为三类:1)传统企业数据(Traditionalenterprisedata):包括 CRM systems的消费者数据,传统的ERP数据,库存数据以及账目数据等。2)机器和传感器数据(Machine-generated/sensor data):包括呼叫记(CallDetailRecords),智能仪表,工业设备传感器,设备日志(通常是Digital exhaust),交易数据等。3)社交数据(Socialdata):包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社交媒体平台。2、大数据挖掘商业价值的方法主要分为四种:1)客户群体细分,然后为每个群体量定制特别的服务。2)模拟现实环境,发掘新的需求同时提高投资的回报率。3)加强部门联系,提高整条管理链条和产业链条的效率。4)降低服务成本,发现隐藏线索进行产品和服务的创新。

三:大数据的特点

业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。具体来说,大数据具有4个基本特征:1、是数据体量巨大数据体量(volumes)大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB),这些数据如果打印出来将超过5千亿张A4纸。有资料证实,到目前为止,人类生产的所有印刷材料的数据量仅为200PB。2、是数据类别大和类型多样数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化 数据范畴,囊括了半结构化和非结构化数据。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。3、是处理速度快在数据量非常庞大的情况下,也能够做到数据的实时处理。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。4、是价值真实性高和密度低数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。以视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。

四:大数据的作用

1、对大数据的处理分析正成为新一代信息技术融合应用的结点移动互联网、物联网、社交网络、数字家庭、电子商务等是新一代信息技术的应用形态,这些应用不断产生大数据。云计算为这些海量、多样化的大数据提供存储和运算平台。通过对不同来源数据的管理、处理、分析与优化,将结果反馈到上述应用中,将创造出巨大的经济和社会价值。大数据具有催生社会变革的能量。但释放这种能量,需要严谨的数据治理、富有洞见的数据分析和激发管理创新的环境(Ramayya Krishnan,卡内基·梅隆大学海因兹学院院长)。2、大数据是信息产业持续高速增长的新引擎面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。在硬件与集成设备领域,大数据将对芯片、存储产业产生重要影响,还将催生一体化数据存储处理服务器、内存计算等市场。在软件与服务领域,大数据将引发数据快速处理分析、数据挖掘技术和软件产品的发展。3、大数据利用将成为提高核心竞争力的关键因素各行各业的决策正在从“业务驱动” 转变“数据驱动”。对大数据的分析可以使零售商实时掌握市场动态并迅速做出应对;可以为商家制定更加精准有效的营销策略提供决策支持;可以帮助企业为消费者提供更加及时和个性化的服务;在医疗领域,可提高诊断准确性和药物有效性;在公共事业领域,大数据也开始发挥促进经济发展、维护社会稳定等方面的重要作用。4、大数据时代科学研究的方法手段将发生重大改变

例如,抽样调查是社会科学的基本研究方法。在大数据时代,可通过实时监测、跟踪研究对象在互联网上产生的海量行为数据,进行挖掘分析,揭示出规律性的东西,提出研究结论和对策。

五:大数据的商业价值

1、对顾客群体细分“大数据”可以对顾客群体细分,然后对每个群体量体裁衣般的采取独特的行动。瞄准特定的顾客群体来进行营销和服务是商家一直以来的追求。云存储的海量数据和“大数据”的分析技术使得对消费者的实时和极端的细分有了成本效率极高的可能。2、模拟实境运用“大数据”模拟实境,发掘新的需求和提高投入的回报率。现在越来越多的产品中都装有传感器,汽车和智能手机的普及使得可收集数据呈现爆炸性增长。Blog、Twitter、Facebook和微博等社交网络也在产生着海量的数据。云计算和“大数据”分析技术使得商家可以在成本效率较高的情况下,实时地把这些数据连同交易行为的数据进行储存和分析。交易过程、产品使用和人类行为都可以数据化。“大数据”技术可以把这些数据整合起来进行数据挖掘,从而在某些情况下通过模型模拟来判断不同变量(比如不同地区不同促销方案)的情况下何种方案投入回报最高。3、提高投入回报率提高“大数据”成果在各相关部门的分享程度,提高整个管理链条和产业链条的投入回报率。“大数据”能力强的部门可以通过云计算、互联网和内部搜索引擎把”大数据”成果和“大数据”能力比较薄弱的部门分享,帮助他们利用“大数据”创造商业价值。4、数据存储空间出租企业和个人有着海量信息存储的需求,只有将数据妥善存储,才有可能进一步挖掘其潜在价值。具体而言,这块业务模式又可以细分为针对个人文件存储和针对企业用户两大类。主要是通过易于使用的API,用户可以方便地将各种数据对象放在云端,然后再像使用水、电一样按用量收费。目前已有多个公司推出相应服务,如亚马逊、网易、诺基亚等。运营商也推出了相应的服务,如中国移动的彩云业务。5、管理客户关系客户管理应用的目的是根据客户的属性(包括自然属性和行为属性),从不同角度深层次分析客户、了解客户,以此增加新的客户、提高客户的忠诚度、降低客户流失率、提高客户消费等。对中小客户来说,专门的CRM显然大而贵。不少中小商家将飞信作为初级CRM来使用。比如把老客户加到飞信群里,在群朋友圈里发布新产品预告、特价销售通知,完成售前售后服务等。6、个性化精准推荐在运营商内部,根据用户喜好推荐各类业务或应用是常见的,比如应用商店软件推荐、IPTV视频节目推荐等,而通过关联算法、文本摘要抽取、情感分析等智能分析算法后,可以将之延伸到商用化服务,利用数据挖掘技术帮助客户进行精准营销,今后盈利可以来自于客户增值部分的分成。以日常的“垃圾短信”为例,信息并不都是“垃圾”,因为收到的人并不需要而被视为垃圾。通过用户行为数据进行分析后,可以给需要的人发送需要的信息,这样“垃圾短信”就成了有价值的信息。在日本的麦当劳,用户在手机上下载优惠券,再去餐厅用运营商DoCoMo的手机钱包优惠支付。运营商和麦当劳搜集相关消费信息,例如经常买什么汉堡,去哪个店消费,消费频次多少,然后精准推送优惠券给用户。7、数据搜索数据搜索是一个并不新鲜的应用,随着“大数据”时代的到来,实时性、全范围搜索的需求也就变得越来越强烈。我们需要能搜索各种社交网络、用户行为等数据。其商业应用价值是将实时的数据处理与分析和广告联系起来,即实时广告业务和应用内移动广告的社交服务。运营商掌握的用户网上行为信息,使得所获取的数据“具备更全面维度”,更具商业价值。典

六:大数据对经济社会的重要影响

1、能够推动实现巨大经济效益比如对中国零售业净利润增长的贡献,降低制造业产品开发、组装成本等。预计2013年全球大数据直接和间接拉动信息技术支出将达1200亿美元。2、能够推动增强社会管理水平大数据在公共服务领域的应用,可有效推动相关工作开展,提高相关部门的决策水平、服务效率和社会管理水平,产生巨大社会价值。欧洲多个城市通过分析实时采集的交通流量数据,指导驾车出行者选择最佳路径,从而改善城市交通状况。3、如果没有高性能的分析工具,大数据的价值就得不到释放对大数据应用必须保持清醒认识,既不能迷信其分析结果,也不能因为其不完全准确而否定其重要作用。1)由于各种原因,所分析处理的数据对象中不可避免地会包括各种错误数据、无用数据,加之作为大数据技术核心的数据分析、人工智能等技术尚未完全成熟,所以对计算机完成的大数据分析处理的结果,无法要求其完全准确。例如,谷歌通过分析亿万用户搜索内容能够比专业机构更快地预测流感暴发,但由于微博上无用信息的干扰,这种预测也曾多次出现不准确的情况。2)必须清楚定位的是,大数据作用与价值的重点在于能够引导和启发大数据应用者的创新思维,辅助决策。简单而言,若是处理一个问题,通常人能够想到一种方法,而大数据能够提供十种参考方法,哪怕其中只有三种可行,也将解决问题的思路拓展了三倍。所以,客观认识和发挥大数据的作用,不夸大、不缩小,是准确认知和应用大数据的前提。

七:最后北京开运联合给您总结一下

不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。1、从大数据的价值链条来分析,存在三种模式:1)手握大数据,但是没有利用好;比较典型的是金融机构,电信行业,政府机构等。2)没有数据,但是知道如何帮助有数据的人利用它;比较典型的是IT咨询和服务企业,比如,埃森哲,IBM,开运联合等。3)既有数据,又有大数据思维;比较典型的是Google,Amazon,Mastercard等。2、未来在大数据领域最具有价值的是两种事物:

专利信息检索与利用论文

高校文献信息检索的必要性与有效方法论文

在学习、工作中,大家总免不了要接触或使用论文吧,论文可以推广经验,交流认识。如何写一篇有思想、有文采的论文呢?以下是我收集整理的高校文献信息检索的必要性与有效方法论文,希望能够帮助到大家。

摘要: 随着互联网信息、知识的不断更新,文献信息检索能力已经成为高校师生信息素养的重要内容,也是提高大学生学习能力和教师科研的重要手段,成为继续学习的重要工具。通过探讨文献信息检索的科学定义及高校信息检索的必要性,进而从文献信息检索流程角度提出高校文献信息检索的途径和策略。

关键词: 文献;信息检索;策略;

文献信息是巨大的社会财富,它伴随着社会的广泛进步而迅速更新和积累,在带给我们越来越便捷的同时,也必然给阅读、查找和充分利用信息带来一定困难。为解决庞大的科学文献和个人特定需求之间的矛盾,便产生了文献信息检索,文献信息的检索和利用已经发展成为一门专门的学科,高校信息检索能力已经成为高校师生信息素养的重要内容,也是提高大学生学习能力和教师科研的重要手段。

一、文献信息检索定义

“信息检索(Information Retrieval)”一词最早出现在20世纪50年代,有广义和狭义之分。

广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。也就是说,信息检索包括两个环节和内容:“存”和“取”。狭义的信息检索则专指信息检索过程中的第二个环节,即从信息集合中找出所需要信息的过程,也就是我们常说的信息检索、信息查找或信息搜索等术语。

信息检索按照检索对象的不同又可以分为文献检索、数据检索、事实检索。本文侧重于文献检索,即通过检索文献来获取所需要的信息、知识、情报[1]。

二、高校文献信息检索的必要性

(一)信息的多元化需要师生具备一定的信息评价和筛选能力

在当今互联网、信息化社会,人们无时无刻不在利用信息资源进行生产、生活和创新创造。但面对浩瀚的信息海洋,信息流和信息量越来越多、越来越大,人们进行检索和利用的困难也就越来越大。随着4G网络的覆盖和智能手机的普及,人们轻而易举就能接触各种各样的信息,各类门户网站、微博、微信、QQ等推送信息的常态化,一方面丰富了我们的日常生活,拓宽了我们的视野;另一方面也给我们对于浩瀚无垠的信息的过滤、评价、筛选和运用带来极大的挑战[2]。在纷繁复杂的信息洪流中,哪些是对我们有益的,哪些会给我们带来负面的影响,都要求我们具备一定的信息鉴别和评价的能力,需要我们具备较高的信息素养和信息处理能力。文献信息检索能力成为高校师生应掌握的基本学习技能之一,是继续学习的重要手段,在教学、学习、科研和生活方面发挥巨大作用。

(二)学校对学生的信息素养教育重视程度不够

早在20世纪70年代,联合国教科文组织就对“文盲”下了新的定义:在当今科学技术飞速发展的时代,文盲已不是不识字的人,而是不知道如何获取知识的人。我国国家教委要求,全国各大院校要全面普及开设文献信息检索课,这对大学生普及文献检索知识、提高信息素养、增强信息检索的兴趣、提高信息检索能力都具有十分重要的现实意义[3]。然而现状却是,全国各大高校开设的信息检索课程大部分是以选修课的形式存在,学生自愿选择,主要目的也就是为了修够学分,以这样的方式开展信息教育并不能取得理想的效果,这种重专业、轻信息素养的教育还普遍客观存在。

(三)信息检索助力高校科学研究

科学研究是高等学校重要职能之一,大学对整个社会的科技进步与发展起着重要引领与推动作用。现代科学技术的迅猛发展,各个学科的交叉和渗透一方面促使了新的学科不断涌现,源源不断地出现大量新的知识;另一方面,知识的老化和被淘汰的速度也会越来越快。作为高校科研人员,必须具备一定的信息素养,即敏锐的信息意识、发现高质量信息的能力、信息的选择和评价的能力以及如何正确地引用文献、尊重他人知识产权的能力。作为科学研究者,必须时时了解学科最前沿的动态,掌握最新的知识,这样才能研究出有价值的科研成果,而文献信息检索能力就是科学研究人员必不可少的要素之一。为了减少课题的重复研究,提高研究的成功率,科研人员在研究一项课题之前,必须要进行的相关的资料收集和文献检索。在确定选题之后同样要科学合理运用文献信息检索方法开展文献信息甄别筛选和运用,进行进一步研究,保障研究成果的承续性,进而推动科学研究向纵深发展。

三、高校文献信息检索的策略

(一)分析检索问题

在解决一个问题之前,我们首先要做的就是分析问题,对问题的分析是解决问题的关键所在。分析一个问题我们可以从如下几个方面考虑:首先,提问者是谁。同样一个问题,教师跟学生对内容的层次要求就不同;一个专业性的问题,高校专业教师和学生对问题的要求也会不同。其次,问题的性质。不同的问题对应不同的要求,如果我们对一个概念需要界定,或者需要查找与自己所撰写文章密切相关的文献,这时对概念的界定和对文献的检索就需要“准”。如果我们要做一个论文的选题的确定或者做一个项目的申报、企业新产品的开发,在做这些工作之前,我们需要对前人的研究成果做一个全面的普查,这类型的问题的要求就是“全”。再如,我们要了解某个领域的趋势前沿和最新进展,对这类问题的要求就是查找的资料必须要有新颖性,即“新”。再有,对一些技术性强的问题,如专利的申报、企业新产品的开发、某一项技术的引进等,对这类问题的检索要求是“细”。再次,学科和主题。如果只是单一的某一个学科或主题,那么只需要找到收录这个学科资源的数据库进行检索就可以。但是有很多跨学科领域研究的问题如果只是在一个数据库查找,就会造成资源的不全面。第四,资源类型。我们熟知的资源类型有学位论文、会议论文、期刊论文、图书、专利、标准等等,不同的资源类型收录的特点也不同,如内容的深度、系统性、时效性都不同,研究课题不同,对资源类型的要求也不同。第五,资源的范围。查找资料的时候往往对范围进行限定,范围包括时间范围、地域范围、语种范围等。

(二)选择合适的检索工具

分析检索问题之后,我们需要选择合适的检索工具。常用的检索工具有搜索引擎和商业数据库。搜索引擎它具有检索过程不收费、面向所有的终端用户、对用户检索水平要求较低等特点,常用的搜索引擎有谷歌、百度、搜狗、必应等。商业性数据库的特点有:第一,检索需要收费或者授权,高等学校一般都与相关商业数据库合作,校园网环境下一些商业数据库是可以免费使用的。第二,它们的功能和收录资源的范围有明确的定位,如只能检索专利信息的德温特专利创新索引、只能检索学位论文的ProQuest Digital Dissertations数据库、只能检索会议论文的CPCI、只收录世界上顶尖期刊论文的Web Of Sicence的三大引文索引数据库等。第三,这些数据库都有自己的一套检索技术,因此对用户的检索水平要求较高。除了上述的专业性数据库之外,还有一些因经常使用被我们熟知的综合性数据库,如中国知网、维普、万方等。

除了搜索引擎和商业数据库之外,还有一些其他可以免费获取资源的途径,如主题指南(导航)、数字图书馆、政府的网站(数据库)、电子预印本、博客、微博、机构知识库等途径。因此,我们只有熟知各个不同的检索工具以及它们的特色才能检索到不同的文献类型。 高校师生要立足本职工作和学习需要选取适合的文献信息检索工具,助力科学研究、日常教学和学习生活。

(三)抽取恰当的关键词

选取科学适当的检索工具后,下一步工作就是确定检索关键词。

首先,要确定研究问题有哪些核心关键词(Core Keywords),抽取核心关键词可以依据汉语主题词表,如查询表述具体事物名称的名词术语、事物的状态或现象的名词术语、科学分类的名词术语、研究方法、技术方法的名词术语、工艺方法、加工技术的名词术语、化学元素、化合物、金属材料与合金的名词术语、国家名称、地名、组织机构名称以及文献类型、文献载体的名词术语等。其次,为了保证查全率和查准率,应当注意这些核心关键词有无其他的表述方式,如同义词、近义词、与之相关的词、有无缩写形式或者全称形式、有无相关的组织机构、英文的单数复数形式等,如果有,分别检索。第三,避免用太泛的关键词,应选用专指性很强的关键词。例如,我们要检索计算机软件有关的视频资料,如果我们只输入“计算机操作视频”这样类似的检索式,当然也可以找到一些检索结果,但缺乏针对性。我们不妨直接明确输出我们要学习的.软件的名称,如“Powerpoint 视频”,这样检索出的结果的相关性就要高很多。第四,学会利用专业术语。不同的学科,他们的专业术语表述不同,如信息检索、克隆人、电子图书等都属于专业术语,对这些专业术语进行检索的时候,尽可能加上双引号进行精确检索,可以提高检索结果的相关度和准确度。

(四)构造检索式

确定几组关键词后,下一步工作就是要构造检索式。即要用一定的运算符号将这些关键词连接起来,形成具有一定意义的表达式,也叫检索提问表达式。构造检索式具有一定的专业性,这就需要依托信息检索课和上机课来实现,重点指导学生如何正确构造检索式。构造检索式,可以从以下几个方面考虑:首先要明确检索词之间的逻辑关系,用布尔逻辑运算符AND、OR、NOT将它们连接起来;然后需要考虑检索词之间的位置是否需要进行限定,如果需要则根据不同的检索工具使用一定的检索手段对检索词的位置进行限定;对于一些专有名词,是否需要作精确检索,如果需要则给检索词加上双引号;为了使检索结果更加精准,我们还需要把检索限制在某一个范围当中,比如限制在某个字段,语种、出版年、摘要、题名等不同的字段作一个限定,还有其他的各种限定,如文献类型、机构的域名的类型等等。当然,不同的检索工具可能有自己特有的语法用法,我们应当学会灵活应用和变通不同的检索方法和技巧。

(五)筛选检索结果

通过选取关键词、构造检索式进行检索后,会得到众多检索结果,但在众多的检索结果当中,并不是每一条都是我们所需要的,所以我们要对检索结果作一些筛选。首先,依据结果的相关度,我们得到的检索结果是否与我们要检索内容的主题相关,是否与我们所需要的信息内容的层次、深浅度相匹配;其次,要看作者,即要看作者的权威性和影响力,这直接影响到我们检索到的文献信息的质量,对于一些没有显示作者的网站来说就缺乏一定的严谨性;再次,要看检索结果的时效性,往往最新的观点、新的理论、新的解决方案都来源于最新发表的文献信息。另外,要合理判断检索信息的公正性、准确性,避免使用错误的、缺乏科学论证的文献资料,等等。

(六)调整检索策略

经过前面的检索步骤得出的检索结果当中,如果还是没有理想的检索结果,就需要调整检索策略。首先,当检索结果太少的时候,则需要扩大检索范围。比如看检索词是否有近义词、同义词、上位词,将这些检索词用布尔逻辑语OR来连接,可以很好的扩大检索范围。再如,利用宽容的检索方法检索,像英文单词中经常会有一部分相同的部分,那些可变换的部分就可以用截词检索代替。还有英文名词的单复数形式,如果我们要找“女性”的相关资料,只输入“woman”检索就会漏检很多,还应该对它的复数形式“women”也进行检索。还比如英文的缩写形式,比如我们要找“慕课”相关的文献,如果我们只是输入“慕课”就可能会漏掉相关重要信息,我们还应该用它的缩写形式去检索,输入“MOOC”或者它的英文全称“Massive Open Online Courses”,这样分别去检索才不会遗漏掉重要文献资料。如果是因为我们的限制太多导致检索结果太少,那么可以考虑去掉一两个限制。因为每一个检索工具收录的范围和内容有一定的侧重点和有限性,所以我们也可以考虑更换不同的检索工具进行检索。其次,当检索结果太多的时候,我们也应该采取一定的措施缩小检索范围。例如用布尔逻辑运算符AND和NOT连接检索词,用AND多加几个检索词进行限定,或者用NOT排除一些限定;使用检索词的下位词进行检索;对一些专有名称,专业术语加上引号进行精确检索也可以缩小检索范围,从而实现更精确地检索;对检索词加上一定的限制,如对它的时间、机构、网站、文献格式等进行一个限制;除此之外,我们还可以利用检索工具本身所具备的二次检索功能来筛选检索结果,从而缩小检索结果。

(七)求助专业人士

如果通过上述途径仍然不能取得理想的文献信息资料,我们可以通过一些掌握现代技术的、具有丰富科学研究经验的专业人士来获取我们想要的文献信息。例如,有很多图书馆的网站主页上都会有在线咨询的功能,我们可以通过在线咨询的服务功能从图书馆员那里获取文献信息资料。很多图书馆都开通了馆际互借的功能,通过馆际互借,我们可以共享很多成员馆的文献信息资源,而这些庞大且宝贵的文献信息资源经常会被老师们和学生们忽略掉。再如,我们还可以求助一些在线的问题回答类的网站,像百度知道、知乎等,还有国外比较权威的网站像AIIExperts等,通过询问这些网站上的一些权威专家,也可以为我们的学习和研究提供宝贵的意见。

总之,互联网是一个非常开放的空间,如果善于应用,我们不仅可以贡献自己的经验和智慧来为他人服务,我们也可以共享他人的智慧来为我们自己的研究和学习服务。

四、结语

信息检索的最终目的是通过解决各种各样的问题,进而提高学习和科学研究能力。正如美国文献家赫伯特所言:“知识的一半,是知道到哪里去寻找它。明日的文盲,不是不能阅读的人,而是缺乏检索能力的人。”互联网时代文献信息检索能力比文献信息本身更重要。来自美国的非盈利性机构“今日信息科学网站”的一份报告“Information Literacy A Skill for Life”也在呼吁互联网时代新的技能,即媒体与信息素养。由此看来,信息素养的培养不光适用于高校信息素养教育,同时也具有世界性的重要意义。文献信息知识伴随着社会的发展而迅速更新和积累,高校应强化对信息检索的指导,提高信息检索能力,助力高校教学和科学研究。

五、参考文献

[1]陈振标.文献信息检索、分析与应用[M].北京:海洋出版社,2016:19.

[2]陆和建,姜丰伟.新信息环境下高校信息检索课教学方式的优化策略[J].大学图书馆学报,2015(2):96—99,112.

[3]万爱群,杨红.浅谈开设《信息检索与利用》课程的必要性[J].广西质量监督导报,2007(6):105—118.

学位论文检索与利用

这样进行学位论文的检索:

查找国内高校的学位论文一般有一下三个途径

1.学校图书馆。

我国各高校的学位论文在学校的图书馆都有存档,可以在学校的图书馆中进行查阅浏览。学校图书馆中不一定你有想要的相关学位论文,但这也是学位论文检索的一个有效途径。

2.国家图书馆。

每年各高校的毕业学位论文都会派送到国家图书馆进行印刷,国家图书馆会将其进行编号存档,我们可以在国家图书馆的网站上进行基本信息浏览,以查找相关学位论文。

3.论文网站系统。

一些正规的论文网站都有收录高校的学位论文,登录网站进行检索可以浏览论文的基本信息或进行下载查阅。

我国国内有一些正规的学位论文查询系统,例如:CNKI中的《中国优秀硕士学位论文全文数据库》和《中国博士学位论文全文数据库》以及万方数据公司的《中国学位论文全文数据库》,这三个文库都可以直接看到论文全文。

国家科技图书文献中心(NSTL)的《中文学位论文》共有论文85.7万篇,但它只能检索到题录和文摘信息,要查看论文全文需要进行购买。

以上就是关于“学位论文检索途径与方法”的全部内容了,想了解更多论文写作技巧知识,请持续关注PaperPass论文知识频道,小编会为大家收集更多的论文知识哦。

1、首先,在搜索引擎主页搜索搜索引擎学术 2、在搜索结果中找到搜索引擎学术的官方网址,然后点击 3、输入你要查找的关键词然后点击进行搜索 4、可以看到搜索结果是综合性的 5、上方有着学位可以进行对学位论文的筛选,我们点击 6、这样,与关键词相关的学位论文就找到了,根据需要我们可以下载参考

内圈与外圈都是精选的,同等重要,但在影响因子、地区因素、学科平衡等方面有...SCI等检索系统收录,学术水平是基础,编排格式是条件,投稿途径是关键。论文的...

文献检索与利用论文3000

论文写作中文献资料检索

在社会的各个领域,许多人都写过论文吧,借助论文可以达到探讨问题进行学术研究的目的。一篇什么样的论文才能称为优秀论文呢?下面是我收集整理的论文写作中文献资料检索,欢迎阅读与收藏。

自从有了文献便有了文献检索。当人们从中查找所需信息时,文献检索也就应运而生。只不过早期可检索的对象较少,因而检索是一个不自觉的过程。早期的文献检索主要是手工检索,人们通过“心想、手翻、眼看”的方式进行。随着社会的发展和文献量的增加,人们逐渐认识到文献检索的必要性与重要性,现代文献检索是以计算机网络技术和现代信息技术为基础,在文献检索的应用中逐渐发展起来。

一、文献检索概述

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。现在通常理解为图书、期刊等各种出版物的总和。

文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。根据载体把其分为印刷型、缩微型、机读型和声像型。根据不同出版形式及内容,可以分为:图书、连续性出版物、特种文献。

电子文献是以数字方式将图、文、声、像等信息储存在磁、光、电介质上,通过计算机、网络或相关设备使用的记录有知识内容或艺术内容的文献信息资源,包括电子书刊、数据库、电子公告等。

文献检索,就是从文献信息集合中找出所需要的文献的过程,相当于人们通常所说的资料查寻。

二、纸质文献的检索

纸质文献的检索一般分为两种:直接检索和间接检索。直接文献检索地目的是为了获取所需要的文献。因此,有时可以直接从报刊杂志中通过浏览的方法直接获得所需文献,称之为直接检索。它具有方便、快捷的特点,适于浏览新到的书刊资料,有时是一种获得最新情报的方法,但同时又受到各种限制而漏查很多相关文献。因此,它只能作为一种辅助性的检索方法。

间接文献检索是一个利用检索工具并从中查出特定文献的过程。这一过程就称为间接检索。它可以比较系统地、全面地获得相关课题的文献信息。我们需要掌握的就是这种利用检索工具的间接检索的方法。这也是文献检索的主要方式。它大体上可以分为以下五个步骤:

(一)分析研究课题,明确检索要求:弄清楚课题的性质及学科专业范围是什么,所需的文献类型,要求的文种、年代的限定、课题的关键词等等是检索的第一步。

(二)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具或数据库。首先必须对各种检索工具所覆盖的学科范围有清楚的了解,然后从文献的类型、文种、出版的时间等方面来考虑选用哪种检索工具最合适。

(三)确定检索策略:选用具体的检索工具后,就要考虑选择和确定检索方法,确定具体的检索点,是从分类途径还是从主题途径检索,所查找的文献要达到什么要求,选用什么检索词等,以便具体进行检索。

(四)使用检索工具:确定了具体的检索方法后,就要利用所用的检索工具,在一定的年代和文献范围内具体查找,以获得文献信息。手工检索时可以一边检索一边分析取舍,获得符合需要的文献。(五)获取原文:检索文献最终要获取原文,如果在馆藏文献中查不到,则可通过各类联合目录获得其他单位收藏的信息,再通过馆际互借等途径或方式获取原文。这样就完成了文献检索的全过程。

文献检索方法主要有三种:

(一)追溯法(亦称滚雪球法):利用著者发表的文献后所列的参考文献为线索,由近及远,进行逐一追踪的查找办法,追查原文,再从这些原文后所附的参考文献逐一检索,象滚雪球似的获得一批批相关文献的方法。它是科研人员常喜欢用的一种简便的获得文献的途径。

(二)常用法:常用法也称工具法,就是直接利用各种文献检索工具查找文献的方法。由于检索工具的种类繁多,一般应根据课题内容特点,首先利用综合性的检索工具,然后再使用专业性的检索工具,二者结合,才不致造成文献资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。

(三)循环法:循环法也称分段法、交替法或综合法,这是追溯法和常用法的结合。是将追溯法和常用法结合起来交替使用,充分发挥二者的优势分期、分段地交替使用,直到获得满意的相关文献为止。实际课题的检索选用何种方法,要根据具体情况而定:一是根据课题研究的需要;二是视所能利用的检索工具和检索手段。在检索工具比较丰富的条件下,可以利用常用法;在获得针对性很强文献的条件下可利用追溯法获得相关性较强的文献;获悉研究课题出版文献较多的年代可利用抽查法。

三、电子文献的检索

随着计算机、数据库和互联网络技术的普及,电子化图书馆、文献资料网络化服务等正成为我们获取文献资料的必不可少的手段,是我们学习、工作和科研的有力助手。利用好电子文献和检索工具,掌握好网络信息的搜索方法和策略对于获取信息是必要的。

传统的图书检索手段和方法对电子信息的检索作用有限。现代文献信息均能以数字化的形式获得,如电子图书、电子期刊、学位论文、会议论文、专利文献、标准文献、声像资料、多媒体资料等。电子文献的检索途径主要有以下几种:

(一)网络目录和搜索引擎

各种各样的Internet网络文献检索工具不计其数,根据提供检索与否,有网络目录和搜索引擎之分。

网络目录是按主题的等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的类别直至具体资源。

搜索引擎则强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检索等方式查询信息。各种资源进行标引,并为检索者提供检索的工具。基于搜索引擎的检索方法接近于通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获取检索结果,并输出给用户。

(二)联机馆藏目录

网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。其中包括各图书馆和信息机构提供(下转第137页)

(上接第36页)的公共联机检索(OPAC)馆藏书目、地区或行业的图书馆的联合目录等。

中国国家图书馆在网上提供图书目录在线检索,有题名、责任者、出版者、关键词、标准书刊号、分类号、出版地、出版国等10个检索途径。全国高等教育文献保障体系(CALIS)提供61所高校的馆藏期刊、书目和学位论文联合查询。

(三)网络数据库

网络数据库包括综合性和专业性期刊数据库、专利数据库等信息资源。这类信息资源可分为商业性和非商业性的数据库。这些数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。

非商业性数据库因为免费使用,用户以较低的成本可获得所需的信息,所以也有很高的吸引力。如:IBM公司的免费专利文献数据库,提供美国专利的免费检索,用户可检索到1971 年以来的美国专利说明书的内容,包括专利书目信息和专利项,浏览1974年以来的专利文献。

(四)电子出版物

由于网上信息传播速度快,越来越多的出版商注重网上报刊发行。目前国内外已有很多出版高和信息服务中介商介入电子出版行业。电子出版物有电子图书、电子期刊和电子报纸。

(五)参考工具书

网络中许多参考资料是可以免费使用的,如新格罗夫音乐与音乐家大词典、英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料等大型工具书已加入因特网。

文献检索和使用的工作贯穿了论文写作的全过程:我们往往是先确定写作的大致内容;其次根据这个大致内容确定文献搜集的范围;然后阅读了主要的文献后再确定研究写作的具体内容;最后根据具体内容全面检索原始文献, 搜得的文献又充实了论文写作的基础。

一、文献检索的意义

文献检索在毕业论文撰写中的重要作用文献检索就是从大量的文献中迅速、准确地查出与特定的科学研究课题有关的资料。文献检索在大学生毕业论文撰写中有着不可替代的重要作用。

1.文献检索便于继承和借鉴前人的科研成果,避免重复研究

积累、继承和借鉴前人的研究成果是科学发展的重要前提,没有继承和借鉴就不可能有创新。毕业论文选题同科研选题、立项一样,必须通过文献信息检索或查新技术掌握国内外同类研究的动态进展,从中吸收有益的启示或参考数据,掌握大量相关信息,或得到更多、更有价值的论证依据。正如英国物理学家牛顿所说的是“站在巨人的肩膀上”,是指科研要熟悉别人的劳动成果,从前人研究的`“终点”中,找出自己研究的“起点”,从前人所用的研究方法、手段中受到启发,拓宽思路,分析研究所占有的资料,提炼出正确鲜明的观点。

2.文献检索有利于节省大学生查找文献时间,提高毕业论文质量

信息时代文献资料的迅猛增长,使得文献资料的`检索困难重重。如能灵活运用文献检索的技能,缩减检索时间,即能延长论文的写作时间。同时,文献信息检索利用可为毕业论文的观点提供理论依据和支持。大学生通过对文献信息检索分析比较后,才能从论题的创新性、内容的科学性等方面进行质量评价,进而提高论文质量。

3.文献检索启发学生的创造性思维与研究能力

图书馆文献是过去知识经验的总结,也是未来知识发展的向导。在文献检索过程中与论题有关联的文献信息很容易激发、调动大学生的潜在知识和智能,并从中获得灵感。不同的观点和方法,可促进大学生以发散性思维思考分析问题,拓展认识的深度和广度,进而全面获取有关学科的文献信息,及时了解学科领域中出现的新问题、新理论和新观点。图书馆文献信息检索利用的过程就是提高大学生研究能力的过程

二、文献检索的途径与方法

1.分析研究课题,确定检索要求

在进行具体的文献检索前,首先要分析课题,抓住课题的本质和要求,掌握代表课题内容的主题概念及其相关事物。依据本课题主题词来选定相应的检索工具,并从中选定检索标志,确定检索途径。在这方面自然科学、工程技术、人文和社会科学等具有不同的检索内容和要求。

2.选择检索工具

目前全世界有 2000 余种手工检索工具(书本型检索工具),还有联机检索、光盘数据库检索、Internet 网络检索等计算机检索工具。选择检索工具可利用“检索工具书指南”以及各种检索教材来了解检索工具书的收录情况。结合本课题,针对图书馆文献资料收藏情况,确定采用手工检索与机检相结合的方法。常用的检测工具包括以下几种:

书本检测工具:全国报刊索引、复印报刊资料、报刊资料索引、中国社会科学文献题录、国外社会科学论文索引等。

光盘数据库:全国报刊索引数据库、中国学术期刊(光盘版)、中国科学引文数据库、中国科技期刊篇名数据库、中国科技期刊篇名数据库等。

网络资源:中国知网、中国期刊网、、院校图书馆等。

3.文献检索的途径与方法

文献检索方法可分为常用法、追溯法和分段法三种。常用法是利用检索工具查找文献的方法,有三种类型,一是顺查,是以检索课题起始年代为起点,按时间顺序由远及近的查找文献的方法。二是倒查,是逆时间顺序由近及远的查找文献的方法。三是抽查,是针对学科发展的特点,抽出该学科发展迅速,发表文献比较集中的一段年代,抽查某几年的书籍和期刊、数据库。追溯法是利用已有文献后面所附的参考文献进行追溯查找的方法。一般参考文献中的原文结尾都附有新的参考文献目录,可视需要一直追溯下去,从而获得足够的文献资料。利用这些资料特别要注意综述性的文献资料,因为这些资料已对某一问题进行了一定的归纳整理,这样可以节约查找、阅读原始文献的时间。追溯法比较适合初写论文的大学生选用。分段法是将常用法与追溯法交替使用,既利用工具书检索,又利用文献后所附参考文献进行追溯。

另外,要检索重点资料,掌握核心期刊。核心期刊是期刊中学术水平较高的刊物,是我国学术评价体系的一个重要组成部分。它主要体现在对科研工作者学术水平的衡量方面,如在相当一批教学科研单位申请高级职称、取得博士论文答辩资格、申报科研项目、科研机构或高等院校学术水平评估等,都需要在核心期刊上发表一篇或若干篇论文。某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。目前国内有 7 大核心期刊(或来源期刊)遴选体系:

(1)“北大核心”:北京大学图书馆“中文核心期刊”,即北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》,每四年修订一次,目前是 2012 版;

(2)“南大核心”:南京大学“中文社会科学引文索引(CSSCI)来源期刊”;

(3)中国科学技术信息研究所“中国科技论文统计源期刊”(又称“中国科技核心期刊”);

(4)中国社会科学院文献信息中心“中国人文社会科学核心期刊”;

(5)中国科学院文献情报中心“中国科学引文数据库(CSCD)来源期刊”;

(6)中国人文社会科学学报学会“中国人文社科学报核心期刊;

(7)万方数据股份有限公司的“中国核心期刊遴选数据库”。

专题8学位论文数据库检索与利用

选择数据库根据课题要求、数据库收录信息资源和我校图书馆可利用资源的情况,本课题可选用下列检索工具和数据库:中国学位论文全文数据库中国学术会议论文全文数据库(中文版)维普中文期刊数据库中宏数据库CNKI博硕士论文库中国知识产权局网站记录检索策略1:中国学位论文全文数据库(万方)检索策略:高级检索。 标题中包含:土地资源。关键词中包含:承载力。共找到16篇符合条件的论文。2:中国学术会议论文全文数据库(中文版)检索策略:高级检索。标题中包含:土地资源。关键词中包含:承载力。共找到5篇符合条件的论文。3:维普中文期刊数据库检索条件: (关键词=承载力)*(关键词=土地资源)*全部期刊*年=1989-2011,查询结果:共找到 119条。4:CNKI博硕士论文库检索策略:高级检索。关键词=土地资源 and关键词=承载力。共找到16篇符合条件的论文。

4.如何实现连接的检索词出现在同一个句子或者一个关键词短语里?

文献信息检索与利用基本知识介绍 第二届华侨华人文献信息检索与利用讲座讲义(二)主讲人 覃建宁一、网上电子资源检索与利用l 检索方法的使用1、布尔逻辑检索所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。常用的布尔逻辑运算有三种,分别是逻辑或、逻辑与、逻辑非。逻辑或:运算符为“OR”、“or”、“+”,有时也可以用“|”表示。检索式A OR B ,表示包含检索词A的文献或包含检索词B的文献或者同时包含A和B的文献均为命中文献。使用逻辑或相当于增加检索主题的同义词与近义词,扩大了检索范围。例:华侨 OR 华人逻辑与:运算符为“AND”、“and”、“*”,有时也可能用“&”表示。检索式A AND B,表示文献中同时包含检索词A和检索词B的文献才是命中文献。使用逻辑与缩小了检索范围,增强了检索的专指性。例:华侨 AND 马来西亚逻辑非:运算符为“NOT”、“not”、“-”,有时也可能用“!”表示。检索式A NOT B,表示包含检索词A同时不包含检索词B的文献为命中文献。逻辑非排除了不希望出现的检索词,增强了检索专指性。但在使用时要特别注意,因为它同时排除了有用的文献。例:华侨 NOT 马来西亚上述三种逻辑运算的关系见图3.1。对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定,例如DIALOG系统中依次为Not→And→Or;STAIRS系统和ORBIT系统中依次为And和Not按自然顺序执行,然后执行Or运算。检索时应注意了解各机检系统的规定。每个搜索引擎可以使用的布尔运算符是不同的,有的只允许使用大写的“AND”、“NOT”、“OR”运算符,有的大小写通用,有的可支持“&”、“|”、“!”符号操作,有的不支持或仅支持其中的一个等等。例如,Google和"Yahoo!中国"都支持布尔逻辑检索。Google可用"AND"、"and"、"&"进行逻辑"与"运算,但只能用大写"OR"表示逻辑"或",不支持"NOT"逻辑符操作,允许使用"-"符号代替逻辑"非"运算;"Yahoo!中国"可用"AND"、"and"、"&"进行逻辑"与"运算,以"OR"进行逻辑"或"运算,以"NOT"、"not"进行逻辑"非"运算。确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时,查看帮助信息便是了。2、词组检索词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“""”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。检索结果必须含有与提问式完全一样 ( 包括次序 ) 的字串。几乎所有的搜索引擎都支持词组检索。例如,以"侨务新闻"作为提问关键词检索时,检索结果则仅反馈侨务新闻的内容。3、 位置检索位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。机检系统中常用的位置算符(按限制强度递增顺序排列)如下:(1).(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如 happiness(f)sadness and crying(2).(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如 machine(s)plant(3).(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。例如 information(n)retrieval 可以检出 information retrieval 和 retrieval information,又如econom ?? ?(2n) recovery 可以检出economic recovery、recovery of the economy 、recovery from economic troubles(4).(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而wear(1w)materials可检出wear materials、wear of materials采用位置算符检索时,通常最严谨的算符放在最左面,例如:european(w)economic(w)community(f)patio,redwood(3n)deck?(s)(swimming(w)pool?)注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明。4、截词检索截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。(1).右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。(2).左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。(3).中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。(4).复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。(5).有限截断:是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、acids,但不能检出acidic、acidicity、acidity等词。又如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。(6).无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。由上述可见:任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。5、 字段检索字段检索(field)是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。搜索引擎常用的字段有:Title/t、Subject、Text、host(主机)、URL/u、domain(域名)、link(链接)等。 Title:(或t:)表示查找标题中包含检索提问式的页面;URL:(或/u:)表示查找URL中包含检索提问式的页面;Link:表示查找含有链接至URL的页面;host:表示在指定的服务器上查找页面;domain:表示查找指定域名的各页面;subject:表示查找主题中包含检索提问式的页面;text:表示文本中包含检索提问式的页面。l 数据库检索的常用方法和技巧1、数据库常用的检索字段有哪些?数据库常用的检索字段列表:西文数据库常用字段 中文数据库常用字段 字段名称 字段代码 Abstract AB 文摘 Author AU 作者 Corporate CS 机构名称 Descriptor/Subject DE 叙词/主题词 Document Type DT 文献类型 Full-text FT 全文 ISSN ISSN 国际标准连续出版物号 Journal Name/Publication Title JN 期刊名称 Keyword/Topic KW 关键词 Langage LA 语言 Publication Year PY 出版年 Title TI 题名2、如何扩大检索范围?对检索数量比较少的结果,可以进行扩检,提高查全率。常用措施有:增加一些检索词,或将查询检索词的上位类词、近义词等补充进去; 调整组配算符,如改AND为OR; 使用截词检索,如改center为cent*; 取消或放宽一些检索限定,如年限、学科、文种等; 增加或修改检索入口,如改题名为文摘或全文等。3、如何进行缩小检索范围?检索结果过多是信息检索过程中一个常见问题,从中挑选出相关度高的资料还要花费很长时间。当检索结果过多时可考虑进行缩检,提高查准率。常用措施与扩检相反,如减少一些相关性不强的检索词,增加AND组配算符,增加检索限定,减少检索入口等。4、数据库比较通用的检索功能主要有哪些?比较通用的检索功能主要有三种:简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。 复杂检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进行精确检索。 二次检索:在检索结果内进一步检索,使检索结果更精练、准确。5、科技文献类型有哪些?如何识别?科技文献类型主要包括:科技图书、科技期刊、科技报告、专利文献、会议文献、学位论文、标准文献、产品资料、技术档案、政府出版物等。类型 常用字样 科技图书 Sci-Tech book:Monograph, Anthology, Textbook,Reference book 科技期刊 Sci-Tech Journal:magazine, serial, periodical 科技报告 Sci-Tech Report 专利文献 Patent Document:Patent specification/bulletin/aids 会议文献 Conference paper:Proceedings, compilation, collected paper, records Meeting: workshop, seminar, colloquium, symposium, conference 学位论文 Dissertation, Thesis6、如何找到与课题相关的文献?首先应利用本领域的核心数据库。即根据课题内容归纳出中、英文关键词,尽可能检索可以利用的、与课题相关的文献信息数据库,从而获得相关文献; 其次注意通过引文途径进一步获取相关文献。即利用已有文献中的参考文献作为获取新文献的线索,通过检索引文数据库获得更多文献; 有时通过浏览相关学会和研究机构的网站也能得到一些有用的信息。 最后从检索结果中选出最感兴趣的若干篇文献,根据文献的出处设法获取原文。7、如何识别数据库的学科范围?一般数据库都有自己特定的学科范围、文献类型。选择数据库时,关键是识别所选数据库中是否收录了所查找学科主题范围内的文献,是否有所需要的文献类型。识别方法: 通过数据库收录的来源期刊的学科范围识别; 通过图书馆网站中资源推介栏目中描述的每种数据库的学科范围来识别;8、如何选择最适合自己的数据库?选择数据库时要考虑以下几个因素: 所需信息的水平:广度、深度、专指度、学术性。 文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。 数据库主题范围:专业数据库还是综合性数据库。 数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。l 数据库检索策略所谓检索策略,广义讲是指为实现检索目标而制定的全盘计划和方案;狭义讲是指检索式。检索式是用来表达用户检索提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及系统规定的其它连接符号构成。在联机检索中,检索策略直接关系到检索结果的成败,需要对检索课题进行深入的分析并能运用各种检索方法和技巧。一般来说,构造检索策略通常包括以下步骤:1. 分析课题。2. 选择数据库。3. 分析概念,选择检索词4. 构造检索式5. 进行检索6. 获取全文 以下举例说明这些过程,假设我们要检索华侨华人文献信息专题数据库建设方面的资料,1.分析课题 现在,我们分析这个课题并描述之,显然,本课题可描述为:华侨华人文献信息专题数据库建设。另外,在明确了检索课题的主题内容后,还应预期得到什么样的检索结果,是专业文献还是一般性或通俗文章,对文献类型、时间范围及地理范围有无特殊要求等。 显然,课题要求得到有关该主题的专业文献。2. 选择数据库。选择数据库时要考虑以下几个因素: 所需信息的水平:广度、深度、专指度、学术性。 文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。 数据库主题范围:专业数据库还是综合性数据库。 数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。分析本课题,我们可以选择维普和中国期刊网进行检索。3.分析概念,选择检索词一个检索课题往往涉及多个概念,这一步的任务就是将检索课题涉及的所有概念分离出来,并针对每一个概念选择尽可能多的检索词。分析概念可从课题名称入手。如本例中,“华侨华人”、“文献”、“信息”、“数据库”即为概念词。4.构造检索式构造检索式需要使用各种检索技术,如根据概念之间的逻辑关系需使用布尔逻辑检索技术,根据词与词之间的位置关系需使用位置检索等,关于信息检索技术的详细内容,详见前述内容。本例中,我们根据这几个概念词逻辑关系,构造如下检索式:华人华人*文献*信息*数据库5.入库检索 进入相关数据库,如维普数据库,输入以上检索策略式6.获取全文注意,不同的数据库系统获取全文的方式不完全一致,具体操作请参阅分库使用指南。l 免费电子报刊、电子图书、电子论文的查找1、本馆的电子资源说明:只有校园网用户(包括校园宽带网用户和校园网拨号用户)才能使用本馆的网络数据库;如果设置了代理服务器,请去掉代理服务器后再使用;在网络中心申请的出国代理不影响数据库的使用。本馆数据库都有详细的检索帮助,如有困难,可参看帮助。u 万方数据库学位论文全文、数字期刊都有人文科学类,可以查到华侨华人研究的论文和资料。u PQDD美国博、硕士论文 1861年至今,可看到前24页全文。u UMI博士论文全文库美国博、硕士论文全文 提供PQDD论文全文。时间从1998年起至2003年。 注意:从PQDD中检索到并非都能在此找到全文。u 中国学术期刊网期刊全文 要下载安装CAJ浏览器。u 维普中文期刊全文数据库要下载安装维普全文浏览器。u EBSCOAcademic Search Premier:综合类期刊,可检索到华侨华人方面的文章。u SDOS 期刊全文 包含有社会科学。u Kluwer 期刊全文 涵盖20多个学科专题,包括生物法律、医学、心理学、物理学、航空航天、哲学、数学、计算机科学、工程、电子工程、材料、地学、社会人文、化学、商业管理等u 科学在线 期刊全文 数学 物理 天文学 地球科学 化学 材料科学 生物 医学 计算机 环境科学 经济 教育 历史 哲学 心理学 社会科学,(免费期刊)u 方正Apabi电子图书 图书全文 经济、文学、艺术、数理化、生物、医药卫生、计算机科学u 书生之家电子图书u NetLibrary 电子图书只能在线阅读,不能下载。2、互联网上的电子资源u HighWire Press (http://intl.highwire.org)英文网站,需要出国帐号。u CALIS高校学位论文库 CALIS学位论文数据库以合作建设、资源共享为目的,建立为高校师生提供学位论文和会议论文的查询、文摘索引的浏览、全文提供(传递)等配套服务。u 毕业论文网 免费,不需要注册,有相当数量的论文。u 论文库 论文帝国 168论文网 学生大论文 u 无忧论文网 只提供文摘和目录,想获取全文需要交费。u 论文资料网 只提供文摘和目录,想获取全文需要交费。u 超星数字图书馆 有超星数字卡即可使用,要下载安装超星图书阅览器。l 常用搜索引擎简介1、Google搜索引擎 目前最优秀的支持多语种的搜索引擎之一,也是全球最常用的搜索引擎。约搜索3,083,324,652 张网页。提供网站、图像、新闻组等多种资源的查询。包括35个国家和地区的语言的资源。2、百度中文搜索引擎 全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心。3、 一搜搜索引擎 “一搜”是雅虎中国推出的一个中文搜索网站。目前设立了网页、图片、MP3和网址四个频道。“一搜”采用雅虎花费数十亿美元打造出的搜索技术(YST),用户可以抓取到全球50亿网页(其中3亿个中文网页)、9000万张图片、100多万个免费音乐的海量资料。4、 中国搜索(原慧聪搜索) 中国搜索拥有全球领先的中文搜索引擎技术,现在已被新浪、搜狐、网易、TOM四大门户,以及1400多家联盟成员网站所采用。每天有数千万次的搜索服务是通过中搜的技术实现的。与一般的搜索引擎相比,中国搜索具有网页覆盖率高、数据更新快、支持中文模糊查询、强大的个性化查询、智能查询、内容相关性分析、便利的专业信息查询等优势,被公认为第三代智能搜索引擎的代表。5、 新浪分类搜索引擎 互联网上规模最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询。6、 搜狐分类搜索引擎 搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。7、 网易分类搜索引擎 网易新一代开放式目录管理系统。拥有近万名义务目录管理员。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。8、 北大天网中英文搜索引擎 由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。9、 一些常用的英文搜索引擎MSN Search、AOL Search、Terra Lycos、Altavista、ASK jeeves二、馆际互借介绍·石牌六校馆际互借到本馆办理石牌六校通过阅览证,即可到其他石牌六校中的任何一校的图书馆阅览图书资料。l 清华大学、国家图书馆的馆际互借·服务内容1、 清华大学图书馆书、刊、会议论文、学位论文、报告、标准等文献的复印件。另清华大学图书馆是国内馆际互借中心,可代用户向国内其他图书馆和国外图书馆申请复印。2、中国国家图书馆馆藏中英文图书的借阅及复印,包含如下文献:u 查询参考工具书:百科全书、工具书、机构名录、外文年鉴。中、英、俄等主要文种的社会及自然科学技术类文摘、索引。u 国际组织和外国政府出版物:联合国系统、欧洲共同体、经济合作与发展组织及美国政府出版(图书、期刊、文件)。u 中国学位论文数据库(1990-)(原文只提供纸本复印)u 中国社科报刊数据库(1993-)u NTIS美国政府报告(1983-)u 声像资料二〇〇四年十月二十八日

相关百科

热门百科

首页
发表服务