首页

> 学术发表知识库

首页 学术发表知识库 问题

信息检索论文免费

发布时间:

信息检索论文免费

谷歌学术是一个可以免费搜索外文学术文章的搜索引擎,包括了世界上绝大部分出版的学术期刊,谷歌学术可了解有关某一领域的学术文献;了解某一作者的著述,并提供书目信息(引用时必需的图书出版信息或期刊论文的刊名、刊期信息)。部分文献可直接下载。

Elsevier(sciencedirect)是荷兰一家全球著名的学术期刊出版商,每年出版大量的学术图书和期刊,大部分期刊被SCI、SSCI、EI收录,是世界上公认的高品位学术期刊。

Web of Science是获取全球学术信息的重要数据库,它收录了全球13000多种权威的、高影响力的学术期刊,内容涵盖自然科学、工程技术、生物医学、社会科学、艺术与人文等领域。Web of Science 包括著名的三大引文索引数据库(SCI、SSCI、A&HCI)。

Wiley Online Library为全学科期刊全文数据库,出版物涵盖学科范围广泛——包括化学、物理学、工程学、农学、兽医学、食品科学、医学、护理学、口腔医学、生命科学、心理学、商业、经济学、社会科学、艺术、人类学等多个学科大约1600多种期刊,以及很多其它重要的跨学科领域的期刊。

SpringerLink是全球最大的在线科学、技术和医学(STM)领域学术资源平台。Springer 的电子图书数据库包括各种的Springer图书产品,如专著、教科书、手册、地图集、参考工具书、丛书等。具体学科涉及:数学、物理与天文学、化学、生命科学、医学、工程学、计算机科学、环境科学、地球科学、经济学、法律。

ProQuest商业信息、学术研究、应用科技数据库涉及商业管理、社会与人文科学、科学与技术、金融与税务、医药学等广泛领域。提供期刊、报纸、参考书、参考文献、书目、索引、地图集、绝版书籍、记录档案、博士论文和学者论文集等各种类型的信息服务,其中ProQuest Dissertations & Theses Global(PQDT Global)是目前世界上规模最大、使用最广泛的博硕士论文数据库。

PubMed 是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要的数据库。它的数据库来源为MEDLINE。其核心主题为医学,但亦包括其他与医学相关的领域,像是护理学或者其他健康学科。提供指向全文提供者(付费或免费)的链接。

EI在全球的学术界、工程界、信息界中享有盛誉,是科技界共同认可的重要检索工具。涉及领域:机械工程、机电工程、船舶工程、制造技术、矿业、冶金、材料工程、金属材料、有色金属、陶瓷、塑料及聚合物工程等。

IEEE(Institute of Electrical & ElectronicsEngineers)是电气电子工程师协会IEEE和国际工程技术协会IET的全文库。IEEE致力于电气、电子、计算机工程和与科学有关的领域的开发和研究,在太空、计算机、电信、生物医学、电力及消费性电子产品等领域已制定了1300多个行业标准,现已发展成为具有较大影响力的国际学术组织。

百度学术于2014年6月上线,是百度旗下的免费学术资源搜索平台,提供海量中英文文献学术资源,涵盖各类学术期刊、学位、会议论文,部分文献可直接下载。

sci-hub专门免费下载外文文献,但网站经常换域名,有时不稳定,新域名也有卡顿打不开现象,而且没有收录新文献,目前2022年文献基本下不到。

学术文献下载器(wxdown.org),把海量中外文献数据库资源整合一起,涵盖上面提到的文献数据库,文献资源庞大涉及全科,包括谷歌学术和sci-hub下载不了的文献。适合学校资源不够的高校生或者是单位没有数据库资源的科研人员查阅下载文献资料。

问题一:有哪些论文网站可查询 中国知网 万方数据库 维普资讯网 一般在学校图书馆会有免费入口进入 网上也会有不定时的免费入口和免费账号登陆下载论文 问题二:有哪些检索文献的网站? 国内能够做学术期刊专业数据库的就这三家,所以你要海量的查中文文献只能在这三家里面查。 问题三:现在主要在哪些网站进行信息检索 谷歌学术搜索:scholar.google/ 国家科技图书文献中心:nstl.gov/index 万方数据库:wanfangdata/ 中国知网:ki/ 维普资讯:cqvip/ 读秀学术搜索:duxiu/ 超星数字图书馆:ssreader/ 还有就是各大高校图书馆网站。 各个公共图书馆网站。 问题四:中国最具权威性的论文网站有哪些? 果断中国知网啊,不过如果不是学生的话,你需要付费的,里面的都是学术研究报告,东西很多多 问题五:都有哪些检索论文的网站?最好是免费的。 Google学术 问题六:什么是论文网上检索页?怎么打印? (一)学术期刊检索页打印步骤: 1、进入我院图书馆网站――lib.hncj.edu/。 2 、点击图书馆网站主页上方“电子资源”栏目。 3 、进入中国期刊全文数据库或维普信息资源数据库。因镜像数据更新滞后,会出现文章已发表但库中检索不到的情况,建议使用包库(数据日更新)进行检索。 4、检索出个人期刊论文,点击论文名称后即为检索页。 5 、在网页窗口左上方,点击“文件”选项中的“打印”,打印检索页,检索页只需打印第一页。 (二)学术著作检索页打印步骤 1、进入中国新闻出版信息网――cppinfo/。 2 、点击网页上方“CIP中心”。 3 、进入后在网页右上方“CIP 核字号验证”检索栏中填写“CIP核字号”与“验证码”。 4 、点击“验证”后即为检索页,检索页默认为打印格式。 5 、在网页窗口左上方点击“文件”选项中的“打印”,打印检索页。 注:“CIP核字号”是图书版权页“ 图书在版编目(CIP)数据”中最后一行的两组数字;检索页打印只需第一页。 CIP核字号示例:其中最后一行中“2007047545”即为CIP核字号 图书在版编目(CIP)数据 数字参考咨询 : 中国的实践与研究 / 谢美萍著 . -- 长沙: 湖南师范大学出版社, 2007.05 ISBN 978-7-81081-708-0 Ⅰ. ①数… Ⅱ. ①谢…Ⅲ. ①数字技术应用-图书馆 工作-参考咨询-研究-中国Ⅳ. ①G252.6-39 中国版本图书馆CIP数据核字(2007)第047545号 问题七:广电总局网上怎么找论文检索页 广电总局的网站上可以查询图书的检索页,查不了论文的检索页,论文的检索页到万方数据、中国知网、重庆维普等网站查询。 论文检索页、图书检索页的打印详细操作方法见优庞网 问题八:搜索论文都有哪些好的网站? 总有一款适合你! 问题九:请问哪些网可以搜到完整、免费的学术论文? 如何检索查找国外学术论文文献 2009-10-10 17:11 1。文献数据库 国内主要资源 1。维普 该数据库收录8000余种社科类及自然科学类期刊的题录、文摘及全文。主题范畴为社科类、自然科学类、综合类。年代跨度为1989年至今 2。万方 万方数据资源系统的数据库有百余个,应用最多的主要是包括了专业文献库、中国科技引文库、中国学位论文库、中国期刊会议论文库等。 3。ki 主要应用包括中国期刊全文数据库、中国优秀博士硕士论文全文数据库、中国重要报纸全文数据库、中国医院知识仓库、中国重要会议论文全文数据库。 4。超星图书馆、书生之家图书馆、中国数字图书馆 国内主要汇集各类图书资源的数据库 国外主要资源 1.SpringerLink 包含学科:化学、础算机科学、经济学、工程学、环境科学、地球科学、法律、生命科学、数学、医学、物理与天文学等11个学科,其中许多为核心期刊。 2.IEEE/IEE 收录美国电气与电子工程师学会(IEEE)和英国电气工程师学会(IEE)自1988年以来出版的全部150多种期刊,5670余种会议录及1350余种标准的全文信息。 3.Engineering Village 由美国Engineering Information Inc.出版的工程类电子数据库,其中Ei pendex数据库是工程人员与相关研究者最佳、最权威的信息来源。 4.ProQuest 收录了1861年以来全世界1,000多所著名大学理工科160万博、硕士学位论文的摘要及索引,学科覆盖了数学、物理、化学、农业、生物、商业、经济、工程和计算机科学等,是学术研究中十分重要的参考信息源 5.EBSCO数据库 ASP(Academic Search Premier):内容包括覆盖社会科学、人文科学、教育、计算机科学、工程技术、语言学、艺术与文化、医学、种族研究等方面的学术期刊的全文、索引和文摘; BSP(Business Source Premier):涉及经济、商业、贸易、金融、企业管理、市场及财会等相关领域的学术期刊的全文、索引和文摘 6.SCIENCEDIRECT数据库 是荷兰Elsevier Science公司推出的在线全文数据库,该数据库将其出版的1,568种期刊全部数字化。该数据库涵盖了数学、物理、化学、天文学、医学、生命科学、商业及经济管理、计算机科学、工程技术、能源科学、环境科学、材料科学、社会科学等众多学科。 7.OCLC(OnlineputerLibraryCenter)即联机计算机图书馆中心,是世界上最大的提供文献信息服务的机构之一.其数据库绝大多数由一些美国的国家机构、联合会、研究院、图书馆和大公司等单位提供。数据库的记录中有文献信息、馆藏信息、索引、名录、全文资料等内容。资料的类型有书籍、连续出版物、报纸、杂志、胶片、计算机软件、音频资料、视频资料、乐谱等。 2。文献检索 1)国内期刊报纸全文可以在万方,维普,ki进行检索,其他专业的数据库也可以;学位论文,可以在万方、ki检索。专利、标准等文献还是要到相应的数据库进行检索。 2)国外期刊在我以上提供的数据库都可以检索,而学位论文多是在ProQuest数据库进行检索 3。进入数据库方法和思路 1)购买权限,这个不用我废话,理论上这些资源部是**的。查阅时,只能到购买权限的单位,才能进入数据库。或者,如果你有足够的钱的用来烧的话,那你可以购买阅读卡,一切都ok了! 2)采用公共的用户名和密码。这种方法用起来是最好最省事情的,但是搜......>> 问题十:文献检索网站有哪些 天呐,你不知道CNKI 天呐,你不知道谷歌学术

中国知网的论文可以免费阅读,但是需要有特定的VPN地址。

如果读者以自己大学的VPN地址登录中国知网,如果学校已经购买了中国知网的数据库,那读者就可以免费阅读下载文章,不需要付费。

如果读者是以自己的账号登录知网的页面的,阅读下载文章是收费的。

扩展资料:

中国知网服务内容

1、中国知识资源总库

提供CNKI源数据库、外文类、工业类、农业类、医药卫生类、经济类和教育类多种数据库。其中综合性数据库为中国期刊全文数据库、中国博士学位论文数据库、中国优秀硕士学位论文全文数据库、中国重要报纸全文数据库和中国重要会议文论全文数据库。

每个数据库都提供初级检索、高级检索和专业检索三种检索功能。高级检索功能最常用。

2、数字出版平台

数字出版平台是国家“十一五”重点出版工程。数字出版平台提供学科专业数字图书馆和行业图书馆。个性化服务平台由个人数字图书馆、机构数字图书馆、数字化学习平台等。

3、文献数据评价

2010年推出的《中国学术期刊影响因子年报》在全面研究学术期刊、博硕士学位论文、会议论文等各类文献对学术期刊文献的引证规律基础上,研制者首次提出了一套全新的期刊影响因子指标体系,并制定了我国第一个公开的期刊评价指标统计标准----《<中国学术期刊影响因子年报>数据统计规范》。

一系列全新的影响因子指标体系,全方位提升了各类计量指标的客观性和准确性。研制单位还出版了“学术期刊各刊影响力统计分析数据库”和“期刊管理部门学术期刊影响力统计分析数据库”,统称为《中国学术期刊影响因子年报》系列数据库。

参考资料:百度百科-中国知网

参考资料:中国青年网-"知网"大幅涨价多所高校暂停续订 学生抱电脑囤论

不是免费的,是学校已经交钱了,学校有个统一的账号和密码,需要知道这个账号和密码才能上。或直接从学校的图书馆首页信息检索登入,不需要账号密码。 回答正确! 请采纳!

信息检索与信息素养论文

本书是一部具有参考工具书特点的学术研究入门与信息素养教育读本,其整体框架有别于其他同类书籍。编著者将文献信息检索、学术规范与论文写作看作学术研究的基本要素,并置于信息素养教育的基本范畴之内。全书基于学术研究的一般范式与信息素养教育的基本规律,系统地说明了文献信息检索基础知识、基本技能,以独特的视角介绍了各种文献特点与分布,一些常用传统文献检索工具的编排组织规则和使用方法,电子文献信息检索技术,境内外著名的开放获取资源以及经典的中外文题录或文摘数据库、引文数据库、全文数据库的特点和检索技能,文献原文获取的技巧和方法,纸质文献与电子文献合理使用的范畴,学术论文的写作规范、撰写方法、投稿技巧与校样审读要领等。本书可作为高等院校本科生、研究生的文献信息检索与论文写作课程的教材,也可作为科研人员、科研管理者和图书情报工作者的参考书和指南。

浅析如何加强和培养中学生的信息技术教育与信息素养的论文

论文关键词:信息素养信息能力 信息环境 信息技术教育

论文摘要:培养学生的信息能力、提高学生的信息素养是信息技术教育的根本目标。信息素养是终身学习的基础,具备了一定的信息素养,学习者才能够获得学习的内容,能够对所做的研究进行扩展,能够对自身的学习进行更有效的控制,使其具备终身学习能力、竞争能力和创新能力。只有加强信息素养的教育,教育的职能才会充分发挥作用。

培养学生的信息能力、提高学生的信息素养是信息技术教育的根本目标。信息能力是一种基本的信息素养,它是一种在技术层面、操作层面和能力层面上的素养,它是信息素养的重要内容。除信息能力外,信息素养还应包括在认识、态度层面上的内容,即对信息、信息社会、参与信息过程和信息社会的认识和态度层面上的内容,这也是每一个信息人所必须具备的素养。信息技术教育是一种以培养学生信息能力,提高学生的信息素养为目标的学科教育。信息技术教育的教学目标应包括对信息科学的理解;对信息活用的实践能力;对信息社会的认识、态度与参与三个方面。这三个方面不仅规范了信息技术教育的内容,也决定了信息技术教育应采取的方法。根据信息技术教育的目标要求,在信息技术教育中如何培养学生的信息素养呢?

一、要培养学生对信息技术学科的兴趣

美国著名的心理学家布鲁纳说:“学习最好刺激是对学习材料的兴趣。”我国古代教育家孔子也曾经说过:“知之者不如好之者,好之者不如乐之者。”可见学习兴趣的重要性。学生如果提不起学习信息技术的兴趣,就谈不上信息素养的培养。作为教师应把严肃的“讲电脑”和烦闷的“学电脑”变为活泼的“玩电脑”和轻松的“用电脑”,使得课堂气氛轻松而有趣;也可以借助学生对电脑游戏的兴趣,训练和培养学生操作计算机的技能技巧和学习方法。比如,我们可以用纸牌、五子棋游戏教学鼠标的用法;用“打地鼠”和“摘苹果”游戏训练指法。

二、营造良好的校园信息环境

一个良好的信息环境,对信息素养的培养和提高非常重要。目前,许多中小学已有完善的校园局域网,并与g0438034连接,学生在宿舍就可以上网。图书馆有丰富的馆藏,图书馆馆员负责选择、收集、加工、存储信息,并提供某学科或某主题的相关信息等服务;对在校教师、学生进行信息检索、网络资源的培训,对新的网络检索知识开展不定期的讲座,用网络进行信息发布、信息导航、信息交流,用不同形式的读书社或社团开展信息活动,促进信息交流,使整个校园形成了一个浓浓的信息氛围,为信息素养培养奠定了良好的'支撑环境。

三、教师的教育观念和自身信息驾驭能力是培养学生信息素养的前提

培养和提高学生的信息素养,要求教师自身具有较高的信息素养,能把信息教育整合到各科教学中去。课堂教学作为传统的教学组织形式在培养学生信息素养方面具有“主渠道”和“主阵地”的作用,把信息素养的精神、意图整合到课程和教学的要求中去,贯穿于整个教学活动的始终,教师的能力就成了决定教育教学效能的基本因素。教师为了提高自身信息素养应主动在校内外参加培训、观摩教学、讲公开课等活动,听取其他老师、专家的评议和指导,拓展、丰富自己的教学方法;主动争取参加校内外同行之间的教学方案的交流,通过这种交流提高自己的信息能力。

四、在信息技术教育中教会学生运用信息技术的基本技能

随着时代的发展,特别是身处信息时代,通讯能力不仅仅包括阅读、写作和口头表达能力,这只是人们生活的基本技能。在这个分秒必争的网络时代,如果不会使用电子邮件、传真机等先进的通讯设备,那么他将被新的世纪所抛弃,培养学生在信息时代生存的基本技能,信息技术教师还应促使学生掌握搜寻自己所需的信息并能对已有信息进行有效地组织、整理、利用和传播的方法。如:教会学生能熟练使用各种信息的采集工具、编译工具、发送工具、存储工具。能熟练使用阅读、访问、参观、实验、资料检索、电子视听等获取信息的方法。善于运用创造性思维、灵感思维与发散思维方法,通过比较分析、相关分析,寻找信息生长点,发现与创造新的信息。善于运用外界信息改进学习方法,调整学习计划,善于扩充自己的知识信息库与学习方法库,能最大限度地发挥出所发现和占有信息的教育效益和社会效益。信息素养的培养应特别重视学生以信息技术的方法解决实际问题能力的培养。在解决问题的过程中,对信息的理解、对信息的判断和评价比具体机器的操作、具体软件的使用更为重要。在具有通讯能力、阅读能力、写作能力和表达能力的基础上,学习者不断发展自己对信息的敏感度,是有效完成学习任务,学会学习及掌握思考技能的前提条件。

五、在信息技术教育中培养学生思考的技能

这是信息素养三大能力的核心部分。作为信息技术老师应培养学生运用信息技术获取、利用信息的意识。让学生独立地寻求问题的答案,加强对学生思考技能的培养。事实上,学生只有掌握了思考技能,才可能独立地思考、主动提出问题、主动为问题寻求答案,而不必时时依靠教师的帮助去完成学习任务。在我们的生活当中,一件事情通常都有多种解决办法,一个问题也有多种答案。信息素养教育着力于培养学生对一个问题能提出多种解决办法的能力,不禁锢学生的思维,发展他们的发散思维。

总之,信息素养是面向信息社会的每一个成员所必须具备的一种基本素养。学校教育中,为了培养学生的信息素养,必须认真地界定学生的信息素养应包括怎样的内容,在此基础上,采取一定的措施予以培养。只有加强信息素养的教育,教育的职能才会充分发挥作用。同时对于学生的信息素养的培养不是短时间内、几个人就可以完成的,需要大量的时间以及人力物力,更需要教师们首先具有这种信息素养。在信息技术飞速发展的今天,随着信息的增大,信息渠道的拓宽,培养学生的信息素养需要通过信息技术与其他学科的整合,为中学生信息素养的形成奠定前进的方向。信息技术教育的路需要我们在实践工作中去开辟,信息素养的形成,需要学生与教师的共同努力。

参考文献:

[1]burnhein, robert.信息素养——种核心能力[j].澳大利亚图书馆学术和研究,1992.

[2]lenox, mary f. 和michael l. walker.教育过程中的信息素养[j].教育论坛.

信息检索论文4000

“信息资源共享”课程检索报告一 检索课题数字图书馆个性化服务研究现状二 主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取所需资源的可能性则越来越少, 用户需求的专业化、垂直化激化了数字图书馆大量信息数据库与用户需求之间的矛盾。1999 年, 美国图书馆与信息技术联合会(LITA) 10 位著名的数字图书馆专家在研讨会上, 把个性化定制服务列为数字图书馆发展的7 大趋势之首。目前, 数字图书馆个性化的信息服务已经开始得到普遍的关注, 人们正在为提供个性化信息服务做出努力的尝试。数字图书馆个性化服务是近几年数字图书馆研究中受到关注较多的一个研究方向,数字图书馆个性化服务是基于信息用户的信息使用行为,习惯,偏好,特点及用户特定的需求,来向用户提供满足其个性化需求的信息内容和系统功能的一种服务。关于数字图书馆个性化服务研究现状,该主题涉及到:(1)数字图书馆个性化服务的有哪些介绍(2)数字图书馆个性化服务的模式有什么(3)数字图书馆个性化服务的技术研究有哪些(4)数字图书馆个性化服务研究的最新进展(2005年-2007年)三 检索情况(一)检索工具1.维普中文期刊数据库 (1989-2007)2.中国期刊全文数据库 (1994-2007)(二)检索过程1.检索途径 关键词 题名 主题词2.检索用词 数字图书馆 关键词或题名、主题词 个性化服务 关键词或题名、主题词3.检索策略(1)维普中文期刊数据库(题名或关键词=数字图书馆)*(题名或关键词=个性化服务) 在高级检索中选择题名或关键词字段,输入“数字图书馆”和“个性化服务”两个检索词进行限定,年代限定在2005-2007年,共检索出78条记录。(2)中国期刊全文数据库(题名或关键词=数字图书馆)* (题名或关键词=数字图书馆)在高级检索中选择篇名字段,输入“数字图书馆”与“个性化服务”,年代限定在2005-2007,共检出89条记录。四 检索结果分析(一) 检索结果经检索上述两个数据库,有关数字图书馆个性化服务的研究论文众多,现选出其中具有代表性,研究主题未重复的文献。1.中国期刊全文数据库(1) 数字图书馆个性化信息服务系统研究 刘燕平 图书情报工作 2006/S2(2) 数字图书馆个性化服务系统分类体系问题 叶红 科技信息(学术研究) 2007年13期(3) 浅析智能搜索引擎技术及其在数字图书馆个性化信息服务中的应用 王林廷 高校图书情报论坛 2006年01期(4)数据挖掘技术在数字图书馆个性化服务中的应用 朱冰冰 科技情报开发与经济 2006年24期(5)数字图书馆个性化信息服务发展研究 马维华 郑州大学学报(哲学社会科学版) 2006年06期(6) 智能推送技术在数字图书馆个性化服务中的应用 石岩 情报探索 2006年11期(7) 基于文本过滤的数字图书馆个性化服务技术 张帆 计算机工程与应用 2006年31期(8) 数字图书馆信息门户的个性化服务模式 何平 中国信息导报 2006年08期(9) 网络信息技术下的数字图书馆个性化服务 张丹 林区教学 2006年07期(10)MyLibrary——数字图书馆个性化服务新趋势 杨华 农业图书情报学刊 2006年08期(11)基于Web服务组合的数字图书馆个性化动态定制服务构建 张晓青 情报学报 2006年03期(12)校园网中数字化图书馆个性化服务的实现 朱江峰 科技经济市场 2006年01期(13)数字图书馆的个性化推送服务 白雪松 图书馆杂志 2005年09期(14)Web日志挖掘在数字图书馆个性化服务中的应用 王英培 科技情报开发与经济 2005年22期(15)国内外数字图书馆个性化信息服务系统的功能与特征比较研究 张俊 情报理论与实践 2005年06期(16)基于知识管理的数字图书馆个性化服务机制研究 郭琳 四川图书馆学报 2004年05期2.维普中文期刊数据库(17)基于Web挖掘的数字图书馆个性化技术研究 王艳 张帆 情报杂志 2007年1期(18)基于文本过滤的数字图书馆个性化服务技术 张帆 杨炳儒 计算机工程与应用 2006年31期(19) 数字图书馆信息门户的个性化服务模式 何平 陈有志 中国信息导报 2006年8期(20)个性化服务深度与广度解决方式探讨 刘月胜 数字图书馆论坛 2006年6期(21)个人数字图书馆模式的分析 石德万 李军 现代情报 2005年9期(22)数字图书馆个性化信息环境与服务构建 杜安平 韶关学院学报 2005年3期(23)数字图书馆个性化信息服务的技术实现 张云瑾 许春漫 农业图书情报学刊 2005年6期(24)个性化信息服务的模式研究及策略分析 杜春光 国家图书馆学刊 2005年2期(二) 检索结论文献一论述了个性化信息服务的涵义,阐述数字图书馆开展个性化信息服务的有利条件,国内外图书馆的有关研究开发状况,分析国内数字图书馆个性化信息服务系统应用实例,并时其工作流程,主要功能进行剖析,指出该系统目前存在的问题,提出改进对策。文献二围绕数字图书馆个性化服务系统分类体系问题展开探讨。首先,简要介绍数字图书馆个性化服务系统的主要内容,包括其定义和服务内容。其次,从用户分类和信息分类两个方面阐述目前数字图书馆个性化服务系统存在的问题。用户分类主要存在的两个问题,根据用户特点分析提出相应建议。信息分类问题从五个方面进行讨论,列举数字图书馆个性化服务系统页面进行分析,提出解决方法。文献三介绍了智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以这一技术为基础构建数字图书馆的个性化服务系统,是数字图书馆信息服务的现实需要。文章论述了当前搜索引擎存在的不足,概述了智能搜索引擎的原理机制及其优越性,探讨了该技术在数字图书馆个性化服务中的应用。文献四阐述了数字图书馆的定义,介绍了个性化服务的工作原理和国内外个性化服务系统的现状,探讨了分类模型、关联模型、序列模型、聚类模型、回归模型以及时间序列模型的原理,对如何把其用在数字图书馆的个性化服务上以描述用户需求,提出了建议。文献五介绍了数字图书馆个性化信息服务是当今图书馆发展的重要趋势,目前国内外都已有比较成熟的数字图书馆个性化信息服务系统,服务方式及其功能也多种多样,但是探索图书馆个性化信息服务有效模式的任务仍很艰巨。文献六介绍了智能推送技术和个性化服务的内容,讨论了将智能推送技术应用于数字图书馆个性化服务,以及智能推送技术存在的优势与不足。文献七提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献八试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展建势。文献九简述了数字图书馆个性化服务的内涵,分析了网络信息技术对其各项服务的支撑,并通过My Library实例对这些具体技术的集成化运用加以探讨,为构建可互操作的数字图书馆个性化服务系统提供参考。文献十就My Library(我的图书馆)的产生,及其概念、类型、特征、原理、功能等诸方面做了简要的论述,并介绍了它在国内外的发展现状,指出其今后的发展方向。文献十一介绍了Web服务组合是一种利用现有Web服务动态构建新的能满足用户需求的复杂Web服务的Web服务技术。将数字图书馆各种资源组件、应用组件、功能组件和管理组件进行Web服务描述,人们就能利用Web服务组合技术根据用户的个性化需求实现对不同数字图书馆各种组件的动态集成,从而实现开放环境下数字图书馆的个性化动态定制服务。本文讨论了基于Web服务组合的数字图书馆个性化动态定制服务的基本系统架构、构建模型,并对构建过程中需要注意的几个问题展开了讨论。文献十二介绍了数字化图书馆建设是图书信息化发展的必然,而个性化服务能够根据用户不同的特点,提供切实的服务,以更好地为读者服务。本文对数字化图书馆的个性化服务进行了讨论,分析了关键的实现技术,并给出了部分核心代码。文献十三介绍了个性化推送服务是数字图书馆研究的热点,也是建设数字图书馆的关键问题之一。本文针对各种不同的信息形式提出了相应的实现方案,并对实际操作中的几个难点事项做了简要讨论。文献十四介绍了Web日志挖掘的基本概念和过程,指出通过对读者在数字图书馆服务中留下的日志信息进行挖掘,可以实现个性化服务,更好地满足不同类别读者的需求。文献十五从个性化信息服务的概念入手,介绍了个性化信息服务的几种类型,包括分类定制服务、信息推送服务、智能代理服务和垂直门户服务等,并介绍了目前国内外若干图书馆已经开展的个性化信息服务的典型应用实例。在此基础上总结了这些个性化信息服务系统的共同功能与特征,并进行了一些比较研究。文献十六介绍了构建一个基于信息过滤技术的信息服务系统是数字图书馆实现个性化信息服务的有效手段。通过对信息过滤技术概念的研究和与信息检索概念的比较,抽象出此类系统的一般模型,并沿用查全率和查准率评价信息过滤的效果,最后分析了个性化信息服务系统实现的关键技术。文献十七提出一种基于Web挖掘技术的个性化实现策略,针对数字图书馆资源的文献,改进了经典的算法,分别从Web内容挖掘、结构挖掘和日志挖掘出发,建立用户动态的兴趣特征模型,使之更具有实用性和针对性。文献十八提出在数字图书馆的应用中,个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献十九试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展趋势。文献二十提出数字图书馆的个性化服务决定了它在借助网络技术的基础上向学科馆和联盟制方向发展,以提高资源的利用率和解决个性化服务的深度与广度问题。文献二十一根据个人数字图书馆文献信息资源存储位置的不同.把个人数字图书馆划分为远程个人数字图书馆和本地个人数字图书馆两种模式,着重对这两种模式的个人数字图书馆的功能特点进行比较分析。文献二十二提出构建数字图书馆的个性化信息服务实际上就是要在数字图书馆上实现个性化资料、个性化检索、个性化过滤、个性化服务等四种环境.数字图书馆可以开发个人图书馆、检索帮助、个性化信息咨询、信息代理、垂直门户等多种个性化信息服务。文献二十三阐述了数字图书馆个性化信息服务的概念、研究与应用的现状,并分析了实现数字图书馆个性化信息服务所需的技术。文献二十四强调个性化信息服务在数字图书馆中有其特定的定义,也是数字图书馆发展中的必需。根据网络环境下图书馆信息服务的内容及用户行为的不同,可以有多种个性化服务模式,有策略地开展服务。(三) 结果分析 从2005-2007年所发表的关于图书馆学个性化服务的论文可以看出,研究的主题和方向主要集中在以下几个方面:1. 数字图书馆个性化服务的概念研究。在中国期刊全文数据库检索到的89篇文章中,有40篇是论述图书馆个性化服务概念的研究。在这些文章中作者都对数字图书馆个性化服务概念有自己的认识,对于这个概念的研究也越来越深入。2. 数字图书馆个性化服务的方式研究。对于数字图书馆个性化信息服务模式, 也在摸索实践中。目前有以下几种方式:(1)信息分类定制服务方式。分定制是指信息用户可以按照自己的目的和需求,在某一特定的系统功能和服务形式中,自己设定信息的资源类型、表现形式,选取特定的系统服务功能等。(2)信息推送服务方式。是运用推送技术(push technology)来实现的一种个性化主动信息服务的方式。(3)信息智能代理服务方式。它是一种能够完成委托任务的计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,主动搜索可能引起用户兴趣的信息并提供给用户。(4)信息垂直门户服务方式。通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工,以满足用户基于专业的深入的信息需求。(5)信息帮助检索服务方式。如何帮助用户进行高效的信息检索也是当今数字图书馆信息服务向纵深发展的一个重要内容。(6)数据挖掘服务方式。从数据库中发掘人们感兴趣的知识,这些知识是隐含的、潜在的,目的是帮助用户寻找数据间潜在的关联。(7)信息呼叫中心服务方式。主要利用电话、传真等方式来服务客户,处理简单的呼叫流程。在这些方式中,现在比较热门的个人图书馆(My library)是上述部分个性化服务方式的具体应用,是当前开发应用较为成熟的图书馆个性化服务模式系统,也是一个完全个性化的私人信息空间。3.数字图书馆个性化服务关键技术研究。数字图书馆个性化信息服务的应用技术, 集现代信息技术之大成。它包括推送技术、智能代理技术、智能搜索引擎技术、网页动态生成技术、数据挖掘技术、信息过滤技术、过程跟踪技术、安全身份认证技术、数据加密技术等, 这些都可以为数字图书馆的个性化服务方式提供技术支持。4.国内外数字图书馆个性化服务现状研究。还有一部分论文是主要介绍当今国内外数字图书馆个性化服务的现状,通过介绍这些先进的技术和模式来指导我国数字图书馆个性化的服务。5.其他研究。除了数字图书馆个性化信息服务的概念、模式、技术和国内外研究现状外, 数字图书馆个性化信息服务的研究还就数字图书馆个性化信息服务的模型构建、用户评价、馆员角色的变化、存在的问题与对策等作了深入探讨。综上所述,这两年国内有关数字图书馆个性化服务的研究可谓是硕果累累,随着对数字图书馆个性化信息服务理论研究和实践的不断深入,我国数字图书馆个性化信息服务一定能够真正实现以用户需求为中心, 利用数字图书馆信息资源开展不同层次的、多种类型的、满足用户个性需求的有效信息服务。五 检索情况总结由于这个学期开了数字图书馆这门课,对于数字图书馆有一些简单的了解,特别是对个性化信息服务这部分内容有兴趣,课本上涉及得比较少,所以就把这个内容作为了检索主题。在选择检索工具时选择了平时最常用的两个检索工具,本来还选用了中文Google,想找一下国内在研究这个主题的项目或者网站,但是检索到的内容数量实在太庞大,而且检索到的大量结果都来自各个数据库的论文,最后就放弃了使用搜索引擎。在构造检索策略时,因为该主题比较简单,不用构造很复杂的检索式,就选择了“数字图书馆”和“个性化服务”作为关键词,开始有想到是不是需要使用与“数字图书馆”概念相近的“电子图书馆”或者“虚拟图书馆”,但考虑到国内现在已经比较统一的使用“数字图书馆”这个概念,使用其他两个词检索到的文章不多,所以还是以数字图书馆为重点。检索途径选择了关键词,题名以及主题词,在使用中国期刊全文数据库进行检索时,一开始是使用关键词作为检索途径,检索出423条记录,但是有很多文章与该主题相关度不高,所以采用了篇名作为检索途径,这样两个词同时限定在文章题名中,检索的相关度就非常高,但也可能会造成漏检。觉得自从学习检索课程以来,检索最难的就是检索式的构造,检索式构造的好与坏,直接关系到检索结果的好坏。维普提供的字段有题名或关键词字段,使用高级检索将两个检索词都限定在这个字段中,检索出来的结果相对比较精确。检索完成之后,接下来的工作就是分析检索结果,这其实也是难度挺大的一项任务,要看完150几篇文章不是一件简单的事,文摘和篇名这个时候就帮了很大的忙了,一般看文摘可以略知一二,需要了解详细内容的再打开全文阅览。从文章中归纳出研究的主要内容和方向,找出比较有特色而又不重复的内容,最后再整理出结论,这就是我整个辛苦但却有趣的检索过程。通过完成这次作业,首先就是复习与巩固了以往的知识,平时虽然也经常在进行检索,但是严格按照检索步骤进行的就不太多,也没有这么有条理的对整个检索过程做一个安排,并按照计划一步一步的执行,直到完成检索结果。其次就是以往做作业都是完成老师布置的具体任务,有些题目比较简单或是比较有兴趣的检索起来还好,有些比较深奥的主题做起来真的十分困难,没有专业背景,拿到题目和检索出来的结果就觉得十分茫然。而这次老师让我们自己选择题目,我就可以从自己的兴趣和想了解的领域下手,这样完成作业的过程也不再那么枯燥,兴致自然也大了很多。还有最重要的是,做作业的目的不只是完成作业,更重要的是有收获,巩固了检索知识自不用说,通过这次阅读大量文章,也算对所检索的主题有了一个大概的认识和了解,增长了知识,开阔了视野,可是说从完成这次检索作业中的确是收获不少。

信息检索论文1500

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。2.1 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图22.2 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

文献信息检索论文

信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。2.1 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图22.2 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网

现代信息检索论文: 现代信息检索方法的探讨 要想充分利用这些浩如烟海的文献信息资源,必须借助各种各样的检索工具。同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。 一、布尔检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。 下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。 检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。 二、信息检索 信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。 信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。 目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。 三、知识检索 知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。 知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。

相关百科

热门百科

首页
发表服务