第1篇:基于分布式结构的图书馆信息检索服务系统研究
针对目前普遍采用的基于单式中心服务的信息检索搜索时间长、不准确等缺点,结合数据挖掘、数据库管理等技术,在B/S模式和C/S模式的基础上开发基于P2P平台的分布式结构数字图书馆信息检索系统,完善和优化了图书館信息检索的功能,实现了高效、实用、方便、快捷的图书馆信息服务,为用户提供了更好的图书馆服务体验。
0引言
在当今信息技术快速发展的环境下,图书馆已经由传统的人工纸质化状态进入数字信息时代,传统的信息检索系统已经不能满足人们对图书馆的服务要求,对信息的搜索效率已经成为衡量数字化图书馆先进与否的关键因素。信息检索中最早出现的是集中搜索模式[1],它由一个服务中心集中收集处理信息并将信息反馈给各个子搜索中心。这种单一的搜索系统容易出现交通阻塞、信息滞后继而出现系统崩盘等隐患,稳定性和安全性极低[1]。分布式搜索模式的出现克服了以上缺点,图书馆的信息检索系统利用分布式信息搜索模式实现了图书信息检索的高效智能化。
2004年,第一个基于P2P架构的数字图书馆系统在英国的兰开斯特大学由Walkerdine等人设置完成[1];2004年Haase等联合开发了Bibster系统;2005年美国麻省理工学院的Jcremy等设计并开发了一种基于DHT的分布式合作数字图书馆系统OverCite[1];HaoDing在数字图书馆环境中基于P2P结构创建了数据搜索模型算法[2];德国马克斯·普朗克信息学研究所的MatthiasBender等人首次将信息检索技术与P2P技术结合实现了对数字图书馆信息的检索功能,以上对数字图书馆搜索系统的设置都有一定的进步与改善,但也存在着扩展性差、搜索拥堵、运行维护成本高等缺点。通过对历史背景的研究及现状的评估,本文提出基于P2P技术的分布式图书馆信息检索系统,此系统避免了传统的单一搜索模式的弊端,在服务器端与客户端分别设置B/S模式和C/S模式[3],形成了分布式检索形式,在此基础上,将P2P技术加入分布式搜索模式中进行算法优化与改进,使图书馆信息检索能力大大提高,对图书馆信息智能化的发展具有重大意义。
1P2P搜索技术
1.1P2P搜索算法
计算机对等(Peer?to?Peer,P2P)[1]技术是当今信息网络的一种热门研究技术,主要对网络信息资源进行研究。P2P搜索算法可分为结构化搜索和非结构化搜索[4],如图1所示。结构化算法是指点对点的网络搜索,网络结构中的每个点都有确定的ID,因此在进行搜索任务时要将关键信息从头到尾逐一查询,造成搜索重复冗余、网络结构庞大刻板;非结构化的网络布局中每个网点分布随机在需要时及时加入结构,网点的位置和数目随着搜索任务的变化而变化,在进行搜索时,指针有策略地对网点进行搜索,同时及时更改搜索路线即算法,因此,非结构化的P2P搜索模式相对灵活简单,但是容易出现搜索不完全、陷入死循环等[5]。
1.2P2P搜索模式
P2P搜索模式分为中央索引模式[1]和分布式索引模式。中央索引模式如图2所示,在进行信息检索时子端信息只能传输到中央网点,再由中央网点进行下一级信息传递,这样的传输模式共享性差,资源利用率低;分布式索引模式如图3所示,其中没有中央服务器,每个网点具有相同的功能与职责,他们之间可以自由进行信息传输(只要线路存在),当某个网点进行搜索时会向周边网点传递信息,周边网点会将此信息向外扩张,直到完成信息的整个检索[6]。分布式索引避开了集中索引模式的许多弊端,使整个系统灵活快捷,但是这种模式占用太多内存,容易出现拥堵状况,因此可以将集中式与分布式结合实现混合P2P搜索模式。
2基于P2P的数字图书馆分布式搜索系统分析
如今,人们处于多元化社会,出现了诸多一词多义、模糊词语、一语多关的现象,传统基于集中式的搜索模式已经不能满足人们搜索目标的要求,因此引入P2P分布式搜索模式系统[7],在原有基础上,进一步将语义进行肢解与关联,达到准确快速搜索的目的。
2.1分布式搜索系统结构模型及关系
基于P2P的数字图书馆分布式搜索系统结构模型分为分层搜索节点模式和数据资源模式,此结构模式首先对信息进行查询服务,对用户输入信息进行判断,如果信息符合验证将进行查询解析,同时相对应的数据资源将对信息进行注册验证查询[8],然后在数据资源库中进行搜索,最后将搜索结果进行传输,呈现在用户查询结果页面,结构模型示意图如图4所示,服务器之间的关系如图5所示。
2.2文件共享与分布式搜索流程
文件共享[1]是指根据用户提供的信息,在网路节点之间进行信息交流与传递,对文件进行详细解剖,根据文件的具体内容与特征分配不同的网点进行处理与承接反馈[9];文件搜索与文件共享类似,首先由用户输入信息发出搜索请求,请求的指令传输到网络拓扑结构中,由具体网点进行接收,然后判断处理搜索内容,对内容进行解析,进入下一环节。图6,图7分别为信息共享流程图和分布式搜索流程图。
3B/S模式和C/S模式和数据库分析
服务器的B/S模式可以完成对查询信息的访问,主要是完成浏览器与服务器之间的连接;C/S模式可以完成对输入信息的访问,主要是完成客户端与服务器的连接。B/S模式和C/S模式的采用可以合理分工信息流传处理过程,使要查询的检索信息按照预定的通道传输,不会出现差错与混乱[10],采用B/S模式,可以将要查询的信息通过服务器完成,只需要将用户输入的信息加载到浏览器的系统中就能实现搜索功能,大大减轻了服务器的负荷;采用C/S模式可以将服务器要完成的任务交于客户端进行,减轻了服务器的拥堵状况,使整个道路畅通。系统总体模型图如图8所示。
来自客户端和服务端的数据需要经过数据库进行收集整合,数据库一方面从服务器端获取数据,一方面从客户端获取客户录入的数据,将双方数据进行资格认证,将查询内容准确无误地传输给用户[11],数据流程图如图9所示。
4结论
基于集中搜索模式的圖书馆搜索系统已经不能适应当今时代的需求,分布式搜索模式能够有效地解决集中式系统搜索效率低、内存占用大、系统易崩溃等缺点,为图书馆搜索服务提供更好的技术支持。本文提出的基于分布式的搜索系统加入了P2P技术,解决的问题主要体现在:
(1)本文在图书馆数据库管理系统中加入B/S模式和C/S模式,使得信息查询和结果反馈流程规范简化,减轻了服务器与客户端的负荷,使得信息在客户端输入时不会产生信息阻塞,这样输入的信息不会对后续搜索产生影响,在服务器端将要搜索的信息直接传递给浏览器,不仅使服务器的负荷减轻还使得信息搜索更加广泛,搜索的结果更加多样化,结果更加准确。
(2)本文在分布式的搜索系统中加入了P2P技术,详细分析了P2P的搜索结构模式和搜索流程,P2P使得分布式搜索模式更加有效,降低了分布式搜索模式的搜索风险,通过对关键词和特征词的具体剖析,提高了搜索的准确率,适应了当代词义的变化,给用户提供更多的选择。
(3)采用混合P2P模式,成功地避免了单一搜索模式的诸多弊端,改善了搜索查询机制性能,使得搜索模式具有更大的扩展性,搜索更加全面高效。在加入P2P的搜索模式中,搜索语言更加多元化,算法得到了改进,与数据挖掘等技术可以有效结合。能够形成更强大的搜搜引擎。
第2篇:中学图书馆信息检索选修课程的研究
文章论述了在素质教育背景下,学生信息检索能力在基础教育阶段培养的研究,包括基础教育阶段信息检索课程开设的背景、研究的意义、课程内容的编写等。
1开设中学信息检索选修课的背景
信息素养的概念最早由美国信息产业协会主席PaulZurkwski在1974年提出,指的是“利用大量信息工具(即主要信息源)使问题得到解答的技能”。1989年,美国图书馆学会(ALA)将其简单地定义为:能够判断什么时候需要信息,并且懂得如何去获取信息、如何去评价和有效利用所需的信息。1992年,Doyle在《信息素养全美论坛的终结报告》中对信息素养的概念做了详尽表述:“一个有信息素养的人,他能够认识到精确和完整的信息是做出合理决策的基础;能够确定信息需求,形成基于信息需求的问题,确定潜在的信息源,制订成功的检索方案,以及包括基于计算机和其他的信息源获取信息、评价信息、组织信息用于实际的应用,将新信息与原有的知识体系进行融合以及在批判思考和问题解决的过程中使用信息。”美国高等院校2001年版《信息素养教育规范》认为,信息素养代表着一组能力,这些能力包括:确定所需信息的内容;成功并有效地获取所需的信息;科学地评价所获信息及其来源;将所获信息融合于自己已有的知识中;有效地应用信息解决具体的问题;理解信息利用过程中相关的经济、法律和社会问题,合乎道德且合法地获取和使用信息。
信息检索是指从信息资源的集合中查找所需文献或查找所需文献中包含的信息内容的过程,信息检索是获取知识的捷径、是科学研究的向导、是终身教育的基础。信息检索能力是信息素养的一项基本能力(技能),是运用信息的基础。
信息检索课程是目前各大高校为了提高学生对信息的获取、分析和应用技能而开设的一门素质教育课。信息检索课程已经成为高校提高学生信息素养教育的重要形式。原国家教委和国家教育部在1984年、1985年和1992年分别下发了《关于在高等学校开设文献检索与利用课的意见》《关于改进和发展文献课教学的几点意见》和《文献检索课基本要求》三份指导性文件,均把课程称作“文献检索与利用”,简称“文献检索”。20世纪90年代中期,随着电子文献的激增和网络的迅速发展,文献检索课授课内容的重点开始向电子数据库方向倾斜。为体现教学内容的变化,跟上网络时代的发展,“信息检索”一词开始逐步取代“文献检索”。
2中学信息检索课程的现状
2003年,教育部颁布了《全日制普通高中信息技术课程标准》,提出了“提升信息素养,培养信息时代的合格公民”的基本理念。信息素养是信息时代公民必备的素养。高中信息技术课程以义务教育阶段课程为基础,以进一步提升学生的信息素养为宗旨,强调通过合作解决实际问题,让学生在信息的获取、加工、管理、表达与交流的过程中,掌握信息技术,感受信息文化,增强信息意识,内化信息伦理,从而使高中学生发展为适应信息时代要求的具有良好信息素养的公民。其将“信息技术基础”设为必修课程、“网络技术应用”设为选修课程,两门课均包含信息检索方面的相关知识,但不够全面与系统。“信息技术基础”主要介绍了信息获取、信息加工与表达、信息资源管理三个方面的内容,而“网络技术应用”则主要介绍了网络信息检索工具。对于信息检索的核心内容,如检索策略、信息检索的基础信息源等方面的介绍不够深入。
2.1缺乏专业授课人员
浙江省教育技术中心提供的2011年度浙江省中小学图书馆工作人员数据显示:在浙江省中小学图书馆中,高级职称的工作人员共385人,仅占全体工作人员的10%;中级职称的工作人员共1,714人,占44.7%。但这些数据不代表图书馆专业职称的工作人员的数目及比例。如:杭州外国语学校图书馆仅有2位中级职称的工作人员是图书资料方面的专业人员,其余1名高级职称、2名中级职称的工作人员都是其他学科转岗来图书馆工作的。据了解,在其他中学图书馆中也普遍存在这样的问题。
信息检索是一门精深的图书馆专业课程,如果不经过专业的培训、实践,馆员很难胜任授课的重任。而目前中学图书馆中很少有培训机会,精通信息检索的图书情报专业人员也很少,这给开课授业也带来很大困难。
2.2没有教材
大学开设信息检索课,是由各负责教学的教师编写一部分材料,最终汇编成教材或者课件。而在中学,一方面缺少专业人员编写教材,另一方面也无法直接借鉴适合大学生信息检索课程的教材,这给开设中学信息检索课带来极大的困难。
2.3中学没有开过信息检索课,无经验可循
在中学,信息检索课从来没有被纳入到必修、选修课的体系中,最多是利用新生入馆培训时简单介绍图书馆的馆藏、分类、借阅技巧等。至于如何检索,在中学几乎没有开设过相关课程,偶尔有的也仅是对小范围保送生的开课,其课程内容、授课方式等类似于大学中的信息检索课。所以在中学开设选修课,就如同摸着石头过河,需要各自在校内摸索前行,不断改进,不断积累。
3中学开设信息检索课程的意义
学者马海群指出:信息素养教育作为整个素质教育体系中的一个方面,其根本目的也必然是促进个体的身心发展。具体来说,它是一种旨在根据社会信息环境,培养和提高个体的信息觉悟、信息观念、信息主题意识、信息主动精神、信息心理素质并激发个体信息智慧和信息潜能的活动。综合信息素养的内涵,我们可得出:信息素养教育要培养具有信息素质的人,着重培养的是学生查找信息和解决信息问题的能力[1]。
近年来,“新课改”(《浙江省深化普通高中课程改革方案》)的推进,为中学开设信息检索课程创造了条件。信息检索课程可以通过培养学生信息检索能力,提高学生信息素养;同时也对学生获取知识能力和自主学习能力的培养和终身学习习惯的养成提供有力的帮助。因此,开设信息检索选修课十分有必要,如何开设行之有效的信息检索课,也将成为中学图书馆工作人员长期探索研究的重要课题之一。
4开设有效的中学信息检索选修课的实施步骤
信息爆炸时代,人们在获得各式各样信息的同时,也必须具有挑选有用信息的能力。信息检索课程帮助学生掌握信息检索与获取的综合能力,是一项终身受用的能力;是教会学生如何进行自主学习的重要课程,是提高学生全面信息素质的重要举措[2]。如何把信息检索课上得生动有趣,从而激发学生学习信息检索的兴趣,是每一位授课者需要认真思考的问题。
4.1多渠道培养专业授课人员
4.1.1增加培训机会。目前,浙江省教育厅为不断提高浙江省中小学教师的职业道德、专业知识和教学技能,出台了《浙江省中小学教师专业发展培训若干规定(试行)》,为中小学教师提供了专业培训的机会。省、市图书馆主管单位也需要向教育厅反映,联系教师培训部门,针对图书馆工作人员提供远程培训、专题培训等,以提高工作人员的业务能力和专业素质。
4.1.2开展校际合作。积极开展学校间的图书馆教研活动,发挥各图书馆专业人员的力量,共同编写适合中学生的教材,并共享教材,交流授课经验。
4.2因材施教,针对不同的年级制订不同的授课内容
中学信息检索的课程内容安排,应该包括以下几个方面:①介绍基本的理论知识。如中图分类法、网络信息分类、检索语言、检索概念、检索途径与方法等。②介绍信息资源构成。信息资源包括图书、连续出版物(2种)、特种文献(7种),合起来称作“十大信息源”。③介绍馆藏文献检索办法。如馆藏文献分类收藏的特征、查书的技巧、借阅方法等。④介绍高级检索方法。即利用检索策略,把检索的课题转化为布尔逻辑表达式,这也是学生学习并运用高级检索的基石。⑤介绍常用数据库及检索方法。⑥介绍网络资源及检索利用。包括网络信息资源特点和类型、搜索引擎、免费网络学术资源检索、检索效果与检索技巧等。⑦介绍特种文献类型、代表及检索方法。包括学位论文、专利文献、政府出版物、网络文本、档案资料、产品资料、科技报告、会议文献、标准资料等的检索方法。
4.3采取多样化的授课方式
4.3.1制作生动有趣的课件。信息检索课程的知识点比较抽象,将抽象的内容用实际例子来说明,并配以生动的图片、flash、音效等,效果会截然不同,学生也更有学习兴趣。
4.3.2增加实际操作训练。信息检索课程本身就是一门技术课,这种性质决定了它的授课地点是多样化的。如:利用学生机房或者电子阅览室进行网络信息检索、搜索引擎使用等的实际操作训练,能让学生更好地掌握这门技术。
4.4考核方式多样化
选修课的评分标准是多样化的,有时仅仅一篇文章、一次实践活动就能作为测评结果。信息检索选修课的开设,其主要目标是培养学生的动手能力,其考核内容、考核设计也更需要授课者费心思,通过实际操作来进行测评。