信息检索的作用与意义主要体现在以下三方面。(一)避免重复研究或走弯路我们知道,科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。比如,我国某研究所用了约十年时间研制成功“以镁代银”新工艺,满怀信心地去申请专利,可是美国某公司早在20世纪20年代末就已经获得了这项工艺的专利,而该专利的说明书就收藏在当地的科技信息所[7]。科学研究最忌讳重复,因为这是不必要的浪费。在研究工作中,任何一个课题从选题、试验直到出成果,每一个环节都离不开信息。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。(二)节省研究人员的时间科学技术的迅猛发展加速了信息的增长,加重了信息用户搜集信息的负担。许多研究人员在承接某个课题之后,也意识到应该查找资料,但是他们以为整天泡在图书馆“普查”一次信息就是信息检索,结果浪费了许多时间,而有价值的信息没有查到几篇,查全率非常低。信息检索是研究工作的基础和必要环节,成功的信息检索无疑会节省研究人员的大量时间,使其能用更多的时间和精力进行科学研究。(三)是获取新知识的捷径在改革开放的今天,传统教育培养的知识型人才已满足不了改革环境下市场经济的需求,新形势要求培养的是能力型和创造型人才,具备这些能力的人才首先需要具备自学能力和独立的研究能力。大学生在校期间,已经掌握了一定的基础知识和专业知识。但是,“授之以鱼”只能让其享用一时。如果掌握了信息检索的方法便可以无师自通,找到一条吸收和利用大量新知识的捷径,把大家引导到更广阔的知识领域中去,对未知世界进行探索。是谓“教人以渔”,才能终身受用无穷。德国柏林图书馆门前有这样一段话:“这里是知识的宝库,你若掌握了它的钥匙,这里的全部知识都是属于你的。”这里所说的“钥匙”即是指信息检索的方法。
相关范文:数字图书馆元数据方案设计有关问题探讨【内容提要】在阐述数字图书馆元数据方案设计原则的基础上,对数字图书馆元数据方案的设计有关问题进行较为深入的思考,并且提出若干建议。【摘 要 题】专题探讨【英文摘要】This article begins with the illustration of&n1 数字图书馆元数据方案设计原则元数据方案就是数字图书馆中所使用的信息描述方法。数字图书馆的运作,无论是存取过程还是检索过程,都是以元数据方案为基础实现的。换言之,元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础。因此,元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能。为了实现这一总体性能,达到共建共享信息资源的目的,数字图书馆元数据方案应遵循下列原则。 元数据方案的标准化原则在数字图书馆建设中,标准问题最重要的是元数据的制作,而与元数据的制作紧密相关的问题是元数据方案的设计。然而,目前在元数据方案的标准化方面存在很多问题。首先,就DC系列元数据而言,在同一元素的著录内容上存在较大的差异。如,北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围,而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明,包括知识产权等。其次,对于同类型信息资源的组织,有的图书馆已经采用DC元数据,有的则仍然采用MARC元数据。这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难。最后,各个元数据所采用的编码语言也是各不相同,有的采用HTML,有的采用SGML或XML。由于各个编码语言的标签设置、内容、可扩展性的不同,则会影响元数据的通用性。元数据方案的标准化原则具有广泛的内涵。它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面。 元数据方案的准确性原则所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可,容易产生歧义,导致不同的理解;另一方面指元数据方案能够准确地描述信息资源。也就是说,元数据方案不仅要规定元素的设置、著录规则、标记语言的使用,而且要规定著录所依据的标准、传输交换语言等。当前困扰各个搜索引擎的问题是如何提高其查准率。搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入。数字图书馆的信息资源类型多样,既有文字信息,也有音频、视频信息,只有准确地揭示它们的特征,提供高质量的元数据,才能保证较高的查准率。 元数据方案的通用性与专用性原则元数据方案的通用性与专用性都是相对而言的。所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作。所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作。具有通用性的元数据适用于组织多种类型的信息资源。通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂,但是具有很好的描述深度,因为所有的情况都已经定义了,比如MARC元数据。另一种通用性元数据,其结构非常简单,好学易用,仅仅只有几个非常普遍的属性,但对特定类型的信息资源的描述能力不够。而具有很好专用性的元数据,其对于某一特定类型的信息资源描述能力很强,但无法覆盖其它类型的信息资源。数字图书馆信息资源类型多样,过分强调专用性会导致多种元数据各自为政。因此,在设计元数据方案时,设计人员需要在通用性和专用性之间加以协调、平衡,才能产生更好的效果。 元素设置的可扩展性原则所谓元素设置的可扩展性原则是指在元数据方案设计时,为元素、元素的限定词以及属性值的扩充留有一定的余地。数字图书馆要处理的数字化信息资源非常广泛,而且各类数字化信息资源的应用背景更为复杂。如果元数据方案只提供最广泛意义上的描述,一些针对特定应用背景的内容并不纳入,那么,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。此外,元数据是一个发展活跃的领域,新的元数据元素会不断出现,老的元数据元素会不断修改完善。数字图书馆的生存环境是一个不断变化的环境,新的信息源也会层出不穷。这就要求元数据方案允许将新的元数据元素容纳于其中,或者要求修改更新已经注册的元数据方案。 元数据方案的互操作性原则所谓元数据方案的互操作性,是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下,要向用户提供一个统一的数据检索界面,确保系统对用户的一致性服务。在具体应用上,互操作性表现为易转换性,即在所携信息损失最小的前提下,可方便地转换为其它系统常用的元数据。2 数字图书馆元数据方案设计应注意的问题 非MARC元数据与数字图书馆信息资源组织的质量问题在此,根据我国当前引进、研制元数据的状况,将现存的元数据分为两类,即MARC元数据和非MARC元数据。MARC元数据包括USMARC、UNIMARC、CNMARC等。非MARC元数据包括DC系列元数据和非DC系列元数据。DC系列元数据是指我国在数字图书馆建设的过程中,对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据,也就是说这些新出现的元数据是在DC元数据的基础上进行了扩充、改进。例如,DC元数据、北京大学拓片元数据、《数字式中文全文文献通用格式》以及清华大学的建筑元数据。非DC系列元数据包括TEI头标、EAD、GILS等。目前将非DC系列元数据用于数字图书馆信息资源组织的呼声很高。美国图书馆协会(the American Library Association,简称ALA)编目:著录与检索委员会(Committee on Cataloging: Description and Access,简称CC:DA)在《元数据与编目规则研究报告》(CC:DA Task Force on metadata and Cataloging Rules:Final Report)中以TEI头标、EAD等元数据为例,就非DC系列元数据作为编目源的情况做出评估,得出三点重要结论。第一,非MARC元数据在专门针对其用途而设计的系统中效率最高,但在图书馆目录系统中的效率就不是最高的。第二,不符合AACR的普通元数据进入图书馆目录的时候,总是需要图书馆编目人员对其进行严格审查。第三,绝大多数非MARC元数据方案没有提供足够的信息以区别相似的信息资源或者内容基本相同而不同版本信息资源。[1]也就是说,只有充分地利用各种编目规则和其它一些质量保证手段,非MARC元数据才能具有较高的质量,才能用于图书馆信息资源组织。众所周知,非MARC元数据大多数是一些资源描述机构针对自己的需要而开发的。在这些元数据方案中,元数据的制作可以由专业的编目人员完成,也可以由根本没有任何经验信息资源的提供者自己完成。非专业人员制作的元数据具有费用低、元数据的专指性较好的优点。但是,这样做会导致对数字化信息资源的属性和特征的揭示程度差别很大,进而影响元数据的总体质量。到目前为止,绝大多数元数据仍然由专业人员提供。例如,TEI头标是一种复杂的元数据,绝大多数TEI文本都是由人文科学领域非图书馆专业人员创建,而TEI头标通常是由图书馆员创建或维护。如果让非专业人员参与元数据的制作,那么数字图书馆元数据方案设计就应解决元数据制作质量的检测与管理问题。 DC系列元数据与MARC元数据的关系目前,有些数字图书馆纷纷采用DC元数据作为描述数字化信息资源的格式。例如,清华大学图书馆的建筑数字图书馆项目以DC元数据作为基本框架,结合建筑资料的实际情况对DC元数据进行改造,扩充为THDL——清华大学建筑数字图书馆元数据格式。北京大学依据DC元数据开发了拓片元数据格式。上海图书馆也使用了DC元数据。自从DC元数据产生以来,图书馆界争论不休的问题是,图书馆是继续使用MARC元数据,还是舍弃MARC元数据,改用DC元数据?具体到我国,在任何一个数字图书馆元数据方案的设计过程中,必然要涉及到MARC元数据与DC系列元数据关系的处理。DC元数据最初的定位是处于全文索引和复杂格式的元数据之间,提供简单明了的元数据格式。DC元数据与MARC元数据的最主要的区别在于DC元数据结构简单,而MARC元数据复杂。DC元数据经过数次研讨会后,对其进行扩展,使用修饰限定词使得DC元数据不可避免地复杂起来。其扩展的原因有两个。一是应用领域比较复杂,DC元数据没有足够的元素来描述信息资源的各种重要特征;二是人们希望DC元数据应用于多个领域。实际上,无论如何扩展,DC元数据不可能解决所有数字化信息资源的描述问题。笔者建议:由国家标准化权威机构——全国信息与文献标准化技术委员会来制定适应于各类数字化信息资源的元数据方案。这样做,可以在全国范围内,就某一类数字化信息资源采用何种元数据著录达成共识。目前,在MARC元数据与DC系列元数据并存的情况下,信息资源的存储与检索必然涉及MARC元数据与DC系列元数据两者之间的转换,是将全部MARC元数据转换为DC元数据,还是将DC元数据转换为MARC元数据?笔者认为,MARC元数据与DC元数据之间转换的目的是实现一条记录可以以MARC元数据和DC元数据两种格式来显示以及数据的交换与共享。但是,如果用户没有这种需求或者两者之间不转换并不影响数据交换,则没有必要进行转换。也就是说,根据实际需要来决定是否需要MARC元数据与DC元数据之间相互转换。MARC元数据与DC元数据之间的转换会产生很多问题。由于MARC元数据的描述能力大大丰富于DC元数据,如何尽量解决两者之间转换所产生的歧义与不确定性以及信息丢失等难题。 元数据的编码语言问题元数据的编码语言是指针对元数据元素和结构进行定义和描述的具体语法和语义规则。目前,各种元数据使用的编码语言是不同的,包括标准通用标记语言(Standard General Markup Language,简称SGML)、超文本标记语言(Hypertext Markup Language,简称HTML)、可扩展标记语言(Extensible Markup Language,简称XML)三种形式。有些元数据明确规定使用何种标记语言,如TEI头标、EAD和美国联邦地理数据委员会《数字地理空间元数据内容标准》使用SGML。也有些元数据没有规定使用何种编码语言,如DC元数据,有使用HTML,也有使用XML的。从数据交换和共享的需要出发,元数据的作用是传递计算机系统可以理解的描述信息和存储数据。计算机首先要理解元数据的各个元素或字段序列化的方式,即按怎样的顺序和结构来组织各个元素及其内容。所使用的编码语言不同,元数据编码规则以及记录格式也存在差异。这样则不利于数据的交换和信息资源的共享。因此,从长远利益来看,有必要对元数据的编码语言进行统一。3 对我国数字图书馆元数据方案设计的若干建议 推进元数据标准化进程,提高元数据的互操作能力目前,国内出现了许多种元数据,例如,拓片元数据、建筑元数据、古籍元数据、中文数字化全文文献元数据等,由于每种元数据都是由不同图书馆研制而成的,并且针对不同类型的数字化信息资源。因此,就会出现DC系列元数据与MARC元数据并存的局面。这种局面有利于DC系列元数据与MARC元数据形成优势互补,也可以使某些适合用DC系列元数据描述的特定类型信息资源被充分地揭示和利用。同时,这种局面也会带来一些问题。目前,我国DC系列元数据至少有4种以上,那么对DC系列元数据是否一体化;那些特定类型信息资源以前的机读记录该如何处理等。笔者主张DC系列元数据一体化,反对各自为政。DC系列元数据都是在DC元数据的基础上根据用户的需求与信息资源特点进行了修正,所以这些元数据的核心或实质仍然是DC元数据。这一点可以作为DC系列元数据一体化的基础,但是,这种一体化工作完成就需要各个研制单位之间的协调与合作,需要以国家标准的形式出现加以强制执行,从而结束元数据结构各自为政的局面。对于那些原由MARC元数据著录的信息资源来说,MARC记录已为受编信息资源提供了著录内容详尽,查全率高的机读格式,在受编信息资源数字化的过程中没有必要舍弃原有的元数据,而采用其它元数据方案。 选择适用的编码语言在数字图书馆元数据方案设计中,编码语言的选择也是关键步骤之一。目前,在DC系列元数据中通常使用HTML、SGML或XML。有比较才有鉴别和选择,我们不妨对这三种编码语言的优劣进行分析比较。XML是SGML语言的一个子集,同HTML一起成为SGML家族的主要成员。SGML是一种元语言,可以用来定义其它更专门的标记语言。HTML是由SGML定义出来的,专门使用在WWW上的标记语言。SGML是很好的资料存储格式,适用于任何复杂的文件,但不便于网络传输,SGML非常复杂,不易学习掌握。XML与HTML不同,XML是SGML的一个简化版本,实际上,XML也是一种元语言。与HTML不同的是,XML并没有语义上的元素定义,也没有预先定义好的一套标记系统。在实际应用中,可以根据需要定义自己的标记。XML是可扩展的,具有较强的灵活性和适用能力,同时它很有可能在今后成为应用最为广泛的标记语言。但是,目前,XML在网络上的应用不如HTML广泛。由于HTML文档本身的结构性不强,扩展能力差,描述内容的能力也较弱,因此不太可能成为今后数字图书馆元数据方案的主要编码语言。笔者建议,数字图书馆元数据方案的编码语言采用XML。 数字图书馆元数据方案的设计应面向专业编目人员信息资源编目实际上是信息资源进行分析、判断和组织的过程。组织过程包括分类、描述、归并及格式化等过程;分析过程则包括区分、验证、评估、比较、解释及综合过程。[2]总之,信息资源编目是一个复杂的、信息增值的过程。目前,困扰信息资源编目的主要问题是费用。一是时间的花费,二是金钱的花费。费用问题使得许多元数据方案的设计者希望所研制的元数据可以由非专业人员制作。毫无疑问,非专业人员制作元数据的费用低,然而这种低费用是以牺牲元数据的质量为代价的。笔者认为,对于数字图书馆的建设而言,元数据的总体质量是不容忽视的。如果没有高质量的元数据,数字化信息资源的利用也就成为一句空话,甚至会像搜索引擎一样,查准率很低。所以,建议数字图书馆元数据方案的设计应面向专业编目人员。只有专业编目人员利用编目规则及书目控制等手段,才能够提供具有较高质量的元数据。 数字图书馆元数据方案的设计中应考虑到其它技术运用在数字图书馆建设的过程中,必然要涉及到许多技术,其中包括数据库技术、全文检索技术、开放式网络词表/分类技术、地理信息系统(GIS)等。在数字图书馆元数据方案的设计中,我们需要与这些技术进行衔接并加以应用。以联合在线资源目录(Cooperative Online Resource Catalog,简称CORC)为例加以说明。CORC是建立在网络环境下的为本地或网络电子资源创建书目元数据的系统,是一种为电子资源编目的数据库和工具包。CORC利用了网上杜威分类法数据库,实现了编目过程中DDC号码和主题标目自动分配。同时,CORC数据库的软件平台采用Mantis,这是一种适用于任何元数据定义与界面的网络资源编目系统工具箱。Mantis用XML存储记录,使得记录的输出非常容易,且有MARC、DC HTML和DC RDF、XML多种格式可供选择。CORC的成功在于其能够充分利用各种技术。因此,我国在数字图书馆元数据方案的设计过程中,也需要考虑其它技术的运用。【参考文献】[1]CC:DA Task Force on metadata and Cataloging Rules:Final Report,August 21,1998[EB/OL].[2001—03—05]. .[2]真溱.矛盾重重的元数据世界[J].中国图书馆学报,2001,(6):56—59仅供参考,请自借鉴希望对您有帮助
“信息资源共享”课程检索报告一 检索课题数字图书馆个性化服务研究现状二 主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取所需资源的可能性则越来越少, 用户需求的专业化、垂直化激化了数字图书馆大量信息数据库与用户需求之间的矛盾。1999 年, 美国图书馆与信息技术联合会(LITA) 10 位著名的数字图书馆专家在研讨会上, 把个性化定制服务列为数字图书馆发展的7 大趋势之首。目前, 数字图书馆个性化的信息服务已经开始得到普遍的关注, 人们正在为提供个性化信息服务做出努力的尝试。数字图书馆个性化服务是近几年数字图书馆研究中受到关注较多的一个研究方向,数字图书馆个性化服务是基于信息用户的信息使用行为,习惯,偏好,特点及用户特定的需求,来向用户提供满足其个性化需求的信息内容和系统功能的一种服务。关于数字图书馆个性化服务研究现状,该主题涉及到:(1)数字图书馆个性化服务的有哪些介绍(2)数字图书馆个性化服务的模式有什么(3)数字图书馆个性化服务的技术研究有哪些(4)数字图书馆个性化服务研究的最新进展(2005年-2007年)三 检索情况(一)检索工具1.维普中文期刊数据库 (1989-2007)2.中国期刊全文数据库 (1994-2007)(二)检索过程1.检索途径 关键词 题名 主题词2.检索用词 数字图书馆 关键词或题名、主题词 个性化服务 关键词或题名、主题词3.检索策略(1)维普中文期刊数据库(题名或关键词=数字图书馆)*(题名或关键词=个性化服务) 在高级检索中选择题名或关键词字段,输入“数字图书馆”和“个性化服务”两个检索词进行限定,年代限定在2005-2007年,共检索出78条记录。(2)中国期刊全文数据库(题名或关键词=数字图书馆)* (题名或关键词=数字图书馆)在高级检索中选择篇名字段,输入“数字图书馆”与“个性化服务”,年代限定在2005-2007,共检出89条记录。四 检索结果分析(一) 检索结果经检索上述两个数据库,有关数字图书馆个性化服务的研究论文众多,现选出其中具有代表性,研究主题未重复的文献。1.中国期刊全文数据库(1) 数字图书馆个性化信息服务系统研究 刘燕平 图书情报工作 2006/S2(2) 数字图书馆个性化服务系统分类体系问题 叶红 科技信息(学术研究) 2007年13期(3) 浅析智能搜索引擎技术及其在数字图书馆个性化信息服务中的应用 王林廷 高校图书情报论坛 2006年01期(4)数据挖掘技术在数字图书馆个性化服务中的应用 朱冰冰 科技情报开发与经济 2006年24期(5)数字图书馆个性化信息服务发展研究 马维华 郑州大学学报(哲学社会科学版) 2006年06期(6) 智能推送技术在数字图书馆个性化服务中的应用 石岩 情报探索 2006年11期(7) 基于文本过滤的数字图书馆个性化服务技术 张帆 计算机工程与应用 2006年31期(8) 数字图书馆信息门户的个性化服务模式 何平 中国信息导报 2006年08期(9) 网络信息技术下的数字图书馆个性化服务 张丹 林区教学 2006年07期(10)MyLibrary——数字图书馆个性化服务新趋势 杨华 农业图书情报学刊 2006年08期(11)基于Web服务组合的数字图书馆个性化动态定制服务构建 张晓青 情报学报 2006年03期(12)校园网中数字化图书馆个性化服务的实现 朱江峰 科技经济市场 2006年01期(13)数字图书馆的个性化推送服务 白雪松 图书馆杂志 2005年09期(14)Web日志挖掘在数字图书馆个性化服务中的应用 王英培 科技情报开发与经济 2005年22期(15)国内外数字图书馆个性化信息服务系统的功能与特征比较研究 张俊 情报理论与实践 2005年06期(16)基于知识管理的数字图书馆个性化服务机制研究 郭琳 四川图书馆学报 2004年05期2.维普中文期刊数据库(17)基于Web挖掘的数字图书馆个性化技术研究 王艳 张帆 情报杂志 2007年1期(18)基于文本过滤的数字图书馆个性化服务技术 张帆 杨炳儒 计算机工程与应用 2006年31期(19) 数字图书馆信息门户的个性化服务模式 何平 陈有志 中国信息导报 2006年8期(20)个性化服务深度与广度解决方式探讨 刘月胜 数字图书馆论坛 2006年6期(21)个人数字图书馆模式的分析 石德万 李军 现代情报 2005年9期(22)数字图书馆个性化信息环境与服务构建 杜安平 韶关学院学报 2005年3期(23)数字图书馆个性化信息服务的技术实现 张云瑾 许春漫 农业图书情报学刊 2005年6期(24)个性化信息服务的模式研究及策略分析 杜春光 国家图书馆学刊 2005年2期(二) 检索结论文献一论述了个性化信息服务的涵义,阐述数字图书馆开展个性化信息服务的有利条件,国内外图书馆的有关研究开发状况,分析国内数字图书馆个性化信息服务系统应用实例,并时其工作流程,主要功能进行剖析,指出该系统目前存在的问题,提出改进对策。文献二围绕数字图书馆个性化服务系统分类体系问题展开探讨。首先,简要介绍数字图书馆个性化服务系统的主要内容,包括其定义和服务内容。其次,从用户分类和信息分类两个方面阐述目前数字图书馆个性化服务系统存在的问题。用户分类主要存在的两个问题,根据用户特点分析提出相应建议。信息分类问题从五个方面进行讨论,列举数字图书馆个性化服务系统页面进行分析,提出解决方法。文献三介绍了智能信息检索的实质和发展方向,是智能搜索引擎技术的不断改进和广泛应用。以这一技术为基础构建数字图书馆的个性化服务系统,是数字图书馆信息服务的现实需要。文章论述了当前搜索引擎存在的不足,概述了智能搜索引擎的原理机制及其优越性,探讨了该技术在数字图书馆个性化服务中的应用。文献四阐述了数字图书馆的定义,介绍了个性化服务的工作原理和国内外个性化服务系统的现状,探讨了分类模型、关联模型、序列模型、聚类模型、回归模型以及时间序列模型的原理,对如何把其用在数字图书馆的个性化服务上以描述用户需求,提出了建议。文献五介绍了数字图书馆个性化信息服务是当今图书馆发展的重要趋势,目前国内外都已有比较成熟的数字图书馆个性化信息服务系统,服务方式及其功能也多种多样,但是探索图书馆个性化信息服务有效模式的任务仍很艰巨。文献六介绍了智能推送技术和个性化服务的内容,讨论了将智能推送技术应用于数字图书馆个性化服务,以及智能推送技术存在的优势与不足。文献七提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献八试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展建势。文献九简述了数字图书馆个性化服务的内涵,分析了网络信息技术对其各项服务的支撑,并通过My Library实例对这些具体技术的集成化运用加以探讨,为构建可互操作的数字图书馆个性化服务系统提供参考。文献十就My Library(我的图书馆)的产生,及其概念、类型、特征、原理、功能等诸方面做了简要的论述,并介绍了它在国内外的发展现状,指出其今后的发展方向。文献十一介绍了Web服务组合是一种利用现有Web服务动态构建新的能满足用户需求的复杂Web服务的Web服务技术。将数字图书馆各种资源组件、应用组件、功能组件和管理组件进行Web服务描述,人们就能利用Web服务组合技术根据用户的个性化需求实现对不同数字图书馆各种组件的动态集成,从而实现开放环境下数字图书馆的个性化动态定制服务。本文讨论了基于Web服务组合的数字图书馆个性化动态定制服务的基本系统架构、构建模型,并对构建过程中需要注意的几个问题展开了讨论。文献十二介绍了数字化图书馆建设是图书信息化发展的必然,而个性化服务能够根据用户不同的特点,提供切实的服务,以更好地为读者服务。本文对数字化图书馆的个性化服务进行了讨论,分析了关键的实现技术,并给出了部分核心代码。文献十三介绍了个性化推送服务是数字图书馆研究的热点,也是建设数字图书馆的关键问题之一。本文针对各种不同的信息形式提出了相应的实现方案,并对实际操作中的几个难点事项做了简要讨论。文献十四介绍了Web日志挖掘的基本概念和过程,指出通过对读者在数字图书馆服务中留下的日志信息进行挖掘,可以实现个性化服务,更好地满足不同类别读者的需求。文献十五从个性化信息服务的概念入手,介绍了个性化信息服务的几种类型,包括分类定制服务、信息推送服务、智能代理服务和垂直门户服务等,并介绍了目前国内外若干图书馆已经开展的个性化信息服务的典型应用实例。在此基础上总结了这些个性化信息服务系统的共同功能与特征,并进行了一些比较研究。文献十六介绍了构建一个基于信息过滤技术的信息服务系统是数字图书馆实现个性化信息服务的有效手段。通过对信息过滤技术概念的研究和与信息检索概念的比较,抽象出此类系统的一般模型,并沿用查全率和查准率评价信息过滤的效果,最后分析了个性化信息服务系统实现的关键技术。文献十七提出一种基于Web挖掘技术的个性化实现策略,针对数字图书馆资源的文献,改进了经典的算法,分别从Web内容挖掘、结构挖掘和日志挖掘出发,建立用户动态的兴趣特征模型,使之更具有实用性和针对性。文献十八提出在数字图书馆的应用中,个性化服务可以为用户提供符合其兴趣的检索结果。提供了一种针对数字图书馆个性化服务策略的文本过滤技术,通过在向量空间内建立用户兴趣模型和文本内容特征模型,计算它们的相似度后,将用户不感兴趣的文本过滤掉。详细描述了具体的建模过程和个性化文本过滤算法,最后给出了在实际的数字图书馆工程中的验证结果。文献十九试图对数字图书馆信息门户下的个性化服务模式进行研究,从双向互动式信息服务、集成式信息检索服务、动态式馆藏特色信息服务、渗透式垂直信息门户服务、追踪式数据挖掘信息服务等服务模式来探讨数字图书馆个性化服务的有效模式及发展趋势。文献二十提出数字图书馆的个性化服务决定了它在借助网络技术的基础上向学科馆和联盟制方向发展,以提高资源的利用率和解决个性化服务的深度与广度问题。文献二十一根据个人数字图书馆文献信息资源存储位置的不同.把个人数字图书馆划分为远程个人数字图书馆和本地个人数字图书馆两种模式,着重对这两种模式的个人数字图书馆的功能特点进行比较分析。文献二十二提出构建数字图书馆的个性化信息服务实际上就是要在数字图书馆上实现个性化资料、个性化检索、个性化过滤、个性化服务等四种环境.数字图书馆可以开发个人图书馆、检索帮助、个性化信息咨询、信息代理、垂直门户等多种个性化信息服务。文献二十三阐述了数字图书馆个性化信息服务的概念、研究与应用的现状,并分析了实现数字图书馆个性化信息服务所需的技术。文献二十四强调个性化信息服务在数字图书馆中有其特定的定义,也是数字图书馆发展中的必需。根据网络环境下图书馆信息服务的内容及用户行为的不同,可以有多种个性化服务模式,有策略地开展服务。(三) 结果分析 从2005-2007年所发表的关于图书馆学个性化服务的论文可以看出,研究的主题和方向主要集中在以下几个方面:1. 数字图书馆个性化服务的概念研究。在中国期刊全文数据库检索到的89篇文章中,有40篇是论述图书馆个性化服务概念的研究。在这些文章中作者都对数字图书馆个性化服务概念有自己的认识,对于这个概念的研究也越来越深入。2. 数字图书馆个性化服务的方式研究。对于数字图书馆个性化信息服务模式, 也在摸索实践中。目前有以下几种方式:(1)信息分类定制服务方式。分定制是指信息用户可以按照自己的目的和需求,在某一特定的系统功能和服务形式中,自己设定信息的资源类型、表现形式,选取特定的系统服务功能等。(2)信息推送服务方式。是运用推送技术(push technology)来实现的一种个性化主动信息服务的方式。(3)信息智能代理服务方式。它是一种能够完成委托任务的计算机系统,能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,主动搜索可能引起用户兴趣的信息并提供给用户。(4)信息垂直门户服务方式。通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工,以满足用户基于专业的深入的信息需求。(5)信息帮助检索服务方式。如何帮助用户进行高效的信息检索也是当今数字图书馆信息服务向纵深发展的一个重要内容。(6)数据挖掘服务方式。从数据库中发掘人们感兴趣的知识,这些知识是隐含的、潜在的,目的是帮助用户寻找数据间潜在的关联。(7)信息呼叫中心服务方式。主要利用电话、传真等方式来服务客户,处理简单的呼叫流程。在这些方式中,现在比较热门的个人图书馆(My library)是上述部分个性化服务方式的具体应用,是当前开发应用较为成熟的图书馆个性化服务模式系统,也是一个完全个性化的私人信息空间。3.数字图书馆个性化服务关键技术研究。数字图书馆个性化信息服务的应用技术, 集现代信息技术之大成。它包括推送技术、智能代理技术、智能搜索引擎技术、网页动态生成技术、数据挖掘技术、信息过滤技术、过程跟踪技术、安全身份认证技术、数据加密技术等, 这些都可以为数字图书馆的个性化服务方式提供技术支持。4.国内外数字图书馆个性化服务现状研究。还有一部分论文是主要介绍当今国内外数字图书馆个性化服务的现状,通过介绍这些先进的技术和模式来指导我国数字图书馆个性化的服务。5.其他研究。除了数字图书馆个性化信息服务的概念、模式、技术和国内外研究现状外, 数字图书馆个性化信息服务的研究还就数字图书馆个性化信息服务的模型构建、用户评价、馆员角色的变化、存在的问题与对策等作了深入探讨。综上所述,这两年国内有关数字图书馆个性化服务的研究可谓是硕果累累,随着对数字图书馆个性化信息服务理论研究和实践的不断深入,我国数字图书馆个性化信息服务一定能够真正实现以用户需求为中心, 利用数字图书馆信息资源开展不同层次的、多种类型的、满足用户个性需求的有效信息服务。五 检索情况总结由于这个学期开了数字图书馆这门课,对于数字图书馆有一些简单的了解,特别是对个性化信息服务这部分内容有兴趣,课本上涉及得比较少,所以就把这个内容作为了检索主题。在选择检索工具时选择了平时最常用的两个检索工具,本来还选用了中文Google,想找一下国内在研究这个主题的项目或者网站,但是检索到的内容数量实在太庞大,而且检索到的大量结果都来自各个数据库的论文,最后就放弃了使用搜索引擎。在构造检索策略时,因为该主题比较简单,不用构造很复杂的检索式,就选择了“数字图书馆”和“个性化服务”作为关键词,开始有想到是不是需要使用与“数字图书馆”概念相近的“电子图书馆”或者“虚拟图书馆”,但考虑到国内现在已经比较统一的使用“数字图书馆”这个概念,使用其他两个词检索到的文章不多,所以还是以数字图书馆为重点。检索途径选择了关键词,题名以及主题词,在使用中国期刊全文数据库进行检索时,一开始是使用关键词作为检索途径,检索出423条记录,但是有很多文章与该主题相关度不高,所以采用了篇名作为检索途径,这样两个词同时限定在文章题名中,检索的相关度就非常高,但也可能会造成漏检。觉得自从学习检索课程以来,检索最难的就是检索式的构造,检索式构造的好与坏,直接关系到检索结果的好坏。维普提供的字段有题名或关键词字段,使用高级检索将两个检索词都限定在这个字段中,检索出来的结果相对比较精确。检索完成之后,接下来的工作就是分析检索结果,这其实也是难度挺大的一项任务,要看完150几篇文章不是一件简单的事,文摘和篇名这个时候就帮了很大的忙了,一般看文摘可以略知一二,需要了解详细内容的再打开全文阅览。从文章中归纳出研究的主要内容和方向,找出比较有特色而又不重复的内容,最后再整理出结论,这就是我整个辛苦但却有趣的检索过程。通过完成这次作业,首先就是复习与巩固了以往的知识,平时虽然也经常在进行检索,但是严格按照检索步骤进行的就不太多,也没有这么有条理的对整个检索过程做一个安排,并按照计划一步一步的执行,直到完成检索结果。其次就是以往做作业都是完成老师布置的具体任务,有些题目比较简单或是比较有兴趣的检索起来还好,有些比较深奥的主题做起来真的十分困难,没有专业背景,拿到题目和检索出来的结果就觉得十分茫然。而这次老师让我们自己选择题目,我就可以从自己的兴趣和想了解的领域下手,这样完成作业的过程也不再那么枯燥,兴致自然也大了很多。还有最重要的是,做作业的目的不只是完成作业,更重要的是有收获,巩固了检索知识自不用说,通过这次阅读大量文章,也算对所检索的主题有了一个大概的认识和了解,增长了知识,开阔了视野,可是说从完成这次检索作业中的确是收获不少。
LZ,你为什么写这个题目。。。。让你们的学术包工头给你些好的建议ba
301 浏览 2 回答
287 浏览 5 回答
150 浏览 7 回答
138 浏览 3 回答
124 浏览 4 回答
127 浏览 2 回答
195 浏览 2 回答
169 浏览 2 回答
178 浏览 2 回答
112 浏览 3 回答
279 浏览 2 回答
241 浏览 4 回答
151 浏览 6 回答
123 浏览 5 回答
144 浏览 3 回答