[论文关键词]用户标注 网络 资源组织 信息检索
[论文摘要]对网络环境下的用户标注进行探析:从帮助检索、辅助记忆、抒发感情、引人注意、贡献他人等方面分析其形成动机,从标注者个人和外界环境两个大的方面探讨其影响因素。在此基础上,探讨标注在资源组织、异构资源整合、协同过滤和推荐等方面的应用,进而分析其在资源创建,揭示资源内容,记录隐性知识,评价资源等方面的价值。
1 概述
标注是用户在阅读和使用资源时,由于各种原因留下的各种类型的批注,如标签、评论、注释等。标注现象自古就已有之,例如,批注一直是我国文学鉴赏与批评的重要形式和传统的读书方法之一。
标注现象已经延续了数千年,传统环境下的标注基本上都是自标自用,虽然也有少量标注随着原始资源传递到其他用户手中,或者通过出版批注本等形式传播,但是这种情况并不普遍,所覆盖的资源群体和受众群体都十分有限。在数字和网络环境下,这种情况发生了根本的改变,标注的形式、内容、使用方式、价值等方面开始发生巨大的变化。
1.1 标注的动机分析
总的说来,标注的动机来自于两个方面:个人和社会。前者指自发的、个人的需求,包括其使用上的需要和心理上的满足;后者是社会上的各种驱动力,包括各种诱发因素和刺激因素。如当个人发现标注所带来的社会影响和社会价值之后,有了进一步标注的欲望,这两个方面相互影响、相互作用,支配着标注者完成各种形式的标注。概括起来,标注的动机有以下几个方面:
1.1.1 未来检索的需要这是标注者对自我需求的满足。www.133229.CoM为了日后检索的方便,许多用户会为自己收藏的资源添加各种类型的标识,比如几个关键词、一系列特殊的符号,作为日后检索的入口。
1,1,2 辅助记忆的需要主要是进行注释或做提要。如在阅读时遇到不理解的字、词、概念等,通过其他方式了解它们并记录下来;或者在阅读过程中,对内容进行思考,记录思考的结果。这些标注可以为日后使用资源提供参考。
1.1.3 抒发感情的需要 当用户阅读或使用资源时,资源内容会和用户自身的知识、情感、所处的环境等发生作用,使用户产生一定的想法,或形成一定的认识,并且希望将这种感想表达出来。在这种时候,许多用户会通过标注的形式来表达个人的想法、观点、态度。
1.1.4 引起他人注意用户希望别人注意到自己或自己的资源,有一种自我表现的欲望,因此借标注来展示自己,或推销自己的资源。当标注系统中有标签云图或热门标签列表之类的功能时,常常会激发用户的这种欲望。就像一些用户希望自己的网页在搜索引擎中获得一个较好的排名而不惜为之添加许多无关的关键词一样。
1.1.5 贡献和共享用户希望能够与别人分享自己的感受、心情、知识,例如,当看到精彩的或有价值的资源时,会产生向别人推荐该资源的欲望,因此对之进行标注,给予合适的标签或发表一些个人的见解。当阅读或使用资源而有所悟、有所得时,希望能够与别人分享,或者对资源的背景资料或相关信息有所了解,希望贡献出来帮助其他人认识和使用资源时,标注常常是用户选择的一种主要方式。
方便自我,展现自我(向别人展示自己的能力、地位,与资源的关系),贡献社会(希望自己的观点、对资源的认识、所掌握的相关资源能够帮助其他人更有效、更充分地使用资源),这就是用户进行标注的动机。许多标注的形成动机是复杂的,可能是上而几种情况的综合或叠加,但是无论其动机如何,所形成的标注结果作为一种客观现象都会对资源的使用产生一定的影响。
1.2 影响标注的因素分析
概括起来,影响标注的因素主要来自于以下两个方面:
1.2.1 主观因素指来自标注者自身的因素。包括:①标注者个人的知识背景条件。主要指个人知识与被标注资源以及标注主题之间的契合程度,它影响到标注者对标注内容的理解,包括能否正确理解标注内容以及理解的深度。②标注者的个人能力。包括思维敏捷度、创新能力、想像力(联想能力)等,这些因素影响标注者对标注内容的使用,如能否创造性地使用标注内容。③标注的目的/动机。标注者为何要进行标注,他希望达到什么样的目的,这基本上决定了所形成的标注的种类。④标注时的心态。标注者标注时的心情和精神状态,这一情感因素影响标注的质量,如影响标注时的措辞。
1.2.2 客观因素主要指外界环境对标注者标注行为的黝向。包括:①其他用户的标注及其易获得性。例如,用户在为资源添加标签时有模仿其他用户标签的倾向,在使用资源时因参考了其他用户的评论或所提供的背景资料而有了不同于最初时的想法或认识。②标注环境的影响。包括:标注系统的操作界面(如是否易于操作,是否有同类标签的推荐或提示功能);标注系统的标注规则(如是否对标注的选词,形式、比度、结构等方面有限制);标注时可用的相关资源(如相关的背景资料、可用的工具书等),标注过程中是否存在干扰(如其他人的干扰、意外的电话)。③社会大环境的影响。包括社会习俗与风气、民族或种族信仰、舆论导向、所处地域的政治、法律规定等(如言论是否自由,是否能够包容某些言论)。
这两方面的因素相互影响、相互作用,例如,标注的环境有时会影响到标注者的心态,进而影响标注的结果。
2 标注的价值
传统环境下,标注只是一种个人行为,它的生成是私有的(private)。标注能否被他人利用,给他人带来价值,取决于它是否能够从私有转变成公有(pubic)以及这种公有惠及的用户群范围。在传统环境下,限于资源出版、流通的方式和条件,这种转变的发生很困难,即使能够转变,所惠及的用户群也十分有限。因此,标注中所隐含的巨大价值并末充分发挥出来。但是,信息技术的发展正在改变着这一点。
2.1 标注在资源创建过程中的价值
标注为用户提供了参与创建资源的机会,当用户在使用资源的过程中发现资源中存在的错误、漏洞、不足时,可以通过标江的形式来修正、弥补、完善,而其他用户也可以看到这些修正,借此能够更客观地认识,了解资源,也可以更有效地使用资源。标注延续了资源的创作过程,使得出版不再是资源创作阶段终结的标志,使资源的创作过程与使用过程相融合。
通过标注的形式参与资源的创建,并不对原始资源做任何改变,而是把标注者个人的观点罗列在原始资源的后面,或以其他形式嵌入原始资源中(如不同的字体、加方框等),让其他用户自己去比较、甄别、判断,决定如何对待资源中提出的观点和立场,如何利用资源。由台湾淡江大学设计的iwill系统(intelligentweb-basedinteractivelanguagelearning)就利用了这种形式。它为大学师生建立了一个通过标注形式进行教学活动的交互式的教学平台,在这个平台上,学生可以提交自己的作品,老师对作品进行点评,写下评语,批注其中的错误,学生依据这些评价改进作品,如此循环完成教学活动。
2.2 标注在编码隐性知识方面的价值
标注可以捕获、记录短暂易逝的信息,如出现在谈话交流、电子邮件等中的信息,其中包括交流双方对某个问题的观点、态度,一些解决问题的技巧、方法等。传统情况下,这些内容是无法被有效地记录和共享的,虽然有一些零星的记录,但是共享是极其困难的。但是,当这种交流通过标注的方式进行时,对它们的记录和共享就有了更大的可能。
标注是实现隐性知识显性化的一种手段,它具有随时性(可随时进行)、随意性(可以以任意的方式进行),不受时间、地点的限制,因此这一价值也被看作是它对数字图书馆的贡献之一。
2.3 标注在揭示资源内容方面的价值
作者意图通过作品表达什么内容,在这一点上,作者是权威。但是要表达的内容在何时能对其他人发生作用,在哪一方面发生作用,这一点作者并不能完全主导,相同的内容会在不同读者的眼中解读出不同的含义。而对内容的这种多角度解读是传统的资源描述所无法实现的。网络环境下的标注有两个独特的特点:①参与的广泛性;⑦标注的随意性(不受限制)。无限多的用户的参与使得被标注对象的每一个部分都可能被关注到,因此对资源的揭示可以做到更全面、更彻底;不受限制使得用户在标注时可以自由发挥,因此可以以尽可能丰富的形式来对同一事物、同一概念、同一观点进行描述和呈现,也可以实现对资源中每个角落的内容的揭示和反映。laurent denoue等人对人们的分类行为进行了研究,结果表明:对于有标注的网页,受试者分类的准确性远高于没有标注的网页,表明标注可以更准确、深入,以读者更容易理解的方式来揭示资源的内容,有利于读者对资源的理解和定位。
从长尾理论的角度出发,资源的内容及其价值方面存在着一个长尾,资源的每一部分都是有价值的,区别仅仅在于其价值的大小及受众群体的不同。传统的资源组织方式中,更多地关注的是资源的核心内容和核心价值,而忽视了长尾部分。用户参与标注可以实现对不同部位、不同细节的注意与发掘,有利于长尾价值的揭示和利用。