您当前的位置:首页 > 计算机论文>计算机网络论文

浅论网络环境下用户标注的价值与应用

2015-07-06 10:47 来源:学术参考网 作者:未知

  [论文关键词]用户标注 网络 资源组织 信息检索
  [论文摘要]对网络环境下的用户标注进行探析:从帮助检索、辅助记忆、抒发感情、引人注意、贡献他人等方面分析其形成动机,从标注者个人和外界环境两个大的方面探讨其影响因素。在此基础上,探讨标注在资源组织、异构资源整合、协同过滤和推荐等方面的应用,进而分析其在资源创建,揭示资源内容,记录隐性知识,评价资源等方面的价值。

  
  1 概述
  
  标注是用户在阅读和使用资源时,由于各种原因留下的各种类型的批注,如标签、评论、注释等。标注现象自古就已有之,例如,批注一直是我国文学鉴赏与批评的重要形式和传统的读书方法之一。
  标注现象已经延续了数千年,传统环境下的标注基本上都是自标自用,虽然也有少量标注随着原始资源传递到其他用户手中,或者通过出版批注本等形式传播,但是这种情况并不普遍,所覆盖的资源群体和受众群体都十分有限。在数字和网络环境下,这种情况发生了根本的改变,标注的形式、内容、使用方式、价值等方面开始发生巨大的变化。
  
  1.1 标注的动机分析
  总的说来,标注的动机来自于两个方面:个人和社会。前者指自发的、个人的需求,包括其使用上的需要和心理上的满足;后者是社会上的各种驱动力,包括各种诱发因素和刺激因素。如当个人发现标注所带来的社会影响和社会价值之后,有了进一步标注的欲望,这两个方面相互影响、相互作用,支配着标注者完成各种形式的标注。概括起来,标注的动机有以下几个方面:
  1.1.1 未来检索的需要这是标注者对自我需求的满足。www.133229.CoM为了日后检索的方便,许多用户会为自己收藏的资源添加各种类型的标识,比如几个关键词、一系列特殊的符号,作为日后检索的入口。
  1,1,2 辅助记忆的需要主要是进行注释或做提要。如在阅读时遇到不理解的字、词、概念等,通过其他方式了解它们并记录下来;或者在阅读过程中,对内容进行思考,记录思考的结果。这些标注可以为日后使用资源提供参考。
  1.1.3 抒发感情的需要 当用户阅读或使用资源时,资源内容会和用户自身的知识、情感、所处的环境等发生作用,使用户产生一定的想法,或形成一定的认识,并且希望将这种感想表达出来。在这种时候,许多用户会通过标注的形式来表达个人的想法、观点、态度。
  1.1.4 引起他人注意用户希望别人注意到自己或自己的资源,有一种自我表现的欲望,因此借标注来展示自己,或推销自己的资源。当标注系统中有标签云图或热门标签列表之类的功能时,常常会激发用户的这种欲望。就像一些用户希望自己的网页在搜索引擎中获得一个较好的排名而不惜为之添加许多无关的关键词一样。
  1.1.5 贡献和共享用户希望能够与别人分享自己的感受、心情、知识,例如,当看到精彩的或有价值的资源时,会产生向别人推荐该资源的欲望,因此对之进行标注,给予合适的标签或发表一些个人的见解。当阅读或使用资源而有所悟、有所得时,希望能够与别人分享,或者对资源的背景资料或相关信息有所了解,希望贡献出来帮助其他人认识和使用资源时,标注常常是用户选择的一种主要方式。
  方便自我,展现自我(向别人展示自己的能力、地位,与资源的关系),贡献社会(希望自己的观点、对资源的认识、所掌握的相关资源能够帮助其他人更有效、更充分地使用资源),这就是用户进行标注的动机。许多标注的形成动机是复杂的,可能是上而几种情况的综合或叠加,但是无论其动机如何,所形成的标注结果作为一种客观现象都会对资源的使用产生一定的影响。
  
  1.2 影响标注的因素分析
  概括起来,影响标注的因素主要来自于以下两个方面:
  1.2.1 主观因素指来自标注者自身的因素。包括:①标注者个人的知识背景条件。主要指个人知识与被标注资源以及标注主题之间的契合程度,它影响到标注者对标注内容的理解,包括能否正确理解标注内容以及理解的深度。②标注者的个人能力。包括思维敏捷度、创新能力、想像力(联想能力)等,这些因素影响标注者对标注内容的使用,如能否创造性地使用标注内容。③标注的目的/动机。标注者为何要进行标注,他希望达到什么样的目的,这基本上决定了所形成的标注的种类。④标注时的心态。标注者标注时的心情和精神状态,这一情感因素影响标注的质量,如影响标注时的措辞。
  1.2.2 客观因素主要指外界环境对标注者标注行为的黝向。包括:①其他用户的标注及其易获得性。例如,用户在为资源添加标签时有模仿其他用户标签的倾向,在使用资源时因参考了其他用户的评论或所提供的背景资料而有了不同于最初时的想法或认识。②标注环境的影响。包括:标注系统的操作界面(如是否易于操作,是否有同类标签的推荐或提示功能);标注系统的标注规则(如是否对标注的选词,形式、比度、结构等方面有限制);标注时可用的相关资源(如相关的背景资料、可用的工具书等),标注过程中是否存在干扰(如其他人的干扰、意外的电话)。③社会大环境的影响。包括社会习俗与风气、民族或种族信仰、舆论导向、所处地域的政治、法律规定等(如言论是否自由,是否能够包容某些言论)。
  这两方面的因素相互影响、相互作用,例如,标注的环境有时会影响到标注者的心态,进而影响标注的结果。
  2 标注的价值
  
  传统环境下,标注只是一种个人行为,它的生成是私有的(private)。标注能否被他人利用,给他人带来价值,取决于它是否能够从私有转变成公有(pubic)以及这种公有惠及的用户群范围。在传统环境下,限于资源出版、流通的方式和条件,这种转变的发生很困难,即使能够转变,所惠及的用户群也十分有限。因此,标注中所隐含的巨大价值并末充分发挥出来。但是,信息技术的发展正在改变着这一点。
  
  2.1 标注在资源创建过程中的价值
  标注为用户提供了参与创建资源的机会,当用户在使用资源的过程中发现资源中存在的错误、漏洞、不足时,可以通过标江的形式来修正、弥补、完善,而其他用户也可以看到这些修正,借此能够更客观地认识,了解资源,也可以更有效地使用资源。标注延续了资源的创作过程,使得出版不再是资源创作阶段终结的标志,使资源的创作过程与使用过程相融合。
  通过标注的形式参与资源的创建,并不对原始资源做任何改变,而是把标注者个人的观点罗列在原始资源的后面,或以其他形式嵌入原始资源中(如不同的字体、加方框等),让其他用户自己去比较、甄别、判断,决定如何对待资源中提出的观点和立场,如何利用资源。由台湾淡江大学设计的iwill系统(intelligentweb-basedinteractivelanguagelearning)就利用了这种形式。它为大学师生建立了一个通过标注形式进行教学活动的交互式的教学平台,在这个平台上,学生可以提交自己的作品,老师对作品进行点评,写下评语,批注其中的错误,学生依据这些评价改进作品,如此循环完成教学活动。
  
  2.2 标注在编码隐性知识方面的价值
  标注可以捕获、记录短暂易逝的信息,如出现在谈话交流、电子邮件等中的信息,其中包括交流双方对某个问题的观点、态度,一些解决问题的技巧、方法等。传统情况下,这些内容是无法被有效地记录和共享的,虽然有一些零星的记录,但是共享是极其困难的。但是,当这种交流通过标注的方式进行时,对它们的记录和共享就有了更大的可能。
  标注是实现隐性知识显性化的一种手段,它具有随时性(可随时进行)、随意性(可以以任意的方式进行),不受时间、地点的限制,因此这一价值也被看作是它对数字图书馆的贡献之一。
  
  2.3 标注在揭示资源内容方面的价值
  作者意图通过作品表达什么内容,在这一点上,作者是权威。但是要表达的内容在何时能对其他人发生作用,在哪一方面发生作用,这一点作者并不能完全主导,相同的内容会在不同读者的眼中解读出不同的含义。而对内容的这种多角度解读是传统的资源描述所无法实现的。网络环境下的标注有两个独特的特点:①参与的广泛性;⑦标注的随意性(不受限制)。无限多的用户的参与使得被标注对象的每一个部分都可能被关注到,因此对资源的揭示可以做到更全面、更彻底;不受限制使得用户在标注时可以自由发挥,因此可以以尽可能丰富的形式来对同一事物、同一概念、同一观点进行描述和呈现,也可以实现对资源中每个角落的内容的揭示和反映。laurent denoue等人对人们的分类行为进行了研究,结果表明:对于有标注的网页,受试者分类的准确性远高于没有标注的网页,表明标注可以更准确、深入,以读者更容易理解的方式来揭示资源的内容,有利于读者对资源的理解和定位。

  从长尾理论的角度出发,资源的内容及其价值方面存在着一个长尾,资源的每一部分都是有价值的,区别仅仅在于其价值的大小及受众群体的不同。传统的资源组织方式中,更多地关注的是资源的核心内容和核心价值,而忽视了长尾部分。用户参与标注可以实现对不同部位、不同细节的注意与发掘,有利于长尾价值的揭示和利用。
  
  2.4 标注在形成关联方面的价值
  “tag的价值体现在关联上,通过tag的关联来智能化地整理tag,从个性化的tag中我出共性来。”
  标注在标注者和标注对象(资源)之间直接建立了关联,同时通过资源关联到资源作者,通过使用行为关联到资源的使用者(指非标注者部分),由此形成了一种复杂的关系网络。在这个关系网络中,结点具有多进多出的特点,并通过标注之间的聚合(共享语义)在标注者内部、资源内部、资源作者内部、资源使用者内部形成同类群,通过任何一个人口都可以对整个网络进行检索和跟踪。例如,当用户发现所感兴趣的许多资源被某个用户提交时,可以持续跟踪该用户来发现更多感兴趣的资源。有些系统还支持定制,通过将这些用户加入特定的收藏夹,当该用户再次向系统添加资源时,系统会主动通知用户。而且这种关联关系的建立是全动态的,可以随时生成,随时更新。
  
  2.5 标注在资源评价方面的价值
  标注是对资源的一种积极评价,它主动表明了标注者对待资源的态度(感知度、认同度),因此可以作为评价资源的一个指标。
  有些标注内容本身就是对被标注对象做评价的。标注者在标注中表达了对资源内容、资源中所得出的观点、结论的赞成或反对,深入一些的,还可能援引数据、案例,理论等来支持或驳斥资源中的观点或论断,这是对资源最直接的评价。另外,标注也可以作为一个量化指标来评价资源,资源所获得的标注的数量(可以说明被标注对象的受关注度)、标注的时间跨度(第一个标注和最后一个标注之间的时间间隔,可以说明被标注对象受关注的持久度)、其他用户对标注的响应度(阅读数和回应数)、标注者在所探讨领域的权威度等都可以作为评价被标注资源的依据。
  上面谈到的几乎都是围绕标注的社会价值而言的,是它给其他用户带来的价值。在网络环境下,标注原有的价值并没有消失,例如在帮助标注者日后的检索方面、辅助记忆方面,标注的价值依然如故。
  3 标注的应用
  
  传统环境下的标注以自标自用为主,其应用多是为方便自己日后的检索或使用,有一种做备忘录的性质。在网络环境下,标注的应用突破了这些局限,在更大的范围内得到了更广泛的应用。
  
  3.1 利用标注组织资源
  用标签作为元数据组织资源,代替关键词的功能,这是目前标注最普遍的应用,网上流行的大众标注(folksonomy)就是根据这一原理形成的。这种方法最初是随着美味书签的出现和发展而逐步发展起来的,它摒弃了传统分类法事先分类、专家分类的原则,采用由资源使用者为资源提供关键词,根据这些关键词来聚类资源的方式。这种资源组织方法一方面方便了用户,用户无需了解专业的、自己不熟悉的分类体系;另一方面,它利用集体智慧组织资源,形成的分类结果更贴近用户的使用习惯,对用户更具有现实意义。当资源数量巨大,专业人员无法完成对资源的组织时,这种由用户自发分类的方式更有效。当然,这种完全自由式的资源组织方式存在着一些先天的不足,如一词多义、一义多词、垃圾标签等问题,人们也在探求如何对之进行改进,希望能够克服这些不足,同时又不损害其原有的特色。
  
  3.2 利用标注改进资源组织工具
  标注不仅仅可以直接用来组织资源,还可以用来改善现有的资源组织工具和组织方法。在这方面,最直接的应用是将标注与其他资源描述、组织工具或方法进行整合,共同完成对资源的组织和检索。例如,将表达同一概念的不同形式的标签关联起来,作为对正规的主题词的补充,以此来改善检索效果。melanie aumharnmer等人还尝试将标签与自发语义(emergent semantics)整合,以实现对非文本型资源(图像资源)进行更准确的检索。
  利用标注来生成描述资源的语义模型或本体是这方面的又一个应用。传统环境下,本体是预定义的,由专业人员预先完成本体的构建,然后将构建好的本体应用到具体的资源上,这种方式实现起来构建难度大且更新困难,由于构建者、使用者和检索者对概念的理解不同而产生偏差,也使构建出来的本体与本体所描述的资源之间存在一定的距离。鉴于此,有人开始尝试利用标注来自动构建本体,这种本体是通过收集用户对资源的描述形成的,因此更贴近资源的实际内容和使用者的习惯,同时它的创建和更新更加容易。
  
  3.3 利用标注实现异构资源的整合
  用户一直渴望以一种透明的、统一的方式来检索不同来源、不同结构、不同类型的资源,因此,对异构资源的整合一直是信息服务领域关注的焦点之一,也出现了多种整合异构资源的方法。传统的资源整合方法要求被整合的异构资源有本地或全局结构框架,但是一些数据无法满足这一要求,因此难以用传统的方法进行整合。针对这一问题,michaelgertzi和kai-uwe sattler等人尝试使用标注来实现异构资源的整合,科研人员可以对资源进行标注,通过标注将那些可以通过web存取的数据在不同的细粒度上与相应的概念链接。这样,被标注数据成为这些概念的实例,为用户提供了一种通过整合、透明方式来查询分布数据的框架。
  
  3.4 利用标注进行协同过滤和推荐
  通过对大量标注的聚类和内容分析,可以划分用户(标注者)群体、资源群体,从而实现协同过滤和推荐。
  如果能够在信息过滤的过程中加入人工干预,那么这个过滤过程会更有效。基于这一理念,施乐公司帕洛阿尔托研究中心的研究人员开发了实验性的邮件系统tapestry,它记录人们在阅读文档时的各种反应(用户通过标注来表现这种反应),通过这种记录来彼此帮助,共同完成过滤。
  当前,在许多支持标签的web网站上,都提供了利用标注进行推荐的功能:一种是大众式推荐,根据标签的数量计算出热门标签,以标签云图的形式展现给用户;另一种是专门式推荐,当用户标注了一定的资源之后,系统会根据用户给予资源的标签计算出用户的兴趣领域,同时根据其他用户的标注行为计算出属于该兴趣领域的资源,将它推荐给特定的用户。
  
  4 结语
  
  标注并非一种新生事物,但数字和网络环境为这种古老而传统的事物赋予了新的生命力,使它具有了新的价值和应用领域。当然,和任何事物一样,标注也并非十全十美,它仍然存在着很多问题,如为吸引眼球、推销商品、发泄情绪而制造的垃圾标注,标注的质量问题,不负责任的标注会误导用户对资源的理解和使用等方面。随着标注应用的日益广泛,会暴露出越来越多的问题。因此,在研究如何应用标注、发挥其价值的同时,需要关注这些问题,这样才能够更有效地发挥标注的价值。
相关文章
学术参考网 · 手机版
https://m.lw881.com/
首页