作为研究成果的博士学位论文反映了各个学科领域较高层次的研究水平[1]。博士论文是我国拥有自主知识产权的重要信息资源和知识宝藏,具有重大的开发和利用价值[2]。主题标引是文献加工和文献编辑部门依据文献所涉及的主题内容,从采用的主题词表中查获相应的主题词或主题词组配,用以准确揭示文献内容,使读者能够从所标识的任何一个主题词的指引找到所需要的文献[3]。
关键词(keyword)是直接从文献的题名、正文或文摘中抽取出来的具有检索意义的语词。关键词是主题词的一种,它作为一种便于文献信息在电子计算机中进行文献标引的最佳形式,具有较高的标引效率,因而普遍被科技学术期刊和文献检索工具所采用。主题词有广义和狭义之分,广义的主题词包括标题词、元词、叙词和关键词;狭义的主题词专指叙词[4]。自然语言的关键词标引和受控语言的主题词(叙词)标引都被用于揭示和查询同一主题的文献。
1关键词标引的必要性
1.1博士学位论文自身的特点
作为博士研究生的毕业论文,博士学位论文具有专业性、理论性、创新性、跨学科性、模糊性和时效性等特点。这些特点使得在学位论文的主题词标引中,单一地使用叙词标引不足以全面、清晰、准确地反映论文的主题,因此需要在标引过程中加入关键词的使用。
1.2适应读者检索习惯
国际图联于2006年发布的《国际编目原则声明》中总结了编目规则的十大目标,其中最高原则是为目录用户提供便利性。目录用户的便利性是指在对著录以及检索点名称的受控形式做出抉择时,首先应该考虑到用户,即要求我们采取用户所熟悉、惯用的语言和检索方式建立目录,决定标目的形式[5]。对非图书馆专业的普通读者而言,主题词(叙词)标引过于严格按照主题词表进行,但他们通常是不熟悉主题词表的,更不可能将自然语言转换为主题词进行检索,这样会使得检索点变得狭窄。因此,适当使用主题词表外的自然语言即关键词进行标引,将有助于提高文献检索率。
1.3《中国分类主题词表》收录主题词的不足
《中国分类主题词表》作为主要文献标引工具书,由于人力、物力等多方面的原因,其更新速度较慢,在时间上存在着一定的滞后性。在《中国分类主题词表》中,主题词数量相对固定,且有许多意义类似的词存在,在科技迅猛发展的时代,博士学位论文研究的新领域日益增多,各种新的主题不断出现,主题词表中既定的主题词数量已不足以满足当前检索的需要。
1.4与时俱进,适应时代发展
当今的时代是科技大发展的时代,新事物、新技术、新问题层出不穷,新概念、新名词术语不断涌现,仅使用主题词可能会造成标引的不准确、不完备。为了适应科学技术的飞速发展,提高检索效率,减少检索误差,需要人们在学位论文的标引过程中使用一部分未收入《中国分类主题词表》中的关键词加以补充。
2博士论文关键词的基本特征
2.1专业性和自主性
博士论文的选题一般都是前沿性的学科理论或应用方面的课题,代表了本学科的发展及研究方向,涉及的主题内容专业性强、学术观点新颖、见解独到,其主题内容所反映的名词术语往往带有很强的专业性,因此,所选择的关键词也具有极强的专业性。关键词是不受词表控制,未经规范化或仅作少量规范化处理的自然语言,从而反映出关键词择词的自主性特征。
2.2主题性和简明性
作为论文主题的概括与总结,揭示的是论文最为核心的内容,是文章最基本的学术思想和技术方法的提炼和纯化,有着鲜明的主题性色彩。在标引中使用的关键词通常是专业术语,词语简练,简单明了,同时数量宜控制在3~5个。
3关键词标引存在的问题
3.1主题概念转换不恰当
关键词是由叙词(正式主题词)和自由词组成的,但在标引过程中应尽量将主题分析时提炼出来的自然语言转换成规范化的语言,使之尽量向《中国分类主题词表》中的主题词靠拢,然后再用自由词作为标引的补充。关键词标引的主要作用是通过关键词的逻辑组合,提示论文的主题内容,若论文的关键词不能准确地揭示论文的主题内容,将直接影响检索的查全与查准。
3.2专指性不强
编目人员在对文献主题进行充分分析后,要针对主题概念在主题词表中查找相应的叙词,并将其主题概念准确、适度地表达出来。在叙词表中查找叙词的过程是一个探索过程,通常由于编目人员对《中国分类主题词表》的不熟悉或查找的方法不当,都会造成选词的不专指。
3.3标引深度不足
较高的标引深度有利于提高检全率。标引深度不足是指文献中提炼和分析出来的主题少于文献提供的主题,没有把符合检索要求的所有主题提炼出来而造成漏标、漏检,影响文献的查全率[6]。标引深度不足主要表现为:忽略隐含主题;漏标文献的局部主题;综合论文集没有作分析标引等。隐含主题是指在文献中没有直接加以描述,而是隐含在不同字面形式中的主题。因此,隐含主题在标引过程中常常会被遗漏。
3.4排序不当
在复合主题的博士论文中,由于主题的复杂性,使得对论文主题的分析不够充足与深入。此情况下所标引出的关键词未能按关键词标引的优先顺序排列,缺乏一定的逻辑顺序,条理混乱,特别是对检索有重要意义的首标词顺序的选择不当,会导致博士论文的主题无法得到准确完整的揭示。
3.5标引不一致
标引的一致性主要是要求对同一文献或相同主题的文献赋予相同的检索标识。一致的主题标引可以使相同主题概念的文献集中在相同的检索标识之下,从而提高检索效率,保证读者在检索时能查全与查准。标引的不一致主要体现在不同标引人员对同一主题的不同理解以及同一标引人员在不同时间对相似主题的不同理解等方面。
3.6数量过多或过少
在学位论文主题标引中,主题词(包括叙词、关键词)的数量要求是3~8个。一般来说,单主题学位论文选用2~3个,多主题学位论文可多于5个,不能超过8个。但是,在一些学位论文数据库中,主题词过少或过多的情况也时有发生。如主题词过少,则会导致标引深度不够;如主题词过多,则容易出现标引过深的情况。两者均会影响文献的检全率和检准率。
4关键词标引原则
4.1主题转换恰当、准确,将关键词规范化
准确性亦指专指度,指主题标识与文献概念的相符程度。它是对主题概念揭示的精确度来衡量标引质量的一个因素。主题分析选定的待标概念只是自然语言,在进行关键词标引时必须将它们转换为规范化的主题词、上位词、靠词、专有名词。在学位论文主题标引中,关键词(自由词)的使用是增强主题标引的专指度与深度、提高数据质量的一个重要途径。但关键词不能单独使用,只能作为补充标引使用。
当文献内容的主题概念在词表中没有最专指的主题词,也无法以词表中最接近、最直接的主题词组配标引时,可考虑选用最直接的上位主题词进行上位标引,或采用近义的主题词进行靠词标引。当使用上位主题词或近义主题词标引时,应将文献内容的主题概念记录在非控主题字段,这样既能为读者检索提供简单、常见的入口词,又能为增词提供文献数据保证。如:在博士论文经常出现的“数据挖掘”一词,并非主题词,在标引中通常使用与其意义相近的词“数据采掘”代替。
4.2全面揭示主题,不漏选
按照不同的标准,文献主题类型可分为单主题和多主题,单元主题、复合主题和联结主题,主要主题和次要主题,专业主题和相关主题等。对于单主题的标引是比较容易的,但对于多主题,则往往是各种主题互相交叉渗透,不易分辨,因而标引起来会有一定的难度。此时,就不能仅从题名分析进行拆分与组合,而应全面深刻地了解文献内容,把每个主题及其各个方面都反映出来。一篇博士论文所涵盖的内容非常丰富,信息量大,要想做好关键词的标引就要仔细阅读论文,对论文做出深入的剖析,切不可仅以标题或摘要为标引对象,将容易造成主题揭示的不全面。如:《微型发光半导体芯片检测系统及关键技术的研究》一文,从标题中只能得出半导体、芯片等主题词,但在分析全文之后可以看出,文章主要介绍了“边缘检测”技术,虽然边缘检测并非主题词,但应当作为规范的关键词,在标引中体现。
4.3含义清楚、用词简练
关键词标引即是对主题分析结果赋予检索标识的过程,实质上是对论文内容的提炼、评价和概括过程。因此,在标引过程中应选择专指性强、有针对性、义项较单一的最具有检索意义的关键词进行标引。汉语中一词多义和多词一义的现象比较常见,选择关键词时,应该力求词义准确,尽量避免产生歧义。只用一个单音词,词义不够明确,在标引时应选择名词、动词和名词化的词组等双音或多音词。
4.4排序得当
关键词的排列顺序应有利于反映论文主题。一般标引顺序为研究目的——研究类别——研究方法——研究结果。对于同一序列的二个或多个具有属种关系或在深浅程度上有差异的关键词,应按属种关系或由浅到深的顺序排列。关键词按以下顺序选择:第一个关键词列出该文主要工作或内容所属二级学科名称。第二个关键词列出该文研究得到的成果名称或文内若干个成果的总类别名称。第三个关键词列出该文在得到上述成果或结论时采用的科学研究方法的具体名称。第四个关键词列出在前三个关键词中没有出现的,但被该文作为主要研究对象的事或物质的名称,或者在题目中出现的作者认为重要的名词。通常前两个关键词应与论文的分类标引相对应。如:《两种番薯属药用植物厚藤和五爪金龙中树脂糖苷类成分研究》一文中,“厚藤”与“五爪金龙”不是《分类主题词表》中的主题词,但作为论文的主要研究内容,应作为关键词标引。两种植物,同为植物药,在主题标引中,应给出主题词“植物药”,对应其分类标引应为R282.71。
4.5复合词组的切分与保留
关键词标引可与叙词标引相配合,弥补叙词标引有限的专指度和网罗度,向读者提供更多的检索点。由整体与布局或概念交叉的两个关键词构成的复合词组,标引时可切分为两个词。如:“起重运输机”可切分为“起重机”“运输机”“大跨悬索桥”可切分为“大跨桥”“悬索桥”。
4.6英文缩写
博士论文中经常出现大量专有名词,由英文词汇翻译而成,但是不同的论文所给出的中文翻译却不尽相同。而这些词通常因为具有很强的专业性需要作为关键词使用,在此时,需要在这些词的后面辅以该词的英文缩写以示区别。如:“阿尔茨海默氏病”,英文缩写为“AD”。在标引使用“阿尔茨海默氏病(AD)”;又如:“转化生长因子”,英文缩写为“TGF”,标引时使用“转化生长因子(TGF)”。
5提高关键词标引质量的经验总结
5.1认真耐心
博士论文的标引工作是一件考验耐心与恒心的工作,博士论文涉及的领域方方面面,内容精深,不易理解。因此,在标引工作中一定要认真细心,将复杂的主题抽丝剥茧,一步一步由难化简提炼主题。
5.2熟悉使用《中国分类主题词表》
在主题标引的过程中,应首要使用《中国分类主题词表》中给出的规范主题词,在此基础上按照需要使用规范化的非控主题词即关键词进行标引。因此,在日常工作中,《中国分类主题词表》是一个标引工作者首先要熟悉并掌握的基本工具。
5.3做好工作记录,整理标引错例分析
在实际工作中,由于经验的缺乏,会遇到标引不准确或者不全面的情况,在工作过程中需要及时记录,总结经验,从中分析错误的原因,多与有经验的校对老师交流,利于提高自身的标引水平。
5.4加强标引校对工作责任感
智者千虑或有一失,每一位标引人员的工作或多或少都会出现一些偏差,且不同的标引人员就类似主题会有不同方面的理解,这就给校对工作提出了更高的要求与更大的挑战,为确保数据质量,在工作中校对工作至关重要。
5.5提高标引人员自身专业素质
随着新的研究领域、新的学科专业不断涌现,人们已有的知识随着时间的变迁会慢慢落后,为了适应时代的发展,标引人员就需要不断地拓宽自己的视野,丰富自己的知识面,提高自身的专业素质。
6结语
博士论文标引工作是一项艰苦复杂的脑力劳动过程,合理使用关键词作为主题词的补充进行标引,可以进一步加强标引深度、提高数据质量,适应读者检索的需要,在读者与作者之间搭建起一座桥梁,充分发挥博士学位论文的科学研究价值,使之更好地为读者服务。
参考文献:
[1]鲍建东.博士学位论文及其分类工作的特点与思考[J].北京图书馆馆刊,1999(4):72-74.
[2]贺德方.国家学位论文服务体系研究[J].情报学报,2004(6):697-702.
[3]陈和庚.谈谈如何正确标引主题词[J].航天标准化,1997(2):39-40.
[4]邵永强.学术论文中的关键词及其选取方法[J].现代情报,2003(11):177-178.
[5]王曼.半控标引是提高学位论文查全率的重要途径[J].中华医学图书情报杂志,2009(1):32-34.
[6]杨洁.主题标引常见问题分析[J].科技情报开发与经济,2005(21):97-99.