【检索语言及其作用】 1、检索语言的概念 检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。简言之,检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言和非规范化语言(自然语言)两类。 2、检索语言的作用 检索语言在信息检索中起着极其重要的作用,它是沟通信息存储与信息检索两个过程的桥梁。在信息存储过程中,用它来描述信息的内容和外部特征,从而形成检索标识;在检索过程中,用它来描述检索提问,从而形成提问标识;当提问标识与检索标识完全匹配或部分匹配时,结果即为命中文献。 检索语言的主要作用如下: ①标引文献信息内容及其外表特征,保证不同标引人员表征文献的一致性; ②对内容相同及相关的文献信息加以集中或揭示其相关性; ③使文献信息的存储集中化、系统化、组织化,便于检索者按照一定的排列次序进行有序化检索; ④便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;⑤保证检索者按不同需要检索文献时,都能获得最高查全率和查准率。 【检索语言的类型】 目前,世界上的信息检索语言有几千种,依其划分方法的不同,其类型也不一样。下面叙述两种常用的检索语言划分方法及其类型。 (一)按照标识的性质与原理划分 1、分类语言 分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。 以知识属性来描述和表达信息内容的信息处理方法称为分类法。著名的分类法有《国际十进分类法》、《美国国会图书馆图书分类法》、《国际专利分类表》、《中国图书馆图书分类法》等。 2、主题语言 主题语言是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。以主题语言来描述和表达信息内容的信息处理方法称为主题法。主题语言又可分为标题词、元词、叙词、关键词。 (1)标题词 标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词是主题语言系统中最早的一种类型,它通过主标题词和副标题词固定组配来构成检索标识,只能选用“定型”标题词进行标引和检索,反映文献主题概念必然受到限制,不适应时代发展的需要,目前已较少使用。 (2)元词 元词又称单元词,是指能够用以描述信息所论及主题的最小、最基本的词汇单位。经过规范化的能表达信息主题的元词集合构成元词语言。元词法是通过若干单元词的组配来表达复杂的主题概念的方法。元词语言多用于机械检索,适于用简单的标识和检索手段(如穿孔卡片等)来标识信息。 (3)叙词 叙词是指以概念为基础、经过规范化和优选处理的、具有组配功能并能显示词间语义关系的动态性的词或词组。一般来讲,选做的叙词具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性。叙词法综合了多种信息检索语言的原理和方法,具有多种优越性,适用于计算机和手工检索系统,是目前应用较广的一种语言。CA、EI等著名检索工具都采用了叙词法进行编排。 (4)关键词 关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词法主要用于计算机信息加工抽词编制索引,因而称这种索引为关键词索引。在检索中文医学文献中使用频率较高的《CMCC》数据库就是采用关键词索引方法建立的。 3、代码语言 代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。 (二)按照表达文献的特征划分 1、表达文献外部特征的检索语言 表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。 描述文献外表特征的检索语言可简要概述为: 2、表达文献内容特征的检索语言 表达文献内容特征的检索语言主要是指所论述的主题、观点、见解和结论等。 描述文献内容特征的检索语言可简要概述为:
文献概论分享 信息、知识与情报信息:客观世界中各种事物的变化和特征的最新反映,以及经过传递后的再现。信息是通过一定的物质载体形式反映出来的,是事物存在的状态、运动形式、运动规律及其相互关系、相互作用的表象。反映每件事物不同的运动状态和特征,分为自然信息、生物信息、电子信息、社会信息等。知识:系统化、理论化的信息。情报:人们在一定时间内为一定的目的而传递的有使用价值的信息或知识。文献:记录有知识的一切载体。一、文献的构成:四要素:文献信息 文献载体 符号系统记录方式二、医学文献的特点:1、数量庞大2、载体多样化3、多文种化4、学科交叉、出版分散5、知识信息更新加快6、交流传播速度加快7.、电子化发展趋势三、文献检索:1概念:将文献按照一定的方式集中组织和存储起来,并按照文献用户需求查找出有关文献或有关文献中包含的信息内容的过程。2类型:1)检出结果的形式: 书目检索 全文检索 引文检索2)情报检索角度 文献检索 数据检索 事实检索3)检索手段手工检索计算机检索3、外表特征:也成为自然标识,包括标题、作者、来源、卷期、页次、年月、类型、号码、文种等项目。4、内容特征:也称为人为标识、是指文献论述的主题及文献的中心内容,如主题词、分类号、类目名称、文摘。5、在计算机检索系统中,也就是检索数据库中,每一种文献特征称为字段,文献特征标识就是字段值,所有的文献特征即构成一篇文献的题录或文摘。四、文献检索系统的评价:1、报道信息的准确性2、报道信息的及时性3、索引体系的完善程度4、对信息标引的深度5、查全率与查准率 查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价标志。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100% P和R之间存在互逆关系,如果R较高,P将相对下降;反之亦然。两者只能相对提高,两者永远不可能达到100%五、文献信息的类型:1、按文献信息表现形式划分: 文字型、视频型、音频型、数字型2、文献信息出版类型:图书、期刊、政府出版物、科技报告、专利文献、会议文献、学位论文、标准文献、产品样品说明书、技术档案、报纸、新闻稿、统计资料、病案等3、文献信息的载体形式: 印刷型、缩微型、声像型、电子型4、文献信息的加工程度: 零次文献信息:未公开或非正式 一次文献信息:原始资料 二次文献信息:检索工具 三次文献信息:综述研究类和参考工具类六、电子文献资源:1概念:以电子数据的形式把文字、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。2特点:存储介质和传播形式的改变信息的表现形式多样化文献资源类型多种多样多层次的信息服务功能更新速度快、时效性强具备检索系统或功能检索访问不受时空限制医学电子文献资源类型及产品:国际通用分法,分为参考数据库、源数据库和混合数据库。其中参考数据库分为书目数据库(如文摘索引数据库、图书馆目录数据库等)和指南数据库;源数据库分为全文数据库、事实数据库、数值数据库、术语数据库和图像数据库等类型。网络电子资源还包括电子图书、电子期刊、电子报纸、电子新闻、学术网站、搜索引擎/分类指南、网络资源学科导航、FTP、BBS以及讨论组等文献资源。七、文献检索语言:1概念:用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门的标识系统。表达事物的不同概念和揭示概念之间的逻辑关系。2逻辑关系:等同关系、从属关系、相关关系3类型:1)检索语言中所使用语词的受控情况 规范语言:同义词、近义词、相关词、多义词及缩略词(提高查全率) 非规范语言:自由词、关键词2)检索标识设置的时间 先组式语言:分类语言、标题语言等 后组式语言:叙词语言、单元词语言、关键词语言等3)检索语言所描述的信息特征 描述信息外部特征:书/刊/篇名、著者/团体著者、引文、代码/序号 描述信息内容特征:分类语言、代码语言、主题语言八、主题语言有几种?简要阐述其特点。单元词语言标题词语言关键词语言:非规范语言的一种叙词语言九、文献检索的基本方法、途径与步骤1基本方法:常用法、追溯法、分段法2检索途径:分类途径、主题途径、著者途径、号码途径、其他途径(如题名、刊名、文摘、出版日期、语种、文献类型、会议地点等)3基本步骤:分析课题,明确检索需求 选择检索工具和方法 选择检索标识和检索途径 执行检索 检索结果处理及获取原始文献十、计算机文献检索方法和步骤:分析课题确定主题概念 选择检索方式和数据库 确定检索途径:常用检索词有两种,一种是主题词,一种是自由词,主题词是来源于系统词表并经过规范化处理的检索词,使用主题词检索可保证较高的查全率和查准率。 编制检索策略(检索式):1)布尔逻辑运算符: AND OR NOT 优先处理算符(),括号的运算优先级最高 Not>and>or 2)位置运算符 检索词在记录中的间隔距离 仅用自由词检索 With3)字段限定符 4)截词算符:*和? 检索策略的反馈调整 检索结果的输出选择题: 1下列哪项属于文献的内容特征:A标题B作者C来源D分类号E语种2下列哪种检索语言是后组式规范检索语言:A单元词语言B关键词语言C标题词语言D自由词语言E分类语言3下面对查全率和查准率描述错误的是:A若某检索工具的查全率较高,则查准率相对较低B查全率为检出的相关文献量占检出文献总量的百分比C查全率和查准率是反映文献标引深度的两个最主要的指标D查准率和查全率存在互逆关系E查全率和查准率只能相对提高,两者不可能同时达到100%4“香蕉水果”这个概念组配为“带有香蕉味的水果+苹果”,其组配所采用:A单元词语言B关键词语言C标题词语言D叙词语言E自由词语言5查找“心肌梗死的心理护理”方面的信息,这一检索提问属于:A文献检索B数据检索C事实检索D书目检索E全文检索6下列哪项不属于规范性检索语言:A单元词语言B叙词语言C关键词语言D标题词语言E分类语言
通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
外部特征:文献的题名、文献责任者和责任方式、责任者所属机构、文献的出版情况内容特征:文献所属的学科范畴、文献所研究的主题、文献所涉及的专有名词、组成该文献的所有字词句、分子式、公式
引自百度百科 文献检索一条 2 什么是文献的内容特征和外表特征?这两者有何区别?与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。 与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。
文献外部特征的检索语言主要是指对文献的篇名、作者姓名、出版者、报告号、专利号等内容的检索。
文献外部特征是一种文献检索语言。文献外部特征的检索语言主要是指对文献的篇名(即文献题名)、作者姓名、出版者、报告号、专利号等内容的检索。将不同的文献按照篇名、作者名称的字序或者按照报告号、专利号的数序进行排列,所形成的用来满足用户需求的检索语言。 文献是记录有知识的一切载体,这一定义看似简单,实际却很客观,也很全面、很严谨。从定义的字面意义中不难看出,这里所描述文献的构成要素基本有三。一是载体本身,二是载体所载内容,三是载体内容的记录方式或手段。 显然,按照文献的定义,文献这种特殊的载体必须同时满足这样三个基本条件:一是具有一定的信息、知识内容,二要利用一定的记录手段,三是表现出一定的载体形态。 信息与知识是构成文献的主体,没有信息、知识内容的任何形式的载体,只能称是物质,但不能称为文献。任何形式、类型的文献都必须首先以具有一定的信息、知识内容为前提。
通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
文献内容特征有文献的内容反映了人们在一定社会历史阶段的知识水平;而文献的存在形式(诸如记录手段、书写材料、构成形态与传播方式等),又受当时社会科技文化发展水平的影响与制约。社会的发展水平决定了文献的内容与形式,而文献的继承、传播与创造性的运用,又反作用于社会,成为社会向前发展的有力因素。前苏联著名作家高尔基的名言:“书是人类进步之梯”就是从这个意义上说的。
文献外部特征有:作者,姓名,出版者,等。文献内部特征有:正文,摘要等。
文献外部特征的检索语言主要是指对文献的篇名、作者姓名、出版者、报告号、专利号等内容的检索。
通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
文献外部特征的检索语言主要是指对文献的篇名、作者姓名、出版者、报告号、专利号等内容的检索。
分类语言 代码语言 主题语言字顺表 主题词变更表 树状结构表 副主题词表 CBM省缺字段内涵 中文标题 摘要 作者 关键词 主题词和刊名 逻辑优先顺序 not and or 任意通配符 %PUBMED数据库内容由 MEDLINE、In process citations 、Publisher-supplied citations 三部分组成
文献内容特征有文献的内容反映了人们在一定社会历史阶段的知识水平;而文献的存在形式(诸如记录手段、书写材料、构成形态与传播方式等),又受当时社会科技文化发展水平的影响与制约。社会的发展水平决定了文献的内容与形式,而文献的继承、传播与创造性的运用,又反作用于社会,成为社会向前发展的有力因素。前苏联著名作家高尔基的名言:“书是人类进步之梯”就是从这个意义上说的。
我也试试
通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。
文献外部特征有:作者,姓名,出版者,等。文献内部特征有:正文,摘要等。
文献内容特征有文献的内容反映了人们在一定社会历史阶段的知识水平;而文献的存在形式(诸如记录手段、书写材料、构成形态与传播方式等),又受当时社会科技文化发展水平的影响与制约。社会的发展水平决定了文献的内容与形式,而文献的继承、传播与创造性的运用,又反作用于社会,成为社会向前发展的有力因素。前苏联著名作家高尔基的名言:“书是人类进步之梯”就是从这个意义上说的。
引自百度百科 文献检索一条 2 什么是文献的内容特征和外表特征?这两者有何区别?与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。 与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。