信息检索是指将信息按一定方式组织和储存起来,并针对信息用户的特定需求查找出所需信息内容的过程。 计算机信息检索是指利用一定的检索算法, 借助于特定的检索工具, 并针对用户的检索需求, 从非结构化的数据中获取有用信息的过程信息检索原理示意图:如图 信息检索的实质是信息用户的需求和一定的信息集合的比较和选择的过程,即匹配的过程。信息检索步骤 分析检索课题,明确检索要求选择检索工具,选择检索途径确定检索标识,确定检索运算构筑检索提问,实施检索操作获取初步信息,调整检索策略获得满意结果
美国文献家赫伯特说:“知识的一半,是知道到哪里去寻找它。明日的文盲,不是不能阅读的人,而是缺乏检索能力的人。" 英国的大文豪塞缪尔·约翰逊(Samuel Johnson)说:知识分成两类,一类是我们要掌握的学科知识,另一类是要知道在哪儿可以找到 有关知识的知识 信息素养概念: 是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。包括信息意识、信息技能和信息道德。 信息意识:亦称信息观念,是人们对信息需求的自觉反应,即对信息的捕捉、分析、判断和吸收的敏感性。 信息技能:是人们有效快速地获取、加工、存储、利用和传递信息的能力。 信息道德:在整个信息活动中,信息的创建者、信息服务提供者和信息的使用者所必须遵守的社会法律法规和行为准则。 信息、知识、情报、文献 信息 是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。信息是通过一定的物质载体形式反映出来的,是事物存 在的状态、运动形式、运动规律及其相互关系、相互作用的表象。 在人类社会中,信息是以语言、文字、符号、图形、声波、光波、电磁波等形式传递,以纸张、胶片、磁带、光盘等作为纪录知 识的载体来表示。信息是不同于物质和能量的一种特殊资源。 知识 知识是人类对客观事物的认识、实践经验的总结。 知识是一种特定的人类信息,它是对信息进行提炼和深化的结果。系统化、理论化的信息就称为知识。信息是知识的源泉、材料 ,知识是信息的理论和结果。 情报 情报是人们在一定的时间内为一定的目的而传递的有使用价值的知识或信息。 情报来源于知识,是知识的一部分,是特定的知识或信息。情报具有保密性、时效性和传递性的特点。 文献 文献是记录有知识的一切载体。 (《中华人民共和国国家标准·文献著录总则》) 文献:凡人类的知识或信息,以文字、图形、代码、符号、声频、视频等形式记载到不同固态物质载体上面形成的一切记录。 综上所述,将客观事物产生的信息升华到理论化和系统化就形成了知识,再将知识记录在一定的物质载体上就形成了文献。文献是信息 、知识、情报的主要载体形式。而人类社会利用文献或文献进行交流,其实质是利用和交流文献中的信息、知识。 范围从大到小:信息〉知识〉情报 文献是贮存传递知识、情报和信息的介质。知识是文献的实质内容,载体是文献的外在形式 文献信息指文献载体上所承载的信息、知识内容。它属于信息,除具有信息的一切性质和功能外,也有自身的特点。表现为:P3①--⑤ 例:关键词tumor、tumour、cancer、carcinoma、neoplasms主题词规定只能用其中一个词表示“肿瘤”这个概念,即:neoplasms。 关键词:缩窄性心包炎,皮克心脏病 主题词:心包炎,缩窄性 文献的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。P4 文献的记录方式是指表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。种类P4 医学文献特点 数量庞大 载体多样化 多种文化 学科交叉、出版分散 知识信息更新加快 交流传播速度加快 电子化发展趋势 文献检索:将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。 广义的文献检索包括存储和检索两个过程。 而狭义的文献检索是从用户的角度来理解,仅指从已经存贮的具有检索功能的文献信息集合中查询出所需文献的过程。 文献检索类型 (1)按检出结果形式划分: 书目检索、全文检索、引文检索。 (2)从情报检索角度划分: 文献检索、数据检索、事实检索 (3)按检索手段划分: 手工检索和计算机检索 文献型信息检索(Document retrieval) 利用文献的内部和外部特征来查找所需的论文,综述 等等。其检索结果是切题文献或相关文献的文献线索或具 体的文献。例如,查找国内外有关“PCR诊断病毒性肝炎”方 面的研究文献 数据型信息检索(Data retrieval) 直接提供所需的确切的数值性数据。 事实型信息检索(Fact retrieval) 直接提供用户所需的确切的非数值性数据,即事实。如化学式的检索 文献检索原理 外表特征 内容特征 文献标引(indexing) 1、文献检索系统定义P7 指根据特定的文献信息需求而建立起来的一种有关文献信息的搜集、加工、存储和检索的程序化系统。 2、文献检索系统类型P8 目录型、题录型、文摘型、全文型4种。 3、文献检索系统的评价 (1)报道信息的准确性 (2)报道信息的及时性 (3)索引体系的完善程度 (4)对信息标引的深度 (5)查全率和查准率? 文献信息的类型 1、按文献信息表现形式划分 文字型文献 视频型文献 音频型文献 数字型文献 2、按文献信息出版类型划分 图书 专利文献 标准文献 期刊 学位论文 产品样本说明书 科技报告 技术档案 会议文献 政府出版物 3、按文献信息的载体形式划分 印刷型 缩微型 声像型 电子型 4、按文献信息的加工程度划分 零次文献信息 一次文献信息 二次文献信息 三次文献信息 按文献内容加工深度分: 零次文献:是指未经正式发表或未融入正式交流渠道的最原始的文献,如书信、手稿、实验数据、观察记录、笔记、内部档案等。 特点:内容新颖,但不成熟,难以查询。 一次文献:是指以著者本人的研究成果(如实验、观察、调查研究等结果)为依据而创作的原始文献,如期刊论文、专利说明书、会议 论文、学位论文、科技报告等。 特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便 二次文献:是对大量的、分散的、无序的一次文献信息经过加工整序后而形成的文献。如目录、索引和文摘等。 特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。 三次文献:是将分散无序的某一范围的一次文献,经过综合整理后而重新组织成有条理有定评的文献,如综述、进展、年鉴和百科全书 等。 特点:对知识信息具有浓缩性和综合性的特点,同时兼有检索文献的作用。 电子文献资源的概念: 以电子数据的形式,把文字、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的 形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源 2、电子文献资源的特点P15 (1)存储介质和传播形式的改变 (2)信息的表现形式多样化 (3)文献资源类型多样化 (4)多层次的信息服务功能 (5)更新速度快、时效性强 (6)具备检索系统或功能 (7)检索访问不受时空限制 检索语言概述 概念:P19 又称标引语言或索引语言,是用于描述文献检索系统中文献的内容特征及外表特征和表达用户检索提问一种专门的标识系统。 检索语言由检索标目(检索系统中的特征标识,也称检索词、索引词、标引词等)和语法组成(利用标目查找文献的一整 套规则)。 检索语言的分类 (一)、按照检索语言中所使用语词的受控情况划分 1、规范语言:又称受控语言、人工语言(Artificial Language),是一种采用经过人工控制的规范性的词语或符号作为检索标目,来 专指或网罗相应概念的一种检索语言。规范化的标目能较好地对同义词、近义词、相关词、多义词及缩略词等概念进行规范。 例:tumor、tumour、cancer、carcinoma、neoplasms受控语言规定只能用其中一个词表示“肿瘤”这个概念,即:neoplasms。 2、非规范语言:又称非受控语言、自然语言(Natural Language),是采用未经人工控制的词语或符号作为检索标目的一种检索语言 。(自由词、关键词。无法用规范词准确表达或新出现的词语) (二)按照检索语言所描述的信息特征划分 描述信息外部特征:文献的书名、刊名、篇名、著者、译者、出版社等 描述信息内容特征:分类检索语言、代码检索语言、主题检索语言。 分类检索语言:用分类号作为语言来表达各种概念。按学科、专业集中文献,从知识分类的角度揭示多种不同文献在内容上的区别和联 系,提供以学科分类为出发点的文献信息检索途径。 常用的分类法: 美国国会图书馆图书分类法 杜威十进分类法 国际十进分类法 中国图书馆分类法 国际疾病分类 《中图法》以各门学科的特点和规律为基础,按照知识门类的逻辑次序,将学科划分为五个基本部类、22个基本大类。五个基本部类为 :马克思主义、列宁主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书。基本大类的类号及其类目名称如P21 如《中国图书分类法》(简称《中图法》) R 医药卫生 R1 预防医学卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学 R75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学 R78 口腔科学 R8 特种医学 R9 药学 可细分至六、七级类目,如 : R6 外科学 R65 外科学各论 R655 胸部外科学 R1 胸壁 R2 胸膜 R656 腹部外科学 R1 急腹症 R2 腹部疝 R3 腹壁 R31 腹壁炎症 R32 腹壁损伤 中国图书馆分类法分类号标记是汉语拼音字母与阿拉伯数字相结合的混合制号码。 为了区别于一般图书,对教材、工具书等,在其分类号后加复分号,如R245-61(针灸辞典),R711-43(妇科学教材)。 对于临床各科(R5-R8),有专门复分表: 01 预防、控制和卫生 02 病理学、病因学 03 微生物学、免疫学 04 诊断学 05 治疗学 06 并发症 07 预后 08 诊疗器械、用具 09 康复 例:R3-05 天花治疗学 主题检索语言:以反映文献内容的主题词或关键词作为文献存储和检索的标识。 常见主题检索语言: 主题词又称叙词法:严格规范化、可进行概念组配、具有完善参照系统、具有范畴索引等 关键词法:以出现在文献的标题、摘要或全文中能表达文献实质内容的词或关键性专业名词术语作为检索标识 例:关键词tumor、tumour、cancer、carcinoma、neoplasms主题词规定只能用其中一个词表示“肿瘤”这个概念,即:neoplasms。 关键词:缩窄性心包炎,皮克心脏病 主题词:心包炎,缩窄性 《医学主题词表》(MeSh) 在进行检索时,用户输入一个主题词后,系统会自动显示该主题词所能组配的副主题词。《MeSh》有一个副主题词表,1989-1990年IM 使用的副主题词是77个,1991-1994年是80个,每年略有变化。目前IM使用的副主题词是93个。 副主题词(Subheadings)又称限定词(Qualifiers),与主题词进行组配,对某一主题词的概念进行限定或复分,使主题词具有更高的专 指性。如诊断(Diagnosis,DI)、药物治疗(Drug Theray,DT)等。正确选择副主题词也很关键。 例如肺发育不全,输入主题词“肺”后,在副主题词菜单中选择“畸形”表示发育不全;再例如,双子宫——用子宫/畸形检索 代码检索语言:用代表事物的代码作为标识系统的索引语言。(化合物分子式索引、环状化合物环系索引、化学物质号索引等) 文献检索的方法、途径和过程 1、检索方法 (1)追溯法: 通过已知文献后附有的参考文献中提供的线索来查找文献。 (2)常用法:利用各种检索工具来查找文献。它又分为顺查法、倒查法和抽查法。 (3)循环法:是将常用法和追溯法交替使用的一种综合文献检索方法。 (4)浏览法: 是从本专业期刊或其它类型的原始文献中直接查阅文献资料。 常用法顺查法 按照时间顺序由远及近逐年查找文献的方法。一般用于重大课题和各学科发展史以及新兴学科等方面的研究课题的全面 检索,一般已知课题开始年代。如查找“有关SARS的文献” 。查新规定检索十年或十五年的文献 倒查法 按照时间顺序由近及远回溯性逐年查找文献的方法。科研人员常用的检索方法。适用于一些新课题或有新内容的老课题 ,或在确认某项成果是否有创新时,也适合采用倒查法 抽查法 针对某学科或某课题研究的特点,根据文献资料发表集中的年代或时期,抽出其中一段时间进行文献检索的方法。多用 于写专题调查报告。 2、检索途径 (1)著者途径:利用已知著者姓名作为检索标识进行文献查检。 (2)分类途径:利用特定分类体系的分类号或分类类目作为检索标识进行文献查检。 (3)主题途径:利用从文献中抽出来的、或经过人工规范化的、能代表文献组要内容的检索标识或标引词进行检索。 (4)其他途径:利用特定的检索标识进行文献查检。 使用主题途径中的主题词应注意的问题: 选用主题词的概念要适当,不能太广或 太狭。 选用主题词,应从事物的“专有名词”来考虑,不要从“过程词”来考虑。 要注意主题词的倒置形式。 主题词与副主题词之间的组配。 医学文献检索的步骤 检索策略—是为实现检索目标而制定的全盘计划或方案 一、分析检索课题 目的是使用户清楚其课题要解决的实质问题。是制定检索策略的根本出发点,也是检索效率高低或成败的关键 明确检索目的及要求(课题所属的学科范围、要求的文献类型、年限、语种、需要的文献量等) 二、选择检索工具 手工检索工具(目前很少读者使用此方式) 计算机检索系统:根据课题内容,选择合适数据库 三、选择检索方法 常用法 追溯法 分段法 四、确定检索途径 反映文献内容特征: 主题途径、分类途径等 反映文献外部特征: 著者途径、书(刊)名途径、 代码途径 用逻辑运算符构造提问表达式 五、根据检索结果,调整检索策略,必要时对检索词或检索式进行修改,直至检出结果符合要求 六、根据文献线索,获取原始文献
278 浏览 1 回答
106 浏览 2 回答
112 浏览 1 回答
174 浏览 2 回答
179 浏览 3 回答
300 浏览 3 回答
352 浏览 4 回答
253 浏览 2 回答
283 浏览 2 回答
105 浏览 1 回答
165 浏览 5 回答
221 浏览 12 回答
292 浏览 12 回答
132 浏览 5 回答
85 浏览 12 回答
342 浏览 9 回答
94 浏览 9 回答
148 浏览 7 回答
181 浏览 12 回答
160 浏览 3 回答