信息检索课后作业题及部分答案1. 信息素养或素质的具体内容要求有哪些?信息素养一词最早来源于美国,简单地讲信息素养即通过教育所培养的在信息社会中对信息资源的获取、加工、处理以及信息工具的掌握和使用等的能力。1998年美国制定了学生学习的九大信息素养标准,包括:能够有效地和高效地获取信息;能够熟练地、批判地评价信息;能够精确地、创造性地使用信息;能探求与个人兴趣有关的信息;能欣赏作品和其他对信息进行创造性表达的内容;能力争在信息查询和知识创新中做到最好;能认识信息对民主化社会的重要性;能履行与信息和信息技术相关的符合伦理道德的行为规范;能积极参与活动来探求和创新信息。综上所述,完整的信息素养应包括三个层面:文化素养(知识层面)、信息意识(意识层面)、信息技术(技术层面)。2. 信息、知识、情报、文献的概念?文献的组成要素?信息包含了知识、文献和情报。是一个从低级到高级的信息集合。知识是人类对各种信息认识和加工形成的精神产品,是人的大脑对大量信息通过思维重新认识. 情报是指被传递的知识或事实,是知识的激活,是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研,生产中的具体问题所需要的特定知识和信息.情报应具有3个基本属性:一是知识或信息;二是要经过传递;三是要经过用户使用产生效益.情报不仅取决于情报源,也取决于情报用户. 文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。现在通常理解为图书、期刊等各种出版物的总和。文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。 文献的构成要素应包括:知识性内容,文献符号系统,文献记录方式,文献载体,这些要素之间相互联系,相互促进3. 信息、信息资源有哪些类型?信息的类型:从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。信息资源的类型:按文献信息的载体材料和制作方式划分:(1) 印刷型(2) 缩微型(3) 声像型(视听型)(4) 电子型(机读型)以撰写的目的和文体划分:文献信息资源以撰写的目的和文体划分,主要可分为著作、学术论文、专利说明书、科技报告、技术标准、科技档案、产品资料。其中信息含量、学术价值和使用频率较高的为前五种。按文献信息的产生秩序与整理加工深度划分:文献信息资源按其信息加工深度划分,可分为零次文献信息、一次文献信息、二次文献信息、三次文献信息和高次文献信息。根据出版形式和内容公开程度划分:文献可划分为白色文献、灰色文献、黑色文献三种类型4. 文献有哪些类型?将文献分成这些类型的依据是什么?根据划分标准的不同,文献有多种分类方式。按文献的编辑方法和出版特点划分:1.图书2.期刊3.特种文献资料特种文献资料主要包括以下几种类型:(1)科技报告(2)政府出版物(3)会议文献(4)学位论文(5)专利文献(6)标准文献(7)产品样本4.其他零散资料按文献载体形式划分:1.印刷型文献2.缩微型文献3.视听型文献4.机读型文献按文献加工层次分:1.一次文献2.二次文献3.三次文献5. 数据库的类型?网络资源有哪些特点?数据库有类型之分,是根据数据模型划分的。目前成熟地应用在数据库系统中的数据模型有:层次模型、网壮模型和关系模型。另:模糊数据库 指能够处理模糊数据的数据库。一般的数据库都是以二直逻辑和精确的数据工具为基础的,不能表示许多模糊不清的 事情。随着模糊数学理论体系的建立,人们可以用数量来描述模糊事件并能进行模糊运算。这样就可以把不完全性、不确定性、模糊性引入数据库系统中,从而形成模糊数据库。模糊数据库研究主要有两方面,首先是如何在数据库中存放模糊数据;其次是定义各种运算建立模糊数据上的函数。模糊数的表示主要有模糊区间数、模糊中心数、模糊集合数和隶属函数等。 统计数据库 管理统计数据的数据库系统。这类数据库包含有大量的数据记录,但其目的是向用户提供各种统计汇总信息,而不是提供单个记录的信息。 网状数据库 处理以记录类型为结点的网状数据模型的数据库。处理方法是将网状结构分解成若干棵二级树结构,称为系。系类型 是二个或二个以上的记录类型之间联系的一种描述。在一个系类型中,有一个记录类型处于主导地位,称为系主记录类 型,其它称为成员记录类型。系主和成员之间的联系是一对多的联系。网状数据库的代表是DBTG系统。1969年美国的 CODASYL组织提出了一份“DBTG报告”,以后,根据DBTG报告实现的系统一般称 为DBTG系统。现有的网状数据库系统大都是采用DBTG方案的。DBTG系统是典型的三级结构体系:子模式、模式、存储模式。相应的数据定义语言分别称为子模式定义语言SSDDL,模式定义语言SDDL,设备介质控制语言DMCL。另外还有数据操纵语言DML。 演绎数据库 是指具有演绎推理能力的数据库。一般地,它用一个数据库管理系统和一个规则管理系统来实现。将推理用的事实数据存放在数据库中,称为外延数据库;用逻辑规则定义要导出的事实,称为内涵数据库。主要研究内容为,如何有效地计 算逻辑规则推理。具体为:递归查询的优化、规则的一致性维护等。网络学术信息资源的特点:1.内容极为丰富。网上的学术信息资源覆盖面广,涵盖了各个学科领域;信息种类繁多,正式出版的,非正式出版的,学术机构提供的、个人提供的都交织在一起。当然,着其中既有有价值的信息,又有很多有意义的信息。2. 整体分布混乱由于网上信息没有统一的管理机构,也没有统一的发布标准,且变化、更迭、新生、消亡等都时有发生,难以控制。这就造成了网络学术资源在某个局部范围内是有序的,而资源的整体分布较为分散、无序,甚至呈混乱状态。3.信息动态变化网络是一个巨大的动态系统,不仅信息分散无序,且经常更替,每天都有新的网站出现,又有网站撤消或重组,并且每个网站自身的链接地址、栏目设置也经常变动。4.网络信息时效性强网络信息的发布压缩了传统文献的编辑、出版和发行等环节,有的甚至完全在网上发行,实现了作者与编辑不受时空限制的即时交流,大大缩短了信息编辑出版的时间,使得信息具有较强的时效性。5.检索快捷迅速6. 何为“核心期刊”?本专业的核心期刊有哪些?核心期刊是期刊中学术水平较高的刊物,是我国学术评价体系的一个重要组成部分.它主要体现在学术水平的确认方面.如在相当一批教学科研单位。申请高级职称,取得博士论文答辩资格,申报科研项目,科研机构或高等院校学术水平评估,教师,工作人员完成的工作量等,前提条件之一就是在一定时间段内,在核心期刊上发表若干篇论文.分为国家级\省级\市级等等级别。材料成型专业的核心期刊有:金属热处理、金属成形工艺、模具工业、北方论丛、热加工工艺、模具工业、特种铸造及有色合金、工程塑料应用、锻压技术、铸造技术、特色铸造及有色合金、轻合金加工技术、铸造、铸造技术、材料研究学报、热加工工艺、机械工程材料、兵器材料科学与工程、汽车技术、中国塑料、工程塑料应用、机床与液压、锻压装备与制造技术、中国塑料、现代制造工程、工程塑料应用、现代制造工程、锻压机械、微物电机、新技术新工艺、微特电机、重庆大学学报(自然科学版)、重庆大学学报(自然科学版)、武汉理工大学学报、塑性工程学报7. 什么是信息检索?信息检索的类型有哪些?信息检索是指将信息按一定方式组织和存贮起来,并针对用户的需求找出所需信息的过程,又称为“信息存贮与检索”。 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。类型:(一)按检索内容划分1、书目检索2、数据检索3、事实检索4、全文检索5、图像检索6、多媒体检索(二)按是否使用检索工具划分1、直接检索2、间接检索(三)按信息检索手段划分1、传统信息检索2、现代信息检索8. 简述信息检索的原理。信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其中存储是为了检索,而检索又必须先进行存储。另信息检索的基本原理可从文献的替代、整序和标识的匹配三方面来讲述。1.文献的替代2.文献的整序3. 文献特征标识与检索提问标识的匹配而所谓信息检索原理,简单地讲,就是检索提问标志与存储在检索工具中的文献特征标志进行比较或称匹配,然后提取相符合的文献信息的检索方法。9. 什么是计算机信息检索系统,它由几部分组成?计算机信息检索系统:利用计算机系统有效存储和快速查找的能力发展起来的一种计算机应用技术。它与信息的构造、分析、组织、存储和传播有关。计算机信息检索系统是信息检索所用的硬件资源、系统软件和检索软件的总合。它能存储大量的信息,并对信息条目(有特定逻辑含义的基本信息单位)进行分类、编目或编制索引。它可以根据用户要求从已存储的信息集合中抽取出特定的信息,并提供插入、修改和删除某些信息的能力。计算机信息检索系统的组成,从物理构成来讲、检索系统由硬件、软件、数据库三部分组成10. 计算机信息检索技术有哪些?布尔逻辑检索截词检索邻近检索字段限制检索模糊检索11. 从外表特征与内容特征来看,检索语言的类型各有哪些?不同特性各举一简单的检索式。根据文献的特征检索文献信息是最简捷的途径。其特征有两个:一是文献的外表特征,即“著者、书名、刊名、号码”等;二是内容特征,即“分类、主题、关键词”等。检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类。分类语言:焊接工程师手册 陈祝年 机械工业出版社主题语言:(唐 OR 宋)AND 诗歌根据文献的特征检索文献信息是最简捷的途径。其特征有两个:一是文献的外表特征,即“著者、书名、刊名、号码”等;二是内容特征,即“分类、主题、关键词”等。12. 为什么要创建“检索语言”,它有哪些类型?比较分类语言和主题语言的优缺点。(一)按照标识的性质与原理划分1. 分类语言分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。以知识属性来描述和表达信息内容的信息处理方法称为分类法。著名的分类法有《国际十进分类法》、《美国国会图书馆图书分类法》、《国际专利分类表》、《中国图书馆图书分类法》等。2.主题语言主题语言是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。以主题语言来描述和表达信息内容的信息处理方法称为主题法。主题语言又可分为标题词、元词、叙词、关键词。(1)标题词标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词是主题语言系统中最早的一种类型,它通过主标题词和副标题词固定组配来构成检索标识,只能选用“定型”标题词进行标引和检索,反映文献主题概念必然受到限制,不适应时代发展的需要,目前已较少使用。(2)元词元词又称单元词,是指能够用以描述信息所论及主题的最小、最基本的词汇单位。经过规范化的能表达信息主题的元词集合构成元词语言。元词法是通过若干单元词的组配来表达复杂的主题概念的方法。元词语言多用于机械检索,适于用简单的标识和检索手段(如穿孔卡片等)来标识信息。(3)叙词叙词是指以概念为基础、经过规范化和优选处理的、具有组配功能并能显示词间语义关系的动态性的词或词组。一般来讲,选做的叙词具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性。叙词法综合了多种信息检索语言的原理和方法,具有多种优越性,适用于计算机和手工检索系统,是目前应用较广的一种语言。CA、EI等著名检索工具都采用了叙词法进行编排。(4)关键词关键词是指出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词。关键词法主要用于计算机信息加工抽词编制索引,因而称这种索引为关键词索引。在检索中文医学文献中使用频率较高的《CMCC》数据库就是采用关键词索引方法建立的。3. 代码语言代码语言是指对事物的某方面特征,用某种代码系统来表示和排列事物概念,从而提供检索的检索语言。例如,根据化合物的分子式这种代码语言,可以构成分子式索引系统,允许用户从分子式出发,检索相应的化合物及其相关的文献信息。(二)按照表达文献的特征划分1. 表达文献外部特征的检索语言表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。描述文献电子书版权解决方案,并大规模的开展与作者和出版社的签约授权工作。经过不懈的努力,至今为止已经有三十万位作者同意将自己的作品授权超星数字图书馆; 庞大的用户群、周到的服务 数百万的注册用户遍布世界各地,涉及全国各省区、行业、高校、科研机构的各界人士; 16×7 节假日不休息的在线技术客服人员通过客服热线电话、在线论坛、电子邮件等可以为您随时解答疑问。 书生之家数字图书馆是建立在中国信息资源平台基础之上的综合性数字图书馆。书生之家数字图书馆集成了图书、期刊、报纸、论文、CD等,从载体上说囊括了印刷版、光盘版、网络版等各种载体的资源。收录入网出版社500多家、期刊7000多家、报纸1000多家。每年收录新出版中文图书30000本,期刊文献60万篇,报纸文献90万篇。下设中华图书网、中华期刊网、中华报纸网、中华资讯网和中华CD网等子网。资源内容分为书(篇)目、提要、全文三个层次。提供全文、标题、主题词等十种数据库检索功能以及CN-MARC格式数据套录功能,提供印刷版书报刊、光盘数据库以及其他数据库的网上订购功能,还为会员单位提供定制化的资源数字化加工服务。简言之,书生之家数字图书馆是集数据库应用平台、信息资源电子商务平台与资源数字化加工服务平台三位一体的综合性数字图书馆。《中国期刊全文数据库(CJFD)》是目前世界上最大的连续动态更新的中国期刊全文数据库,积累全文文献800万篇,题录1500余万条,分九大专辑,126个专题文献数据库。 知识来源:国内公开出版的6100种核心期刊与专业特色期刊的全文。数据库特点:● 海量数据的高度整合,集题录、文摘、全文文献信息于一体,实现一站式文献信息检索(One-stop Access);● 参照国内外通行的知识分类体系组织知识内容,数据库具有知识分类导航功能;● 设有包括全文检索在内的众多检索入口,用户可以通过某个检索入口进行初级检索,也可以运用布尔算符等灵活组织检索提问式进行高级检索;● 具有引文连接功能,除了可以构建成相关的知识网络外,还可用于个人、机构、论文、期刊等方面的计量与评价;● 全文信息完全的数字化,通过免费下载的最先进的浏览器,可实现期刊论文原始版面结构与样式不失真的显示与打印;● 数据库内的每篇论文都获得清晰的电子出版授权;● 多样化的产品形式,及时的数据更新,可满足不同类型、不同行业、不同规模用户个性化的信息需求;● 遍布全国和海外的数据库交换服务中心,配上常年的用户培训与高效的技术支持。数据库的应用:CJFD除了可用于信息检索、信息咨询、原文传递等常规服务外,还可以用于以下一些专项服务:● 引文服务,生成引文检索报告;● 查新服务,生成查新检索报告;● 期刊评价,生成期刊评价检索报告;● 科研能力评价,生成科研能力评价检索报告;● 项目背景分析,生成项目背景分析检索报告;● 定题服务,生成CNKI快讯。维普资讯《中文科技期刊数据库》采用国内一流检索内核“尚唯全文检索系统”实现数据库的检索管理。“尚唯全文检索系统”是经国内专家团队鉴定一致认为达到“国内领先、国际先进”水平的检索系统, 各种指标及其综合性能均大大领先于其它同类产品。 《中文科技期刊数据库》是国内首家采用 OpenURL技术规范的大型数据库产品, OpenURL (Open Uniform resource Locators) 协议 是一种上下文相关的开放链接框架,它实现同时对不同的异构数据库或信息资源进行数据关联,方便地为用户单位提供资源的二次开发利用,例如与图书馆 OPAC系统的数据关联。 OpenURL 协议已经成为美国国家标准。维普是国内首家应用 OpenURL协议的数据库厂商,已经在中国科学院、国家图书馆、北方航空航天大学、中国生物医学文献数据库成功应用,效果明显,深受欢迎。 万方数据知识服务平台系统功能与特点 万方数据知识服务平台为用户提供了更多的功能和服务。主要体现在以下几个方面: 系统提供了灵活的分类组织功能,通过定义资源之间的关联关系,可以打破数据库的物理界限,将相关的数据库资源组织在统一视图中。比方说通过分类浏览视图,可以实现同时在学位论文数据库和数字化期刊全文数据库等多个数据库中浏览资源。检索历史功能用户可以通过在检索入口的“检索历史”链接,查看自己最近检索记录(CQL表达式)并通过该检索记录查看在对应数据库中检索得到的结果。如图所示:跨数据库检索系统的整合功能系统可以跨多种数据库检索系统,可以实现各种检索系统的整合。目前系统已经支持跨RMS数据库、MS SQL Server数据库。同时系统提供了扩展机制,可以根据用户需要添加对其他数据库的支持。完整的负载均衡与可容错检索集群系统提供了完整的检索服务器、文件服务器集群的管理和控制功能,可以实现动态的添加、删除、修改服务器集群。文件集群系统可以支持多种文件引擎,实现了各种文件系统的整合,目前系统支持本地文件、共享文件、ftp文件服务,同时提供了扩展机制,可以根据用户需要添加对其他文件系统的支持。支持多种后台数据库系统使用O/R mapping技术,实现了底层配置数据库的隔离配置,目前系统可以运行在Oracle/MS Sql Server/Firebird等数据库基础之上。资源整合与用户个性化服务的完美结合SRW接口、OpenUrl接口的提供为了便于元数据库的交换和全文获取,系统还基于SRW标准提供了检索扩展接口;基于OpenUrl标准提供了期刊论文等全文资源的开放接口。