文献检索工具 , 也称检索系统,是一种用来报导、查找、分析文献的信息系统。一般来说,一种检索工具是相对其检索的目标文献而言的,它应当根据其读者群的检索需求设定目标文献的种类和范围,并根据目标文献的特点和检索工具的用途提供相应的检索功能。就检索工具的性能来说,显然,收录的文献数量越大、内容越复杂,就越难找到目标文献。长期以来,如何评价一个检索工具的质量,特别是对一个海量文献资源的检索工具来说,一直是图书情报和信息学界的一个重大难题。 检索工具的研制目的是多种多样的。比如,为了帮助读者方便快捷地找到某图书馆的馆藏文献,各馆可以针对馆藏资源编制一个本馆的文献检索工具;为了共享多个图书馆的文献资源, CALIS 、 OCLC 等开发了图书馆联合书目检索系统;为了方便读者发现、选购书店的库存文献,书店联合制作了可供书目数据库;为了透过文献的外部特征和内容概要,直接查找所需要的论文,人们研制了许多期刊、会议论文集的题录摘要数据库;为了通过文献之间的引证关系,揭示文献的内容关联,系统地发现反映相关研究成果的文献集合,人们又制作了期刊、会议论文、博硕士学位论文、图书等各种文献资源的引文数据库;为了便于查找和直接提供全文文献,国际国内产生了各种各样的全文数据库。应当说,一种检索工具的质量优劣,是相对于它是否能够很好地实现其设计目的和用途而言的。 但是,无论有何种不同的设计目标和用途,作为文献检索工具,其共同的、最重要的质量要求,都离不开对其收录目标文献的完整性和检索功能的先进性、准确性、方便与快捷性的评价和判断。简而言之,就是要做到“收全、查全、查准”。如能达到这样的要求,就可以在文献检索的层面上,最大限度地满足读者查找、获取目标文献的需要,人们就可以认为它是一种权威性文献检索工具。然而,对于内容复杂的海量文献资源来说,实现检索工具的权威性非常之难,可以说是人们长期以来孜孜以求的最高境界。 对《中国学术期刊网络出版总库》来说,就如其产品系列标准的总则中所言,它的设计目标,不同于一般的全文数据库,除了作为我国学术期刊的集成化网络出版平台,可以直接向读者报导学术期刊全文文献之外,另一个极为重要的基础性建设目标,就是建立中国学术期刊的权威性文献检索工具,支持全面、系统的文献检索服务和各种管理决策咨询服务。并且以此为基础,通过文献资源整合和内容深度挖掘,构筑数字化学习与研究平台,创建智能化专业知识库,打造我国学术文献和科研绩效评价系统,提供战略性数字化资源馆藏。 为了达到权威性要求,《总库》系列标准规定了一系列产品质量指标,并且已经通过了国家的鉴定认可。其中,很多指标要求之高都是史无前例的。而且,根据《总库》的发展规划,涉及权威性的产品质量指标还要继续增加和提高。譬如,在文献资源收录与编辑出版方面,期刊种数总体收录完整率,要从目前的 93% 提高到 95% ,文献收全率不满足于目前的 9% ,现刊文献网络出版平均滞后速度要减少到小于 2 个月,文献分类汇编与导航控制系统还要增加文献标识码分类控制功能;在数据编辑加工方面,还要进一步提高中外文参考文献的著录精度,继续拓展引文链接与分析功能,完善“知网节”文献组织模式;在检索软件功能方面,还要更加完善检索词推荐、主题索引、检索排序、知识元搜索、智能聚类等新技术,更好地利用人工智能技术深入、准确地揭示内容,提高文献检索的水平。 人们常说,凡事适可而止。追求检索工具的权威性,也应当有个合适的度。从实用角度来说,标志《总库》权威性的质量指标,是有必要定的这么高吗?为了产品的权威性,做出如此大的投入,而且这些成本终将转嫁到用户头上,符合必要性、科学性和实用性原则吗?对这些实质性问题,产品研制者和广大用户都应当有一个清醒的正确认识。在制定《总库》系列标准和产品鉴定的过程中,专家们对这个问题进行了深入的研究,认为制定、实施这样高标准的质量要求,是科学合理、势在必行的。 一、《总库》的基本用途决定了全面收录七类期刊的必要性 《总库》所指的学术期刊,实际上包括各学科领域的基础研究和应用基础研究、工程技术、高级科普、政策指导、行业指导、职业指导、实用技术等七类期刊。之所以把这七类在读者定位、内容层次方面都不相同的期刊汇编在一起,其目的是为了: 1 、支持学术研究和技术开发人员广泛地共享、汲取各学科成果和情报,广开思路,博采众长,在学科交叉渗透与技术大规模集成两个方面寻找重大创新的突破口;支持研究人员在新的学科领域发挥专长,寻求更重要的科研机遇和更大的发展空间。 2 、支持学术研究与国家政策研究、行业应用实际的紧密结合,促进理论联系实际,促进基础研究与科技开发成果的转化。 3 、支持党和政府管理人员了解学术研究和社会发展动态,促进政策理论研究水平、科学决策水平、政策理解和执行能力的提高。 4 、支持各行各业管理和技术人员了解学术研究进展,促进其学术理论水平和创新能力的提高。 5 、支持高等院校各级各类师生全面了解科学前沿,深入了解国情和各行各业发展状况,促进面向高水平创新型人才和高素质技能型人才培养的教育教学改革。 由此可见,为了达到上述目的,需要把这七类内容相辅相成、不可分割的期刊文献分类汇编到一起,以形成知识网络型的整体化文献体系。 二、我国期刊内容出版的分布决定了文献完整收录的必要性 由于种种原因,我国存在很多综合性学术期刊,学术文献的出版分布由此严重地偏离了市场经济规律。严格意义上讲,人们很难界定所谓核心期刊。因而《总库》很难根据期刊的文献内容和质量分布缩小期刊收录范围。譬如,一种由地方性高等职业技术学院主办的学报,主要刊登本校、本地作者的论文,但是可能具有很强的地方特色优势,对于某个学科的发展不容忽视。 另外,由于文献内容相对期刊分布的弥散性,更有必要全面收录、分类汇编,重新建构我国学术期刊和相关期刊文献资源体系,形成各学科专业的数字化、集成化“大杂志”,通过网络传播,克服期刊定位不清所造成的文献传播问题。 三、学术、政策研究的继承性和连续性决定了过刊文献完整收录的必要性 我国科技方面原始性创新成果虽然较少,但毕竟有像数学、航空航天、原子能技术、中医中药技术、遗传工程、农业工程等诸多优势学科领域,很多后继性科研和技术开发也有较长历史。在人文社会科学领域,悠久民族历史文化作为世界文化的重要组成部分亟待发扬光大。因此,完整收录重要学术期刊过刊文献是非常必要的。 四、我国期刊出版的规范化水平决定了检索功能完备化的必要性 我国信息技术发展与应用较晚,文献检索工具的开发与应用对期刊出版规范的影响较小,迄今仍有大量期刊的编辑出版不考虑文献检索的需要。譬如,不规范撰写文章标题、关键词、摘要、作者、作者机构、参考文献等必要特征信息的期刊还有很多。而且,为了建构《总库》的完整文献体系,各类读者定位不一、内容层次不分的期刊和文章被收录到一个数据库之内,如果不对这些文献信息进行彻底的规范化加工,建立刊名、主题词与关键词、作者、作者单位、引文、基金等规范文档,配备功能齐全、技术先进的检索软件,其检索结果的严重无序,将使整个文献资源退化为信息垃圾,无从实现《总库》整合汇编所希望达到的目的。 五、全文检索对查全、查准性能的影响非常重要 检索元数据的规范化著录和标引,并不能完全解决查全查准问题。很多重要的概念和词语,特别是它们之间的特定语义关系,并不能被全面、恰当地标注在关键词中。只有将文献完全数字化,采用全文检索技术建成全文数据库,才能更完整、准确地检索到目标文献。再者,只有采用全文数据库技术,才能实现各种智能化处理和知识挖掘,譬如,检索词自动推荐、相似文献检索、自动聚类、新概念搜索、数值搜索等等。 六、“知网节”是查全查准的一种重要手段 利用文献内容的相关性,既可以发现知识、启发创新思维,也是查找文献的重要线索。“知网节”几乎链接了所有重要的相关文献,可以使读者沿着知识网络脉络,从引证文献网络、作者网络、作者机构网络等各个途径和角度更为准确、全面地进行文献检索。 综上所述,《中国学术期刊网络出版总库》出于广泛、深入应用的目的,有必要建成权威性的中国学术期刊文献检索工具。《总库》通过国家鉴定既是对这一建设目标的肯定,也是对这一产品科学价值和应用价值的客观评价。我们将继续沿着这一方向,不断创新,将《总库》建成更高水平、更高层次的权威性检索工具。 希望对你有所帮助。