潘萍:基于网络环境的信息检索策略从计算机网络信息检索的基本工作原理中我们可以容易看出,信息需求用户输入的检索提问表达式必须和索引数据库系统的记录信息特征标识相匹配才能准确检索到需要的信息。搜索引警图2搜索引擎基本结构和原理2影响检索效率的主要因素1影响检索结果的非用户主要因素(1)网络信息资源的开放性和信息发布缺乏统一标准,网络信息发布无法得到控制,大量的各种虚假信息和新生代词充斥着整个网络,导致网络信息缺乏有效的整合,处于混乱无序的状态。(2)搜索引擎在信息收集整理过程中多数以词频或词的出现位置为统计依据来判断网页内容的相关程度,没有具体区分网页信息的专业领域属性,不能区别相同词语的不同需求倾向,使检索结果中无关信息数量增大,影响查准率;网上数据库涵盖领域范围有限,语种问相互切换技术不十分成熟。这些都影响了检索的查全率。例子:要查找苹果牌电脑,输入检索词“苹果”,结果检索系统返回大量“苹果”这种水果的信息。想了解熊猫的生活习性,输入检索词“熊猫”,得到的却是大量有关“熊猫”牌手机和彩电的信息。2影响检索结果的用户主要因素大多数用户没有图书馆学和情报学基础知识;不懂得索引系统的基本工作原理和网络专业数据库的使用方法;不会分析主题提炼关键词,不会构造准确的检索表达式;很多用户主要使用自然语言检索,但目前检索技术中对自然语言和人工智能相结合的技术尚没有十分成熟,还属于热点研究中。可见,网络信息资源自身建设不完善、检索技术不成熟以及检索者素质不整齐是影响网络信息资源检索和利用的3大主要因素。3网络信息资源检索策略及步骤除了非用户的客观因素由索引系统技术员和情报专业人员逐步完善外,用户需要掌握一些检索策略和操作技能,才能不漏检,不误检,准确、快速地找到需要的信息。1信息需求分析,确定检索目标检索之前,须分析课题,以明确课题所包含的概念成份及其相互关系。这是检索策略制定的根本出发点,也是检索效率高低或成败的关键。(1)分析课题的主要内容和所涉及的学科范围。明确检索的内容和目的是选择检索工具和数据库以及其他检索行为的第一步。(2)明确所需文献的类型、语种、年代及文献量的范围等。清楚了文献的这些特征和要求才能选择数据库及做相应的限定检索。(3)查新、查准、查全的指标要求及其侧重。若要了解科技的最新动态、学科的进展、探索未知,则强调一个“新”字;如要解决研究中的具体问题,希望有一定范围的文献量,但不希望有误查,则要强调一个“准”字;如要了解一个全过程、写综述、做鉴定等,希望获得所有的相关文章,则要强调一个“全”字。2选择检索系统及数据库网上资源种类繁多,专业领域和学科范畴不同的数据库的文献类型和数量规模不尽相同,所以要选择非常合适的数据库和检索工具不是一件容易的事。数据库的选择可概括成“4C”原则,他们是:Content,指数据库的内容、学科范围、类型(如:数值、文摘、全文等)、数据来源(如:期刊论文、专利文献、科技报告等);(;overage-,指数据库的规模、时间范围、机构来源、文献量等;Cur-rency,指数据库更新的及时性、频率、周期;Cost,指数据库的收费标准和方式。一个检索系统往往包括若干数据库,进入系统后,常会有主题分类目录提供用户选择,如中国期刊网含有期刊全文数据库、博硕士学位论文全文数据库、年鉴全文数据库等,每个数据库下面又有不同的主题分类,所以用户应根据待检课题的范畴来决定选择具体的数据库。方向性信息检索,可利用Yahoo,Infoseek等目录型检索工具按照主题目录体系的向导去浏览、追踪信息;网络新闻组查询,使用【)eiaNews或ln‘foseek;检索图书期刊藏书处和款目,可以利用高校图书馆或其他图书机构的联机检索系统,如calis公共目录联机检索系统;学术性较强的信息,选择专题数据库。如中国期刊网、万方数据、人大复印资料等专题数据库;事实数据查找,如查找第五次全国人口普查全国总人口数,可以选择权威性的官方数据库,如国家统计局的统计公报http:///。总之,选择数据库应该以专题数据库为主,综合数据库为辅。此外,收集信息质量高的各学科专题网址可以起到事半功倍的效果。3概念分析,确定检索词主题概念分析,提炼检索词,明确哪些是核心词,哪些是次要词,有哪些隐含词,力求分析的主题词能准确反映