摘 要:通过分析互联网的信息检索特点,提出针对不同检索内容的检索策略,达到提高信息检索的有效性的根本目的。
关键词:互联网;信息检索;检索策略
信息是现代社会的宝贵资源,随着社会的发展进步,信息的价值将不断飚升。正如世界著名未来学家阿尔温.托夫勒预言:"谁掌握了信息,控制了网络,谁就掌握了整个世界。"而互联网和计算机的的发展使得信息检索的软硬件环境有了很大改善,人们越来越多的利用网络信息资源来满足自身的信息需求,因此互联网信息检索日益发展成为信息检索的主流。
1.互联网专题信息检索的特点
互联网专题信息检索是一种基于超文本方式的信息查询工具,主要特点如下:
(1)系统为分布式存在
网络信息检索以节点为单位,节点间交叉相联,复杂的信息连接结构能够按照不同的查询条件链接节点信息。信息资源在物理上分散在多个网络节点上,确保网络节点互联互通和快速可达,是在分布的网络环境中提供相关信息服务的首要条件。
(2)检索用户数量多
信息资源服务对象是多用户的,针对不同用户开展不同的信息检索服务,首要是区分和管理检索用户的个性化信息需求,让有效信息能够正确汇总到用户面。
(3)海量的信息内容
互联网信息源众多,数据量巨大,信息丰富,但是同时也标志着无效数据成爆炸性增长,高效率的信息检索方式和方法就成为沙里淘金的要素,此外由于极大的信息量,相应的处理分析时间也将大大延长。
(4)信息检索的非专业化
互联网环境下多数用户不具有专业的信息检索技能,虽然搜索引擎也支持逻辑组合,但是非专业用户更加需求灵活的问答式的信息检索、个性化推送更更加便捷和智能的信息检索服务。
2.互联网专题信息检索的策略
2.1选定特定的主题,并确定关键词
以陈述句或疑问句形式写下你要检索的主题,并确定关键词或词组。把你认为最重要的概念定为检索关键词。注意检索词的同义词、单复数、拼写变异、单词结尾的不同等。确定包涵检索主题的较广的类别,这对于应用分类方法检索信息很有用。选定可能包涵检索主题的组织或机构。应用搜索引擎得到这个地址,然后浏览或检索这个网址。
2.2选定适合的搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。它主要是用于检索网站、网址、文献信息等内容。随着网络技术的发展各种搜索引擎层出不穷,目前被大家广泛运用的主要是帮助大家搜索表层信息,如Google、百度、雅虎等。而搜索引擎按检索方式可分为目录搜索引擎、全文搜索引擎和多元搜索引擎三种。检索界面是否允许应用布尔符、截词、自然语言或仅能用单个词检索?检索返回的结果仅仅是标题和URL?还是包括整个网页、部分网页及或新闻讨论组地址?这些都是影响选择搜索引擎的重要因素,引擎的大小、速度、帮助性能及检索结果显示的方式也将影响你的选择。另外根据查询信息类别不同可选用相应类型的站点,如查询网址可选用HotBot,查询人名选用WhoWhere?等。
2.3选用适当的检索方法
确定搜索引擎后,接下来就是具体用哪种方法来实施检索过程。下面推荐几种不错的检索方法,以便能成功地检索出你所需的文档。多元引擎检索:是检索信息的首选。它同时搜索几个独立的引擎,并把结果显示在同一页面上,是通过关键词和一些常用的运算符完成检索过程的。应用多元引擎加快了检索的全过程,且返回相对较少无关站点是其优点。缺点是当进行复杂检索时有时不能有效地执行,可能产生一些奇怪的结果。关键词检索:当你要查找的一个特定信息或所用的引擎数据库容量很大时, 应用关键词查询数据库,可得到较满意的结果。由于这类搜索引擎是应用机器人(即计算机程序)时刻在网际中巡视,并取回符合条件的网页存放在它的数据库中,因此数据库更新快,检索的结果新。缺点是给数据库中内容所做的索引有时不精确,常常给查找所需信息带来困难。分类目录检索:适用于分类明确的信息查找。它是一种可供检索和查询的等级式主题目录,以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题的方式组织起来。这些主题目录一般在大类下面分成若干小类,类目之间按等级系统排列,然后用人工的方法把搜集的网页连接起来,用户通过逐层点击主题目录,直到找出需要的信息为止。由于经过了人工的筛选和系统组织,检索的结果质量较高,条理性较强。缺点是采集信息的速度远远跟不上网络资源增长的速度,数据库往往较小,检索到的文献数有限。分类目录加关键词联合检索:当你对究竟用是分类检索好还是关键词检索好摇摆不定时,应用分类目录加关键词联合检索是你的最佳选择。一般先找到所需信息所处的范围较窄类别,再在该目录下应用关键词检索。该方法的优点是检索范围更窄,结果更精确有效。但对于较难的检索不易选择适合的关键词是其缺点。
2.4如何对待检索结果
有时检索结果并不满意,要么太多,要么太少或未能找到相关信息,遇到这些问题,你可试用下面的对策。可只阅读搜寻结果的前面几条信息。因为大多数搜索引擎都将最符合要求的网页列在前面,虽然返回的搜索结果成千上万,但经常是需要的网页地址就在最前面的一页。缩小搜索的范围。当返回的网页太多,而需要的网页不在最前面的几页时,可通过改变关键词、改变搜索范围、使用逻辑符AND及引号等方法缩小查询范围。找不到网页的对策。首先检查是否有拼写错误,接着看搜索关键词之间有没有自相矛盾的地方,如果仍不能成功地搜索,可换一种搜索引擎,也许会得到你所期望的结果。因为每个搜索工具功能虽大体相同,但检索方式和拥有资料的侧重点不同。如果用以上策略仍不能找到所需网页,也不必太失望。你可链接相近的网页,也许能找到理想目的地的链接,或直接与已搜索到的主页管理者写E-MAIL寻求帮助。
2.5互联网信息检索的发展趋势
随着互联网的发展,网络信息资源迅速多样化,并且在不停的发展更新,使得信息检索系统更为丰富、全面和系统。网络信息检索的发展强调"以人为本"的理念。另外,多媒体信息检索技术也已经成为信息检索研究的热点。
2.6网路信息检索的发展趋势
信息检索的多样化,其具体趋势表现为:网络检索信息的形态多样化,多媒体信息检索开始普及,网上检索工
具开始向其他服务范畴扩展,以各种形式满足大众信息需求。
信息检索的可视化,一个可视化的信息检索过程使得检索更加有效,可以为用户提供更丰富的信息。帮助用户更好的掌握检索信息的过程。
信息检索的智能化。智能化信息检索是当今的信息检索技术研究的热点问题之一,也是未来信息检索的发展方向,可以使得用户得到能够直接加以利用的信息,他是建立在一个或者多个专家系统基础上的信息检索系统。
信息检索的个性化。个性化主要体现在两个方面:一个是允许用户的个性化定制检索功能,另一个方面是利用推送技术主动的向特定用户提供所需要的互联网信息检索结果
信息检索的专业化。专业化信息检索是指面向某一特定专业和学科领域,提供高质量的专业信息检索服务功能,可以提高检索的查全率和查准率。
总之,随着信息技术的进步,互联网信息检索将不断发展完善,检索方法会更加灵活和智能化,而且检索结果也会更加丰富和准确,从而更好的为用户提供信息服务。