摘要:现如今图书馆高质量发展已成为图书馆发展之路的必然趋势,而人工智能的发展发展将充分利用图书馆的资源,是优化图书馆资源开发利用的有效方式之一。基于个性化服务的特点,提供有针对性、有特色的图书馆应用已成为图书馆可持续发展的一项服务和战略。本文在人工智能的背景下,重点分析了图书馆在个性化服务过程中的应用,提出了创新策略,以更好地促进图书馆的建设和发展。
关键词:人工智能;图书馆;个性化服务
一、人工智能背景下图书库服务的特点
(一)资料化
图书库系统包括图书库员、馆藏资料、信息技术、环境和使用者,然而大数据新信息环境的形成,逐渐模糊了图书库界与其他信息化的服务业之间的显示的画面。
调查发现,84%的使用者使用检索引擎Google开始信息检索,1%的人开始在图书库页面上检索信息,所以图书库应为这1%的使用者提供数字图书库资料。与此同时,1%的使用者中有70%以上首先选择使用数字珍藏;数字珍藏具有科学、经济和可查访性的特征,而我们需要考虑的是选择何种模式来存储数据、怎样的方式来组织信息供阅读使用者参观、以及选择怎样的方法来确保信息收集的可持续发展。
(二)网络化
数字图书库的建设需要为使用者提供便利,而为了实现这一目的,网格和数字图书库网格将整个网络集成到一个虚拟的超级计算机中,来实现使用者对多个数字图书库的无缝获取。总之,网格实现了资源的最大共享,实现了硬件资料、软件资料和各种信息知识资料的全面连接。
二、图书库数据发掘简介
即使手握足够数据,图书库也要面对数据管理的挑战。首先,数据的存储、数据模型、数据分析格式、搜集数据的系统的基础架构都要重头建起,必须能用而且不能出错。之后还要进行数据清洗,然而并不是所有数据都是直接可用的,它们大多杂乱无章、难以理解、无法获取、甚至有所缺失。
人工智能领域最聪明的一群人都想造出能真正促进人类社会发展的产品和应用,比如无人驾驶,比如预测世界经济走势的系统,比如超级医疗诊断系统等。但格式良好、适合分析的数据不会从天而降。目前,他们把80%的时间花在了整理历史数据上,个性化推荐是数据发掘中的常见技术之一。
个性化推荐大致可以分为数据准备、规律寻找、结果表述三个基本流程。它利用了来自统计并解读解析、人工智能、对模式进行辨识区别、神经网络、模糊数学、遗传程序步骤等多个学科领域的思想,并借助于搜集数据的系统所提供的有效存储、索引和查询处理支持,以及高性能并行计算、分布式数据处理、可视化等技术而得以实现。
三、Web日记发掘应用
(一)关联规则在Web日记发掘中的运用
关联规则在Web日记发掘中用于发现使用者同时查访哪些页面,基本上用于查询大型项目集。我们可以分析格式化的信息,并使用关联规则的支持和可信度的定义直接通过Apriori程序步骤或其他相关程序步骤获得经常查访的序列。
Apriori程序步骤是关联规则发掘程序步骤的核心。它可以使用分段搜集数据的系统数据的方法来执行发掘,以便使用者只需扫描搜集数据的系统两次。但分割方法的前提是,整体搜集数据的系统的任何支持级别应该至少有一组本地搜集数据的系统的支持度集合。发掘网络日记数据是对网络日记数据集进行预处理,并根据一定的因素将其分成几个小的数据段。在扫描多个数据段后,Apriori程序步骤用于获取每个段的支持,然后每个分段的发掘结果被合并和扫描一次,并且最终的关联规则集被过滤掉。
(二)序列模式分析序列模式用于查询数据项中的时序关系
在Web日记发掘中,顺序对模式进行辨识区别是指查询在使用者会话中具有时间关系的页面请求。在Web服务器日记中,使用者查访会记录一段时间。数据经过预处理后,它会成为间歇性时间序列。这些顺序模式可以预测使用者可能请求的页面,从而可以在页面上为特定使用者组放置不同的信息提示,提高信息相关的资料的利用率和使用者信息检索查询速度,优化网站结构。
(三)Web日记发掘的一般流程
Web日记发掘的一般流程包括三个阶段:数据预处理,发掘阶段和模式分析。数据预处理将来自不同数据源的数据重组为适合数据发掘的数据结构是Web日记发掘的基础,也是整个发掘流程中最繁琐和耗时的工作。数据预处理包括数据清理,使用者辨识区别,会话辨识区别,路径补充和格式转换等几个步骤。这是成功Web日记发掘的关键。
在整个Web日记发掘流程中,数据预处理和日记发掘程序步骤是最关键的技术。数据预处理作为发掘程序步骤的输入,直接影响到对数发掘的质量,发掘程序步骤的选择和改进是保证发掘成功的重要因素。
四、个性化推荐及过滤应用
目前,特性化信息化的服务系统要求使用者逐步手动选择所需的信息类别,然后将这些选择提交给系统以显示相应的信息。这种服务方法的低效性也会增加系统的负担。一旦大家选择同时提交请求,信息化的服务系统将面临崩溃的危险。智能过滤技术智能获取并分析使用者特定的需要信息,然后在页面上显示使用者需要的信息相关的资料。有些使用者只是去图书库找资料来解决一些实际方面,他们不清楚他们想要的信息。面对这种情况,智能过滤系统通过使用者的操作行为分析使用者的实际特定的需要,然后根据这些特定的需要主动推送满足使用者特定的需要的使用者信息相关的资料。
另外,使用者的系统追踪方法也分为显示追踪和隐式追踪两种。前者是基于使用者反馈的信息,即从图书库服务系统阅读使用者存储的个人基本信息,包括教育、专业和兴趣者在填写基本信息时主动推荐信息相关的资料,这种追踪方式需要使用者的参与。后者通过诸如使用者查看的页面和查询内容之类的信息来推断使用者的真实特定的需要,这种追踪方法有助于提高服务系统的效率和智能。
特性化信息智能挑选系统首先挑选使用者信息,创建使用者兴趣知识库,然后根据使用者的操作行为进一步挑选特性化信息,并基于此更新使用者的兴趣知识。该系统基于其掌握的使用者信息,以便再次智能地在信息化的服务系统中屏蔽数字网络信息。