大数据时代是信息爆炸产生海量数据的时代,随着对数据的研究、分析,从人们的生产方式、生产工具到行为习惯、思维惯性发生全方位的影响,进而延伸到经济产业、社会事业乃至整个经济基础和上层建筑。数据的迅速膨胀并变大,决定着社会的未来发展,由于大数据的开发性和复杂性,在大数据环境中频繁出现不可预测的攻击行为,导致产生错误数据,而且大数据导致的隐私泄露给用户带来了严重危害。本文选取作为一个数据比较集成的典型性社会场所——图书馆,探讨大数据时代图书馆数据安全体系构建。
随着大数据时代的来临,图书馆分析读者行为、感知读者需求、满足读者爱好,为读者提供个性化、贴心化服务的能力更加强化。正是因为大数据依赖数据,就容易招致不可预测的攻击行为,对数据分析结果带来重大影响,而且大数据泄露带来的隐私泄露给用户带来了严重危害。特别是计算机应用的不断普及和网络的迅速发展,计算机病毒的传播速度变得越来越快,病毒导致的破坏也越来越大。计算机病毒以及黑客行为,使得整个系统遭受严重威胁。因此,利用大数据技术构建智能、自动、主动和互联的安全防御系统,不断增强图书馆数据安全,是保证大数据时代图书馆系统运营安全的关键。
一、大数据时代图书馆面临的安全问题
大数据时代,图书馆的安全问题,主要是数据安全问题面对传统攻击与现代隐患交相冲击,既有固有的计算机病毒以及无意识攻击导致数据崩溃、服务平台不能正常运营的问题,又有因为现代大数据下,黑客们对用户隐私窃取导致读者个人身份以及自身机密的泄露问题。
1、传统网络环境下的病毒攻击。无论是前大数据时代,还是后大数据时代,计算机病毒始终伴随着互联网时代。计算机病毒传播快、扩散面大,特别是网络环境下计算机的互连共享,全球扁平化使得连接在一起的计算机数量更多,只要计算机病毒入侵到网络中的任何一点,它将以很快的速度在网络中传播,并波及到整个网络。正如矛与盾互进,时代发展,计算机病毒破坏性更强。特别是由于网络中资源信息多,并且多为网络用户所共享,因此病毒在网络中一旦被激发,不仅严重威胁网络资源的安全,而且还可能导致整个系统的瘫痪,带来无法估量的损失。再次就是计算机病毒的杀毒难度越来越大。在网络环境中,很难对分布于异地的大量工作站和服务器同时进行病毒清除,即使对网络中的绝大多数计算机进行了病毒清除工作,只要网络中有一台计算机被感染,病毒也会很快波及整个网络。
2、大数据环境下的数据隐患。以完善数据提供精准化服务的图书馆服务平台,具有先天的开放性,由开放性引申出数据安全的复杂性。首先是读者服务需求的增长和用户服务模式变革,图书馆基础设施的服务效率与运营安全难以达到优化均衡。其次是云计算、大数据处理、传感器技术和用户服务网络具有极强的开放性,增强了黑客攻击的成功率。再次是大数据改变了图书馆在传统的安全需求和模式,大数据服务平台系统容易招致攻击。
3、图书馆自身特性引发的内在冲突。图书馆采用大数据进行定制化个性化服务,一方面需要对用户数据进行大量采集、分析、比对和定制服务,而这些服务需要更真实、更准确的用户数据,往往还是第一手数据;另一方面,与用户主要是读者相关的数据,又往往涉及到读者个人隐私。这种隐私的保密性与用户数据的公开性,特别是准确性存在着天然的矛盾。在图书馆不能完全保证数据安全的情况下,用户的隐私就会被泄露。这就需要图书馆依靠云计算技术的支持,通过对数据信息的风险评估,进而加大对安全数据的分析与决策,确保图书馆数据安全管理。
二、大数据时代图书馆安全体系构建
1、加强系统硬件设备安全。这是最基础的安全维护,也是图书馆安全体系的重要基石。它主要由整体馆内环境、所有系统硬件设备(包括计算机及其内部所有硬件)以及数据安全传输三部分组成。在这个基础层,必须安装最新的操作系统,配备最切合图书馆需要的硬件设备,及时安装病毒软件,及时升级操作系统,确保能够避免常规的网络病毒袭击,以及一些无意识的数据攻击。要在内网和外网上安装防火墙,实现内部网络与互联网之间隔离,限制网络互访来保护内部网络。其它还有诸如员工培训、共同防毒、控制超级用户等,都要系统配套,确保图书馆安全体系及时避免传统的非恶意性攻击和一般的网络病毒冲击。
2、加强数据资源安全管理。这是图书馆安全体系的实体仓库,包含两方面内容:一是数据采集运行时的储存和保管,通过安全管理和控制,实现对图书馆大数据资源的安全采集、过滤、价值提取和存储。要及时备份,实现多个节点的数据备份,确保当某一节点发生安全事件时,不会丢失数据。二是加强读者的隐私保护。采集数据时应以读者的阅读需求为依据,不采集与此无关的数据。对所采集数据进行隐私保护处理,特别是读者社会关系、家庭住址和个人隐私行为等数据,要进行保护处理。要依据隐私数据的特点,设定不同的安全等级,采取相应的安全管理。
3、加强数据的分析应对。要加强大数据的应用,尤其是用大数据对攻击行为、攻击模式的分析与研究。安全管理员通过风险预测、威胁检测、危害评估和智能应对等技术,对发生在图书馆系统内的各类安全事件,包括事件发生的区域、类型、程度、对象、频次等,进行系统分析,制定相应的应急性预案,有效的应对各类攻击
4、加强数据的有效筛选。大数据是信息爆炸产生的海量数据,图书馆作为人流频繁的平台,每天都要产生大量的数据。对这些数据的分析研究和智能应对,必须去芜取精,不断提升数据的有效性。安全系统管理人员要根据平台系统要求,通过对各类数据的过滤、清洗、删减、分析、归类,完成对大数据资源的评估与优化
5、加强系统平台安全管理。大数据时代的图书馆,是一个多功能、多样化、多个体的平台集成。它包含两个方面:一是单一系统内自身平台的安全管理,主要指某一个图书馆内部不同的安全管理系统和各类应用软件,必须具有良好的兼容性和扩展性,实现内部自身的安全管理。另一方面是图书馆大数据的开发性,与其它图书馆,包括互联网上平台的合作交流和数据共享。系统平台管理必须构建基于云计算为主体的安全管理,通过云服务平台保证各类数据的安全、完整、保密和可用。
大数据时代的来临,为图书馆给读者提供个性化服务提供了重要载体,搭建了有效平台。但同时基于数据分析产生的各类服务,对图书馆在数据采集、行为分析、硬件扩容、软件升级和人员技术提出了更高的要求。尤其是建立在数据基础上的采集,对数据的安全性提出了更高的要求,必须从各个方面加强安全管理。大数据时代图书馆的安全体系建设,应该在高效、透明、公开的基础上,更加可控、可管、有保障,才能为读者提供更好更贴心的阅读体验。
作者:郑智勇 来源:留学生·下旬刊 2016年1期