大数据时代的数据具有容量大和虚拟化存储的特点,如何从动辄PB级的数据中取出并固定证据将是大数据时代电子取证需要解决的问题。目前智能移动、网络通信、云存储等技术得到了广泛的应用,这些技术的应用也对传统的电子取证技术提出了更高的要求。面对大数据时代的各类新型网络犯罪,在采用传统电子取证技术的同时,有效地将数据挖掘、3D人脸识别、云计算等技术手段运用到电子取证之中,并对取证数据加以保护,将是未来电子取证技术发展的方向。
1 大数据的发展
大数据“Big Data”,是爆红速度仅次于云计算的科技新名词,当下云计算虽然还是很热门的话题,但更热门的是大数据。从大数据Big Data和云计算Cloud Computing在Google上的搜索趋势(100代表最大搜索量)上看,对大数据的关注已经逐步超过了云计算。在 2010年,大数据产业价值为 32亿美元。在 2015年,这一产业的预估价值为169亿美元。
大数据分析指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的分析和预测方法。大数据具有3V的特点:Volume(大量)、Velocity(高速)和Variety(多样),有人认为大数据还具有Veracity(真实)的特点。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。大数据(Big data)通常用来形容一个群体创造的大量非结构化数据和半结构化数据,必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
2 大数据时代电子取证技术的发展
电子数据取证,是使用软件和工具,按照一些预先定义的程序全面的检查计算机系统,以提取和保护有关犯罪的证据。电子数据鉴定就是对涉案存储介质进行特殊形式的痕检,提起出案情相关的内容。电子取证的难点在于硬盘容量大、介质数据多、移动重点应用个性化、违法活动手段日趋多元化,更隐蔽,犯罪嫌疑人防范意识更强。
置身于大数据时代,网络和通信系统的发达在给人们生活带来便利的同时,也为各类犯罪提供了新型工具,这对新形势下的侦查工作提出了更高的要求。检察机关不能再固守过去“一张嘴、一支笔”的传统侦查方式和“由供到证”的办案模式,而是要紧跟时代发展的步伐,转变侦查方式,探索运用电子数据引导案件侦查,并以此作为侦查工作的突破口。
3 应用新技术推动电子取证发展
3.1 对智能移动设备的电子取证技术
由于智能移动设备具有易携带、能联网、操作方便等特性,多数人会使用这一类设备进行网络活动、社交活动、文件流转、信息传递和金融活动等。
智能移动设备性能强大,堪比一台笔记本电脑,目前已经有人在手机上安装电脑操作系统,因此,未来的移动智能设备上会留有越来越多的电子证据,电子取证技术会针对庞大的智能移动设备发展。
3.2 网络实时数据流电子取证技术
信息化时代,人类社会活动已经离不开网络,大数据时代更是如此,互联网和移动互联网是企业和个人工作和交换信息的主要载体。犯罪嫌疑人可以在数据交换完成后轻易的把作案工具(电脑、手机、u盘等)或者其中的数据销毁,电子证据随之销毁。网络实时数据流电子取证技术是对犯罪嫌疑人使用的设备进行锁定,在犯罪活动实施的同时截获有效信息,就能够获取真实有效的电子证据。
3.3 视频电子取证技术
传统的视频电子取证技术,是将视频资料(如监控录像、音像资料等)复制到专业设备播放,办案人员通过观看录像的方式寻找与案情有关的线索,费时费力,容易漏掉细节。因此,在大数据时代,用“人”观察数据的方式会被替代,将会产生新的技术来处理这些海量资料。
目前比较成熟的车牌识别系统应用在交通安全领域,未来对“人”的识别技术将会大幅提升。目前一些3D人脸识别技术运用到大数据的电子取证中,能够通过技术手段锁定海量监控视频中犯罪嫌疑人的个人特征,然后使用犯罪嫌疑人的个人特征,由计算机在各个视频录像中出现的人脸面部特征进行比对,找出犯罪嫌疑人出现的时间、地点,然后按时间和空间形成活动轨迹和证据链,同时从大量视频中提取相关的重要信息点。
3.4 虚拟云平台的电子取证技术
“云”是在大数据之前在互联网迅速走红的科技新名词,各种云服务、云计算和云业务正在全面铺开,以IBM、阿里巴巴、百度等为首的IT巨头已经把现有的网络系统逐渐向虚拟云平台转移,并且对外提供虚拟云主机租用服务。往后,绝大多数政府机关、金融机构、大小企业都会使用云服务,大量的电子信息将会在虚拟云平台上存储和传输。传统的电子取证是针对常规存储介质和物理主机的,未来的电子取证技术将会向云存储和云主机发展。
3.5 云平台下大数据的固定技术
尽管“数据”的威力惊人,但作为证据种类的一种,电子证据也和传统证据一样,是否具有法律效力,取决于其是否满足客观性、关联性和合法性的证据三大性质。要保证电子证据的客观真实性,不被任意篡改或破坏,取证和固定证据工作就异常重要。因此,电子数据的采集和使用必须要有专业的设备、严格的工作程序和制度。
现有的电子数据采集装置无法适应大数据时代的电子取证需求。大数据的电子数据采集装置肯定不是以单机的形式出现,因为大数据时代的电子数据动辄以几十TB甚至PB级别来产生,而且可能来自很多个不同的设备比如手机、电脑、商业服务器,或者来自于不同的地域的分布式系统,因此未来的电子数据采集装置,必须是分布式的、虚拟化的大型系统。更进一步,不同的大型系统之间能够相互访问,通过电子数据检材特征值做到异地互备和去冗余化。