大数据人脸分析案例
大数据人脸分析案例,随着社会科技的不断发展,人工技能,人脸识别技术也不断普及到各个领域。人脸识别技术可以在大数据的环境下,极大发挥其强大的作用。下文分享有关大数据人脸分析的内容。
基于特征的方法和基于图像的方法
1、基于特征的方法
技术:基于特征的方法试图找到人脸的不变特征进行检测。其基本思想是基于人类视觉可以毫不费力地检测不同姿势和光照条件下的人脸的观察,因此必须有尽管存在这些变化的属性或特征是一致的。当前已经提出了广泛的方法来检测面部特征,然后推断面部的存在。
示例:边缘检测器通常会提取人脸特征,例如眼睛、鼻子、嘴巴、眉毛、肤色和发际线。基于提取的特征,建立统计模型来描述它们之间的关系并验证人脸在图像中的存在。
优点:易于实施,传统方法
缺点:基于特征的算法的一个主要问题是图像特征可能会由于光照、噪声和遮挡而严重损坏。此外,人脸的特征边界会被弱化,阴影会导致强边缘,这使得感知分组算法无用。
2、基于图像的方法
技术:基于图像的方法尝试从图像中的示例中学习模板。因此,基于外观的方法依靠机器学习和统计分析技术来找到“人脸”和“非人脸”图像的相关特征。学习的特征是以分布模型或判别函数的形式应用于人脸检测任务。
示例:基于图像的方法包括神经网络 (CNN)、支持向量机 (SVMi) 或 Adaboost。
优点:性能好,效率更高
缺点:难以实施。 为了计算效率和检测效率,通常需要降维。这意味着通过获得一组主要特征来考虑降低特征空间的维数,保留原始数据的有意义的属性。
人脸检测方法
已经引入了多种人脸检测技术。
1、开始阶段:人脸检测自 90 年代出现以来一直是一个具有挑战性的研究领域。
2000 年之前,尽管有很多研究,但直到 Viola 和 Jones 提出里程碑式的工作,人脸识别的实际性能还远不能令人满意。 从 Viola—Jones 的开创性工作(Viola and Jones 2004)开始,人脸检测取得了长足的进步。
Viola and Jones 开创性地使用 Haar 特征和 AdaBoost 来训练一个有希望的准确度和效率的人脸检测器(Viola and Jones 2004),这启发了之后有几种不同的方法。 然而,它有几个严重的缺点。首先,它的特征尺寸比较大。另外,它不能有效地处理非正面人脸和框外人脸。
2、早期阶段——机器学习:早期的方法主要集中在与计算机视觉领域的专家一起提取不同类型的手工特征,并训练有效的分类器以使用传统的机器学习算法进行检测。
这些方法的局限性在于它们通常需要计算机视觉专家来制作有效的特征,并且每个单独的组件都单独优化,使得整个检测流程往往不是最佳的。
为了解决第一个问题,人们付出了很多努力来提出更复杂的特征,如 HOG(定向梯度直方图)、SIFT(尺度不变特征变换)、sURF(加速鲁棒特征)和 ACF(聚合通道特征)。检测的鲁棒性,已经开发了针对不同视图或姿势分别训练的多个检测器的组合。然而,此类模型的训练和测试通常更耗时,并且检测性能的提升相对有限。3
3、最新技术 — 深度学习:近年来,使用深度学习方法,尤其是深度卷积神经网络 (CNN) 的人脸识别取得了显着进展,在各种计算机视觉任务中取得了显显著的成功。
与传统的计算机视觉方法相比,深度学习方法避免了手工设计的不足,并主导了许多著名的基准评估,例如 lmageNet大规模视觉识别挑战 (ILSVRC)。
最近,研究人员应用了 Faster R—CNN,这是最先进的通用对象检测器之一,并取得了可喜的成果。此外,CNN 级联、区域提议网络(RPN)和 Faster R—CNN 联合训练实现了端到端的优化,以及人脸检测基准,如 FDDB(人脸数据库)等。
主要挑战
人脸检测面临的困难是降低人脸识别准确率和检测率的原因。
这些挑战是复杂的背景、图像中的人脸过多、奇怪的表情、光照、分辨率较低、人脸遮挡、肤色、距离和方向等。
不寻常的面部表情:图像中的人脸可能会显示出意外或奇怪的面部表情。
照明度:某些图像部分可能具有非常高或非常低的照明度或阴影。
皮肤类型:检测不同人脸颜色的人脸检测具有挑战性,需要更广泛的训练图像多样性。
距离:如果到相机的距离太远,物体尺寸(人脸尺寸)可能太小。
朝向:人脸方向和相机的角度会影响人脸检测率。
复杂的背景: 场景中的大量对象会降低检测的准确性和速度。
一张图像中有很多人脸:一张包含大量人脸的图像对于准确检测率来说非常具有挑战性。
人脸遮挡:人脸可能会被眼镜、围巾、手、头发、帽子等物体部分遮挡,影响检测率。
低分辨率:低分辨率图像或图像噪声会对检测率产生负面影响。
人脸检测应用场景
人群监控:人脸检测用于检测经常光顾的公共或私人区域的人群。
人机交互: 多个基于人机交互的系统使用面部识别来检测人类的存在。
摄影:最近的一些数码相机使用面部检测进行自动对焦等等。
面部特征提取:可以从图像中提取鼻子、眼睛、嘴巴、肤色等面部特征。 、
性别分类: 通过人脸检测方法检测性别信息。
人脸识别:从数字图像或视频帧中识别和验证一个人。
营销:人脸检测对于营销、分析客户行为或定向广告变得越来越重要。
出勤:面部识别用于检测人类的出勤情况, 它通常与生物识别检测结合用于访问管理,如智能门禁。
2014年前后,随着大数据和深度学习的发展,神经网络备受瞩目,深度学习的出现使人脸识别技术取得了突破性进展。深度学习是机器学习的一种,其概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
区别于传统的浅层学习,深度学习的不同在于一方面通常有5层以上的'多层隐层节点,模型结构深度大;另一方面利用大数据来学习特征,明确了特征学习的重要性。
随着深度卷积神经网络和大规模数据集的最新发展,深度人脸识别取得了显著进展,基于深度学习的人脸识别技术可以通过网络自动学习人脸面部特征,从而提高人脸检测效率。
从人脸表达模型来看,可细分为2D人脸识别和3D人脸识别。基于2D的人脸识别通过2D摄像头拍摄平面成像,研究时间相对较长,在多个领域都有使用,但由于2D信息存在深度数据丢失的局限性,收集的信息有限,安全级别不够高,在实际应用中存在不足。
早在2019年,就有小学生手举照片“攻破”了快递柜的人脸识别系统。基于3D的人脸识别系统通过3D摄像头立体成像,由两个摄像头、一个红外线补光探头和一个可见光探头相互配合形成3D图像,能够准确分辨出照片、视频、面具等逼真的攻击手段。
根据使用摄像头成像原理,目前3D人脸识别主要有三种主流方案,分别是3D结构光方案(Structured Light)、时差测距技术3D方案(Time Of Flight,TOF)和双目立体成像方案(Stereo System)。基于3D结构光的人脸识别已在一些智能手机上实际应用,比如HUAWEI Mate 20 Pro、iPhone X。
2009年微软推出的Kinect(Xbox 360体感周边外设)则采用了TOF方式获取3D数据,颠覆了游戏的单一操作,为人机体感交互提供了有益探索。双目立体成像方案基于视差原理,通过多幅图像恢复物体的三维信息,由于对相机焦距、两个摄像头平面位置等要求较高,应用范围相对于3D结构光和TOF方案较窄。
除了能够准确识人,精准判断捕捉到的人脸是真实的也至关重要。活体检测技术能够在系统摄像头正确识别人脸的同时,验证用户是本人而不是照片、视频等常见攻击手段。目前活体检测分为三种,分别是配合式活体检测、静默活体检测和双目活体防伪检测。
其中,配合式活体检测最为常见,比如在银行“刷脸”办理业务、在手机端完成身份认证等应用场景,通常需要根据文字提示完成左看右看、点头、眨眨眼等动作,通过人脸关键点定位和人脸追踪等技术,验证用户是否为真实活体本人。
人脸与人体的其他生物特征(如指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。随着大数据和深度学习的不断发展,人脸识别效率显著提升,为远程办理业务的身份认证环节提供了可靠保障。
但与此同时,人脸信息保护、隐私安全等问题也应引起重视。随着《个人信息保护法》《数据安全法》及相关司法解释的出台,国家相关部门以及各种机构对个人信息安全问题的重视,有利于引导人脸识别技术的发展方向,为促进行业高质量发展、创造高品质数字生活提供有力支撑。
人脸识别的应用场景在大范围扩展:
金融领域:远程银行开户、身份核验、保险理赔和刷脸支付等。人脸识别技术的接入,能有效提高资金交易安全的保障,也提高了金融业务中的便捷性。
智慧安防领域则是为了视频结构化、人物检索、人脸布控、人群统计等软硬件一体形态产品提供基础支撑,重点应用于犯罪人员的识别追踪、失踪儿童寻找、反恐行动助力等场景。实现重点人员的识别及跟踪,在公安应用场景中达到事前预警、事中跟踪、事后快速处置的目的。
交通领域主要包括1:1人脸验证和1:N人脸辨识,目前利用人脸核验验证技术的刷脸安检已进入普遍应用阶段,在高铁站、普通火车站和机场皆已大面积推广。
而应用1:N人脸比对技术的刷脸支付主要落地在地铁公交等市内交通,这种技术能够极大提高通勤人员的出行效率,释放大量的人力资源,提升出行体验。同时,人脸识别可以对交通站点进行人流监测,根据人员出行规律预测人流高峰,提前做好疏导预案。
民生政务方面,人脸识别在政务系统的落地,提升了民众的办事效率,公民可以不用窗口排队,实现自助办事,节省了因人工效率低下产生的耗时。部分政务还可以通过在线人脸识别验证,在移动端线上办理,减轻了“办事来回跑、办事地点远、办事点分散”的困扰。
智能家居方面,主要应用在安全解锁和个性化家居服务两个场景。
在线教育领域则是通过人脸识别查验学员身份,避免一账号多个人使用,给网校造成损失,另一用途是帮助在线课堂老师了解学生学习状态,弥补网络授课相较于传统授课在师生交流环节上的不足。
商业领域,利用人脸识别功能实现各种极具创意的互动营销活动。
凡事都有两面。即便拥有以上优势,因人脸暴露度较高,相比对其他生物特征数据更容易实现被动采集,这也意味着人脸信息的数据更容易被窃取,不仅可能侵犯个人隐私,还会带来财产损失。大规模的数据库泄露还会对一个族群或国家带来安全风险。
在南方都市报个人信息保护研究中心发布的《人脸识别应用公众调研报告(2020)》中,其对两万份调研报告进行统计,问卷中就“便捷性”与“安全性”设置了量表题,请受访者分别依据前述10大类场景中的使用感受进行打分。
1分为最低分,5分为最高分。结果显示,在安全性感受方面,受访者给出的分数则明显偏低,体现出他们对安全风险的忧虑态度。