首页

> 期刊论文知识库

首页 期刊论文知识库 问题

于仕琪人脸检测论文

发布时间:

于仕琪人脸检测论文

在我国经济组成中,汽车产业对促进国民经济发展和社会进步具有重要的战略意义。下面是我为大家精心推荐的关于汽车的科技3000字论文,希望能对大家有所帮助。汽车的科技3000字论文篇一:《试谈汽车超载监测系统》 摘 要: 为了实时识别各种车型的超载车辆,该系统基于开源计算机视觉库(OpenCV),先根据车辆照片库建立车型分类器,然后使用数字摄像机拍摄进入监控区域的车辆,在视频中使用分类器识别车型,根据所识别得到的车型去查询数据库获得该车型的核载,再通过动态称重技术获得车辆的实际载重,及时判别车辆是否超载。此 方法 可避免过去使用统一重量衡量不同车型是否超载的弊端,并可同时免线圈测量车速。测试结果表明系统能快速准确地识别出车型。配合动态称重系统,就能实时得出所通过的车辆是否超载,对公路养护和道路交通安全有相当大的实用意义。 关键词: 超载监测; 视频识别; OpenCV; 动态称重 超载车辆的危害很大,主要表现在加速道路损坏和危害道路交通安全,人们都深知其危害性,所以治理超载一直是公路监管部门的工作重点。传统的自动超载信息系统都是使用统一标准,对所有车辆都应用同一个整车重量划分是否超载,这样会遗漏部分实际上已经超过该车型核载的超载车辆。实际上,这部分车辆对道路交通同样造成严重影响。鉴于此,本系统首先识别出车辆的车型,再查询得到该车型的核载重量,对比实测重量,便得知是否超载。理论上能够适用于所有车型。 利用摄像机较长的视域,附加设计了一个测速系统,能方便地得出超速数据,以便作为超速监测和供给动态称重系统作参考。 1 系统构成 系统方案 系统主要工作过程为:车辆驶入摄像机监视范围,视频流通过以太网传输到后台处理系统,处理系统通过处理视频识别出车辆的车型,然后根据车型从数据库中查出相应的核载重量;同时,安装在地面的动态称重设备测出车辆的实际载重。两个数据对比即可得出车辆是否超载。系统流程如图1所示。 为了加快处理速率,在程序设计过程中多处使用了多线程并行处理。 OpenCV及其分类器介绍 传统的图像处理软件大多为Matlab,用于开发算法最为快捷,但是其处理速度慢,难以跟上视频处理的需求,所以选用了Intel牵头开发的开源计算机视觉库(OpenCV)。新版的OpenCV已经在易用性上已经接近Matlab,再加上其开源性,很多算法均已公开,加快了开发进程。另外,目前OpenCV已经提供C,C++,Python等语言接口,且支持Windows,Linux,Android和IOS等主流平台,资源相当丰富。对于计算机平台,OpenCV支持多线程并行计算和图形处理器(GPU)计算,这将能大大加快计算速率,用其开发本系统的demo是首选。 图1 系统流程图 为了从视频流中识别出车型,需要使用分类器[1]。所谓分类器,是利用样本的特征进行训练,得到一个级联分类器。分类器训练完成后,就可以应用于目标检测。分类器的级联是指最终的分类器是有几个简单分类器级联组成。每个特定的分类器所使用的特征用形状、感兴趣区域中的位置以及比例系数来定义(如图2所示)。 图2 特征分类 首先使用弱分类器分出货车和客车等车型,然后再分出大中小型货车,最后再精确分类,获得准确的车型。新版本的OpenCV已经支持多种特征的分类器,如SVM,LBP,PBM等。因为系统实时性要求较高,这里选取训练和分类速率都较高的LBP特征分类器。 训练分类器 使用分类器的需要首先训练,即让分类器“认识”目标,为了训练分类器,需要准备样本,样本包括正样本和负样本。正样本即包含目标的灰度图片,而且每张图片都要归一化大小,负样本则不要求归一化,只需要比正样本大即可(使得可以在负样本中滑动窗口检索)。 OpenCV提供了专门的工具用以整理训练样本的原始数据,只需准备好正、负样本,归一化然后转成灰度图,再使用两个描述文件分别记录这些样本集合,然后输入程序即可整理出原始数据。为了准备正样本,借助OpenCV提供的HighGUI模块,在此专门编写了一个GUI截图工具,界面如图3所示。为了能从不同角度识别车辆,准本正样本时需要准备从一定角度范围描述车辆的样本。 图3 GUI截图工具界面 接下来就是训练分类器,这部分工作直接关系到系统的鲁棒性。同样,OpenCV提供了专门工具训练分类器,既有旧版也有新版,为了有更多特性,在此选择新版本的训练程序。 由于这是基于统计的方法,要对大量数据进行处理,如果选择Haar特性,训练周期会比较长,不利于系统的搭建,所以选择用LBP特性训练分类器。从机器性能方面考虑训练时间,使用英特尔线程构建模块(TBB)重新编译OpenCV,就能得到多核加速,且有利于接下来的程序性能。分类器分为三级,分别为:货车、客车分类器,大、中、小型货车分类器和具体车型分类器。由于客车按载客数区分是否超载,车辆总重不会对公路造成严重损坏,所以本系统无需对客车作出具体车型区分。但若然具体管理部门需要统计车型信息,可以进一步加上客车车型分类器。实际使用时,由于要应对车辆车身的喷漆变化或者小范围合法改装等情况,分类器的分类除了在系统筹建的时候大规模训练外,在系统运行时也应继续训练分类器,增加统计数据,使得识别结果更加精确。 识别车型及获得核定载重 训练好分类器后,最直观的测试方法是直接输入测试视频,检查识别效果。新版本OpenCV提供一个C++类CascadeClassifier,该类封装了基本的目标识别操作,使得只需要使用该类的实例加载训练好的XML文件,然后逐帧检测即可。若发现目标,结果将会存放在C++标准模板库(STL)容器vector中。但直接对每帧图像使用CascadeClassifier::detectMultiScale方法将会大大加重系统的工作量并且在多车辆的情况下无法区分开各车辆,为此,首先需要发现车辆,然后区分不同的车辆目标,再对每一个目标单独进行分类识别。 具体的主要操作的顺序为: (1) 系列的图像预处理操作,降低图像噪音。 (2) 图像差分,发现车辆轮廓[2],得到运动掩码。图像差分有两种主要方式,分别是帧间差分和背景差分。帧间差分速度快,但容易产生空洞,且无法分离出缓慢运动的车辆;背景差分速度慢,但分离效果好。考虑到如果车辆是缓慢进入测速区,则称重数据可靠性高,而且没有超速,进入识别点的效果好,所以选择帧间差分,这里使用能有效减小前景空洞的三帧差分算法[2]。 (3) 结合运动掩码更新历史运动图像、计算历史运动图像的梯度。 (4) 分割运动目标,得到一辆一辆的车,并跟踪。为区分开图像中的每一辆车,需要对其进行标记,这里使用的方法为: [Mkx,y=ID ifMk-1x,y≠0&k-1≠10 ifMk-1x,y=0 ] 式中:Mk(x,y)为分割出来的单独车辆目标的第k帧感兴趣区域矩形。这种方法虽然鲁棒性较好,但是因为重复计算量大,运算速度有限,所以在确定每辆车的ID后,使用OpenCV提供的更为快速的Camshift算法[3]继续跟踪。 (5) 计算每辆车的运动方向。这部分关系到运动目标筛选,在部分场合,摄像机的视野可能会涉及逆向车道。在这种情况下,可以通过筛选符合主要行驶方向的车辆来排除其他车辆或无关运动目标的干扰。 (6) 车辆进入测速区,开始测速。 (7) 车辆离开测速区,结束测速并计算速度。使用TBB进行并行分类识别车型。由于OpenCV新版矩阵结构Mat的所有操作使用原子操作,大大减轻了多线程编程的工作量,所以这里使用多线程并行操作是最佳选择。 (8) 根据所安装动态称重系统的车速要求,判断是否需要引导车辆到检测站进行检查。 获得实际载重 在视频分析中发现车辆后,对比动态测重模块中测得的实际载重。这里需要把应用场合分为两种情况:高速测重和低速测重,至于高低速的阀值,这根据不同动态称重系统的性能而定[4],在系统安装时根据动态称重系统参数设置即可。由于目前高速测重技术的精度未达到作为证据的要求,所以在高速测重的场合,所得车重数据只能作为初步判断,若初步发现车辆超载,需要进一步引导车辆到大型地磅再次静态测量,并作其他处理。在低速测重场合,测得的动态数据可靠,可直接作为证据使用。所以系统的运行需要测速模块的配合。 无论高速场合与低速场合,本系统都能实现视频测速功能,可以直接用作超速抓拍系统,降低了公路部门的重复投入成本。 测速方法 测速测量车辆通过测速区所用的时间,然后用测速区长度除以时间而粗略估计得到。考虑到摄像机视域限制,设定的测速区域并不长,只有20 m左右,而且速度是用于参考载重信息是否有效的,所以无需太精确,因而可认为车辆是直线经过测速区域的。测速区的长度需在系统安装时手工进行长度映射。另外,确定通过测速区域的时间差使用帧率和帧计数得出,这样在多线程处理的情况下,可以排除系统时钟和处理速率的干扰,得出准确时间差。 2 测量结果 为快速测试系统性能,直接使用测试视频替代摄像机输入。使用微软Visual Studio 2010 MFC + OpenCV 编写一个即时处理程序,界面如图4所示。 图4 运行在Windows平台上的系统 测试使用一台Intel Core i5M处理器(主频 GHz+智能变频技术)、6 GB内存、 操作系统 为Windows 7 64 b的普通 笔记本 计算机,测试代码尚未使用图形处理器(GPU)计算,但代码在识别部分应用了TBB进行多核并行加速计算。 测试视频共两段,分别在两个不同的场景拍摄,第一段只有一辆公交车,场景较为简单;第二段则是多车多人环境,并且有车辆并行的情况,场景较为复杂,干扰较多。 第一段视频主要用于测试系统的极限性能,在测试开始前,先用转码工具把同一段视频转成不同帧率和分辨率的几段视频,其中视频的宽高比不变。输入视频测试后的结果如表1所示。 视频原始长度为6 s,双斜线为该场景的称重和测速区域。 测试结果表明:系统能实时处理标清视频流,但对高清视频还需进一步优化。 第二段视频主要测试系统的车型识别能力,测试数据如图5所示。 表1 输入视频测试后结果 图5 多车并行时能够准确区分 第二段视频夹杂较多无关目标,如行人、抖动的树枝横向行驶的车辆等,其中双白线之间区域为本场景的称重测速区域。 通过测试,可以看出无关目标能被全部排除,体现了车辆筛选很好的鲁棒性。视频中共通过9辆汽车,所有车辆均本正确识别车型。 3 结 语 通过测试数据可以看出,本系统提出的车型识别算法能适应不同场景和一定的环境变化,具有较高的效率和鲁棒性。随着计算机及其他数字信号处理(DSP)设备的信息处理能力不断提高,应用实时视频处理技术促进智能交通的能力将更大更稳定。若本系统能真正应用在智能交通系统上,有望对遏制道路超载超速现象做出贡献。 参考文献 [1] LIENHART Rainer, MAYDT Jochen. An extended set of Haar?like features for rapid object detection [J]. IEEE ICIP, 2002 (1): 900?903. [2] 徐卫星,王兰英,李秀娟.一种基于OpenCV实现的三帧差分运动目标检测算法研究[J].计算机与数字工程,2011(11):141?144. [3] BRADSKI G R. Computer vision face tracking for use in a perceptual user interface [EB/OL]. [2010?12?02]. [4] 张波,鲁新光,邓铁六,等.动态车辆称重物理模型与提高动态称重准确度研究[J].计量学报,2009(5):426?430. [5] 唐双发.基于OpenCV的车辆视频检测技术研究[D].武汉:华中科技大学,2009. [6] 詹群峰.基于OpenCV的视频道路车辆检测与跟踪[D].厦门:厦门大学,2009. [7] 郭旭,张丽杰.运动目标检测视频监控软件的设计与实现[J]. 计算机技术与发展,2010,20(8):200?207. [8] 周品,李晓东.Matlab数字图像处理[M].北京:清华大学出版社,2012. [9] 陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008. [10] 刘瑞祯,于仕琪.OpenCV教程基础篇[M].北京:北京航空航天大学出版社,2007. [11] 范伊红,彭海云,张元.基于SVM 的车型识别系统的设计与实现[J].微计算机信息,2007,23(5):296?297. [12] 李庆忠,陈显华,王立红.一种视频运动目标的检测与识别方法[J].模式识别与人工智能,2006,19(2):238?243. [13] [美]REINDERS J, 聂雪军. Intel Threading Building Blocks编程指南[M].北京:机械工业出版社,2009. [14] 刘慧英,王小波.基于OpenCV的车辆轮廓检测[J].科学技术与工程,2010,10(12):2987?2991. 汽车的科技3000字论文篇二:《试谈现代科技在汽车焊接工艺中的应用》 摘 要:随着我国汽车保有量的不断增加,汽车售后市场呈现了井喷式的发展趋势,与汽车相关的售后市场服务行业开始兴起。其中汽车维修是后市场比较火爆的行业,汽车的使用必然会涉及汽车的维修。因此,为了能够更好的实现汽车维修效率,提高汽车维修的质量,应该加强对于汽车维修行业的行业监管以及对汽车维修技术的提升。目前,诸多的现代化技术开始不断的应用到汽车维修之中,其中尤其以焊接工艺为主。因此,本文重点对汽车焊接工艺中现代科技的应用进行分析,从而探讨其未来的发展趋势。 关键词:现代科技;汽车;焊接技术;工艺 引言 汽车加工与制造以及汽车维修领域,都会涉及汽车的焊接技术。目前,随着技术的不断发展,尤其是汽车生产制造业的蓬勃发展,已经可以实现汽车车身以及车辆配件的无缝焊接技术。车身的加工甚至采用模具化加工的形式,从而减少了因为焊接造成的不足。因此,目前,焊接工艺在汽车后市场应用比较广泛,尤其是在汽车的维修市场中,当汽车出现事故的时候,就会采用焊接技术进行维修,从而让汽车能够保证正常的使用。此外,在汽车的加装方面,焊接技术更加的适用,并且通过引进先进的现代科技,从而让焊接效果与质量都更加完善。 一、汽车焊接工艺的应用领域分析 在汽车领域中,由于越来越多的高新技术被应用,是的汽车生活更加丰富。对于我国而言,随着汽车保有量的不断增加,汽车售后市场出现了井喷的状态。在汽车售后市场中,汽车的维修与保养占据着非常重要的地位,也让汽车的服务产业有了较大的发展。对于汽车的焊接工艺而言,最早是应用于汽车的车身焊接。但是,随着技术的发展以及车身制造工艺的发展,汽车车身开始使用模具制作,从而降低了因为焊接而造成的车身问题。那么,下面就对现代化的汽车的焊接工艺主要应用领域进行分析: 1、在汽车的维修领域中有非常广泛的应用;汽车维修属于汽车售后市场领域,由于汽车驾驶的过程中,难免会出现碰撞的现象,从而造成了汽车车身或者是相关配件的损坏。因此,在这种情况下,就可以使用汽车的焊接工艺,将损坏的部分采用焊接的方式,从而进行汽车的维修工艺。 2、人们对于汽车的装饰和改装越来越感兴趣。虽然在汽车检测的过程中,对于擅自改装会进行处罚,但是有车一族们仍然热衷于对于汽车的改装和装饰。其中,对于汽车尾翼的安装非常常见。汽车安装尾翼以后,就显得非常运动动感,有一种非常霸气的感觉。因此,为了让汽车的外观更加个性鲜明,需要对汽车的外观进行相关的改装,从而实现车主所需要的效果。而对于尾翼的加装而言,就一定要采用焊接技术,从而使得汽车的尾翼牢固坚实。因为安装尾翼还是存在一定的风险的,当车速达到一定程度的时候,就需要保证汽车的尾翼的稳定性。 3、对于汽车的车身配件的焊接工艺;汽车在使用的过程中,经常需要在配件方面进行焊接,此外对于在配件之间的结合方面,也需要在适当的情况下使用汽车焊接技术。因此,对于汽车的焊接工艺而言,主要在车身焊接、汽车改装以及汽车配件之间主要进行应用。 二、现代科技在汽车焊接工艺中的应用 随着现代科技的不断发展,汽车焊接工艺中也不断的引入了现代的科技技术。其中最为重要的就是计算机技术,计算机的单片机远程通信技术以及3Dmax等技术开焊接始不断应用到汽车的焊接工艺中。由于人工焊接技术容易在焊接的过程中出现失误,无法实现循迹操作,从而造成焊接的不完美。因此,采用计算机单片机技术,可以进行程序编译,将需要焊接的部分利用3Dma x的进 行仿真,从而保证在焊接的过程中,其能够实现完美的循迹焊接,降低了焊接过程中出现的失误。 此外,在焊接的工艺方面,又引入了一些工艺以及化工技术。传统的高温焊接技术,不仅仅容易造成伤害,更是对操作人员有一定的影响。因此,使用现在的氩弧焊焊接技术,虽然温度更高,但是焊接的质量有所提高。对于焊接的接口以及焊面的平整度,都有了显著的提高。因此,随着现代科技的不断发展,促进了多个行业工艺的提升。对于汽车的焊接工艺而言,引入计算机技术并且实现真正的智能化以及自动化焊接,从而让焊接工艺更加安全方便,有效的提升焊接的效率,保证在焊接的过程中,达到质量的提升以及客户的满意提升。总之,要充分适应时代的发展,让更多的现代科技不断的应用到汽车的焊接工艺之中,从而保证其在不断的发展过程中,符合现有时代的发展理念,满足客户不断提升的硬性要求,实现现代化的汽车焊接工艺。 三、机器人焊接工艺是现代汽车焊接技术的发展前景 汽车焊接最主要的是车身的焊接。在汽车制造公司车身的主要焊接方法为弧焊、点焊、二氧化碳保护焊等。随着社会的发展,人民生活水平的提高,用户个性化需求的日益强烈,对汽车的安全性、美观性与舒适性的要求越来越高,同时汽车制造企业为了追求更大的经济效益,对焊接精度、焊接质量和焊接速度等的要求越来越高,因此建立一条现代化的生产流水线就显得非常重要。而焊接机器人的应用促进了现代化流水线的建立。现代化的焊接流水线主要是满足多车型、多批次的市场需求,提高车身车间生产能力的柔性和弹性。因此现代焊接线必须具有柔性。那么如何才能使焊接线具有柔性呢?普通的焊接线是刚性的,主要由焊接夹具、悬挂点焊机、弧焊机和多点焊机等组成。 这种焊接线一般只能焊接一种车型的车身,那么为了满足市场多元化的需求,就需要重新建立焊接流水线。这对企业来说是非常不利的,企业是追求利润为目的的,并且重新建立流水线造成了财力、人力、物力的浪费。于是建立柔性化焊接生产线摆在了企业面前。机器人的出现与应用满足了汽车企业的现代化的需求,实现了焊接生产线的柔性化。那么在车身焊接线上应用的机器人主要有几种:点焊机器人、弧焊机器人和激光焊机器人。这些机器人的应用,使焊接实现了机器人代替工人工作。 1、点焊机器人:主要进行的是点焊作业,在点与点之间移位时速度比较快,从而减少了移位的时间,通过平稳的动作、长时间的重复工作和准确的定位,取代了笨重、单调、重复的体力劳动,更好地保证了焊点质量,使工作效率得到了很大的提高。它是柔性自动生产系统的重要组成部分,增强了企业应变能力。 2、弧焊机器人:弧焊过程比点焊过程要复杂得多,对焊丝端头的运动轨迹、焊枪姿态、焊接参数都要求精确控制。具有较高的抗干扰能力和高的可靠性。能实现连续轨迹控制,并可以利用直线插补和圆弧插补功能焊接由直线及圆弧所组成的空间焊缝,还应具备不同摆动样式的软件功能,供编程时选用,以便作摆动焊,而且摆动在每一周期中的停顿点处,机器人也应自动停止向前运动,以满足工艺要求。此外,还应有接触寻位、自动寻找焊缝起点位置、电弧跟踪及自动再引弧功能等。 3、激光焊接机器人:激光焊接是与传统焊接本质不同的一种焊接方法,是将两块钢板的分子进行了重新组合,使两块钢板融为了一体变为一块钢板,从而提升了车身结构强度。同时在焊接过程中焊接工件变形非常小,一点连接间隙都没有,焊接深度/宽度比高,焊接质量高。从而提升了车身的结合精度。可见机器人的应用,实现了焊接流水线的智能化,实现了焊接生产线的自动化与现代化。 结束语 汽车维修行业中的汽车焊接行业,其技术要求相对较高,并且直接影响着汽车的维修效果。焊接技术,一般是针对出现重大事故或者是问题车辆等进行焊接。为了让焊接的痕迹最小化,实际上就是为了能够更好的实现高精度焊接,需要不断引入现代科技技术。计算机技术的引入,让焊接工艺能够以一种循迹的方式进行,从而避免了焊接过程中出现的认为失误。此外,在汽车的生产以及制造的过程中,依然需要不断的引入高新科学技术,让焊接工艺更加精湛,从而实现汽车的高精度和高密度,实现汽车质量的全面提升。 参考文献 [1]刘鸣斌.煤层气发动机爆震的检测与控制[J].内燃机与动力装置,2011(02):45-46. [2]吴扬帆.汽油发动机爆震分析与控制[J].传动技术,2010(13):36-38. [3]高玉明.点燃式发动机临界爆震控制及其特性[J].吉林大学学报,2012(14):77-79. >>>下一页更多精彩的“汽

人脸检测毕业论文

之前也是为论文苦恼了半天,网上的范文和能搜到的资料,大都不全面,一般能有个正文就不错了,而且抄袭的东西肯定不行的,关键是没有数据和分析部分,我好不容易搞出来一篇,结果还过不了审。 还好后来找到文方网,直接让专业人士帮忙,效率很高,核心的部分帮我搞定了,也给了很多参考文献资料。哎,专业的事还是要找专业的人来做啊,建议有问题参考下文方网吧 下面是之前文方网王老师发给我的题目,分享给大家: 基于深度学习的无人机地面小目标算法研究 基于视觉的智能汽车面向前方车辆的运动轨迹预测技术研究 模拟射击训练弹着点检测定位技术研究 基于深度卷积神经网络的空中目标识别算法的研究 基于可见光图像的飞行器多目标识别及位置估计 无人驾驶车辆手势指令识别研究与实现 车载毫米波雷达目标检测技术研究 基于多传感融合的四足机器人建图方法 中老年人群跌倒风险评估的数据采集系统 基于深度学习的视觉SLAM闭环检测方法研究 真实图片比较视觉搜索任务的年龄效应及对策研究 室内复杂场景下的视觉SLAM系统构建与研究 基于双目内窥镜的软组织图像三维重建 学习资源画面色彩表征影响学习注意的研究 毫米波雷达与机器视觉双模探测关键技术的研究 语义地图及其关键技术研究 多重影响因素下的语音识别系统研究 基于卷积神经网络的自主空中加油识别测量技术研究 基于视觉语义的深度估计、实例分割与重建 重复视觉危险刺激——本能恐惧反应的“二态型”调控机制研究 低成本视觉下的三维物体识别与位姿估计 面向非规则目标的3D视觉引导抓取方法及系统研究 基于物体识别地理配准的跨视频行人检测定位技术研究 基于结构光的非刚体目标快速三维重建关键技术研究 基于机器视觉的动物交互行为与认知状态分析系统 关于单目视觉实时定位与建图中的优化算法研究 动态场景下无人机SLAM在智慧城市中的关键技术研究 面向视觉SLAM的联合特征匹配和跟踪算法研究 基于深度学习的显著物体检测 基于平面波的三维超声成像方法与灵长类动物脑成像应用研究 基于物体检测和地理匹配的室内融合定位技术研究 基于多模态信息融合的人体动作识别方法研究 基于视觉惯性里程计的SLAM系统研究 基于语义信息的图像/点云配准与三维重建 基于种子点选取的点云分割算法研究 基于深度学习的场景文字检测与识别方法研究 基于运动上下文信息学习的室内视频烟雾预警算法研究 基于深度学习的垃圾分类系统设计与实现 面向手机部件的目标区域检测算法的设计与实现 电路板自动光照检测系统的设计与实现 基于机器视觉的工件识别与定位系统的设计与实现 基于深度学习的物件识别定位系统的设计与实现 基于视觉四旋翼无人机编队系统设计及实现 基于视觉惯导融合的四旋翼自主导航系统设计与实现 面向城市智能汽车的认知地图车道层生成系统 基于深度学习的智能化无人机视觉系统的设计与仿真 基于知识库的视觉问答技术研究 基于深度学习的火灾视频实时智能检测研究 结构化道路车道线检测方法研究 基于机器视觉的带式输送机动态煤量计量研究 基于深度学习的小目标检测算法研究 基于三维激光与视觉信息融合的地点检索算法研究 动态环境下仿人机器人视觉定位与运动规划方法研究 瓷砖铺贴机器人瓷砖空间定位系统研究 城市街景影像中行人车辆检测实现 基于无线信号的身份识别技术研究 基于移动机器人的目标检测方法研究 基于深度学习的机器人三维环境对象感知 基于特征表示的扩展目标跟踪技术研究 基于深度学习的目标检测方法研究 基于深度学习的复杂背景下目标检测与跟踪 动态扩展目标的高精度特征定位跟踪技术研究 掩模缺陷检测仪的图像处理系统设计 复杂场景下相关滤波跟踪算法研究 基于多层级联网络的多光谱图像显著性检测研究 基于深度结构特征表示学习的视觉跟踪研究 基于深度网络的显著目标检测方法研究 基于深度学习的电气设备检测方法研究 复杂交通场景下的视频目标检测 基于多图学习的多模态图像显著性检测算法研究 基于面部视频的非接触式心率检测研究 单幅图像协同显著性检测方法研究 轻量级人脸关键点检测算法研究 基于决策树和最佳特征选择的神经网络钓鱼网站检测研究 基于深度学习的场景文本检测方法研究 RGB-D图像显著及协同显著区域检测算法研究 多模态融合的RGB-D图像显著目标检测研究 基于协同排序模型的RGBT显著性检测研究 基于最小障碍距离的视觉跟踪研究 基于协同图学习的RGB-T图像显著性检测研究 基于图学习与标签传播优化模型的图像协同显著性目标检测 姿态和遮挡鲁棒的人脸关键点检测算法研究 基于多模态和多任务学习的显著目标检测方法研究 基于深度学习的交通场景视觉显著性区域目标检测 基于生物视觉机制的视频显著目标检测算法研究 基于场景结构的视觉显著性计算方法研究 精神分裂症患者初级视觉网络的磁共振研究 基于fMRI与TMS技术研究腹侧视觉通路中结构优势效应的加工 脑机接口游戏神经可塑性研究 基于YOLOV3算法的FL-YOLO多目标检测系统 基于深度与宽度神经网络显著性检测方法研究 基于深度学习的零件识别系统设计与研究 基于对抗神经网络的图像超分辨算法研究 基于深度学习复杂场景下停车管理视觉算法的研究与实现 镍电解状态视觉检测与分析方法研究 跨界训练对提升舞者静态平衡能力的理论与方法研究 施工现场人员类型识别方法的研究与实现 基于深度学习的自然场景文字检测方法研究 基于嵌入式的交通标志识别器的设计 基于视觉感知特性与图像特征的图像质量评价

1.电子与通信工程  无线网络  光通信  多媒体通信

2.网络  软件技术在通信工程  微波工程  信息通信工程

3.人工智能  生物信息学  软件工程  信号处理

4.嵌入式系统  编码  音频/语音信号处理  图像/视频处理和编码

5.医学成像和图像分析  应用电子生物医学电子  工业电子和自动化  机器人

6.电子设备在通信  电子工程  神经网络的应用  工业自动化与控制

7.设备建模与仿真  VLSI设计与测试  微加工、微传感器和MEMS 光电子和光子技术

8.工艺技术  纳米技术  信息技术  通信和车辆技术

9.电力系统和电子  控制系统  生物医学工程  生物医学成像

10.图像处理和可视化  生物医学信号处理和分析  医疗数据存储和压缩技术  生物医学建模

11.生物信息学  计算机和信息科学嵌入系统  信息工程和应用  电气工程与应用

12.控制工程和应用  通信技术与应用  服务科学  工程和应用

13.生物信息学和应用  能源和交通方面的智能方法

Ø 出版社:SPIE(The International Society for Optics and Photonics)光学学会

Ø 检索核心:EI SCI

Ø 发表方法:在线投稿或EASYCHAIR

Ø 缩写:ICEIE2017

Ø 周期:投稿后在2-3周内会有审稿结果,在会议结束后3-6个月完成论文的出版和检索

Ø 合作单位:山东大学(威海)

Ø 时间:2017年09月16-17日

Ø 发表流程

u 投稿→审稿→审核结果通过→录用通知→论文注册→注册成功→参加会议→会议完成→论文出版→论文检索→完成

参考内容来源:《ICEIE2017电子与信息工程》

·ADSL接入网技术研究 (字数:24985,页数:36) ·直序扩频技术的仿真与应用 (字数:14521,页数:37) ·音频数字水印的实现 (字数:15331,页数:28) ·DVB系统设计 (字数:14318,页数:28) ·PAM调制解调系统设计 二 (字数:9181,页数:31 ) ·上位PC机与下位单片机之间进行串口通信 (字数:12645,页数:30) ·图像梯形退化校正的研究与实现 (字数:12616,页数:34) ·简易数字电压表设计实现 (字数:7436,页数:24 ) ·基于计算机视觉库OpenCV的文本定位算法改进 (字数:9674,页数:32 ) ·基于编码的OFDM系统的C语言设计与实 (字数:11190,页数:34) ·基于ofdm系统的接受分集技术 (字数:11057,页数:28) ·基于FPGA的交织编码器设计 (字数:13239,页数:39) ·红外异步数字通信的数据采集装置设计与实现 (字数:19577,页数:68) ·Visual C++环境下的基于肤色图像的人脸检测算法 (字数:11186,页数:28) ·PAM调制解调系统设计 (字数:13922,页数:43) ·P2P网络通信设计 (字数:8075,页数:39 ) ·NAND Flash设备 (字数:10928,页数:49) ·MPEG4播放技术 (字数:13207,页数:38) ·Butterworth滤波器设计 (字数:8348,页数:28 ) ·基于单片机的智能教师点名器 (字数:10627,页数:29) ·基于CPLD的CDMA扩频调制解调器建模设计与实现 (字数:14327,页数:63) ·带CC1100无线收发模块基本控制系统 (字数:15224,页数:50) ·基于CPLD的CMI码传输系统设计 (字数:11429,页数:41) ·一个简单光纤传输系统的设计 (字数:12785,页数:37) ·基于MCS51微控制器的FSK调制解调器设计——电路设计 (字数:13439,页数:39) ·中小型网络的设计与配置 (字数:16254,页数:42) ·基于AT89S52的FSK调制解调器设计 (字数:14064,页数:45) ·远端光纤收发器断电断纤的识别 (字数:15759,页数:89) ·脉冲成形BPSK调制电路的设计与实现 (字数:11472,页数:36) ·基于XR2206的函数信号发生器设计与实现 (字数:9179,页数:31 ) ·基于MCS51微控制器的FSK调制解调器的设计——程序设计 (字数:12191,页数:46) ·基于CPLD的QPSK调制器实现——电路设计 (字数:11621,页数:33) ·QPSK调制器的CPLD实现——程序设计 (字数:5973,页数:30 ) ·基于卷积码的BPSK基带系统C语言实现 (字数:9361,页数:30 ) ·白噪声发生器的设计 (字数:11398,页数:34) ·基于单片机的机床控制系统 (字数:12085,页数:35) ·低压电力线载波通信模块设计 (字数:15460,页数:68) ·基于SH框架的电子技术交流平台 (字数:10333,页数:38) ·带隙基准电压源的设计 (字数:10396,页数:31) ·电子计时器系统设计与实现 (字数:9780,页数:31 ) ·无线局域网的组建与测试 (字数:17392,页数:48) ·抑制载波双边带调幅电路的设计 (字数:9787,页数:24 ) ·宽带放大器的设计与实现 (字数:12200,页数:36) ·基于单片机的遥控芯片解码的设计与实现 (字数:9802,页数:39 ) ·多种正交幅度调制QAM误码率仿真及星座图的优化 (字数:10967,页数:43)

姓名:张钰  学号:21011210154  学院:通信工程学院 【嵌牛导读】Frequency-aware Discriminative Feature Learning Supervised by Single-Center Loss for Face Forgery Detection论文阅读笔记 【嵌牛鼻子】Deepfake人脸检测方法,基于单中心损失监督的频率感知鉴别特征学习框架FDFL,将度量学习和自适应频率特征学习应用于人脸伪造检测,实现SOTA性能 【嵌牛提问】本文对于伪造人脸检测的优势在哪里体现 【嵌牛正文】 转自:

人脸检测论文初稿

Viola-jones人脸检测算法是一种基于滑动窗口的目标检测算法,但它却克服了滑动窗口检测带来的低效问题,可以用于实时人脸检测,主要归功于以下三点:

参考论文[1]实现了Viola Jones中提到的attention cascade检测框架,此处是 github传送门 。

下面进一步详细介绍整个检测原理。

基于滑窗的目标检测基本原理很简单,首先构建一个classifier(分类器),以人脸检测为例,分类器的工作是判断给定大小的图像的是否为人脸,用该分类器从左至右从上到下扫描整幅图像,扫描获取的部分图像称为子窗(文章中子窗大小为24x24像素),当分类器判断子窗是人脸时,即完成了人脸检测。

这样处理有个问题,如果图像中包含的人脸变大了,此时采用固定大小的子窗就无法进行检测。通常有两种解决方法,1. 采用image-pyramid(图像金字塔),也就是通过resize获得多种不同大小图像并堆叠在一起,用固定大小分类器同时对所有图像进行扫描;2. 采用不同大小的分类器进行扫描。文章中用到的是第二种方法,尽管如此,虽然避免了调整图像大小带来的计算开销,但不同大小的分类器意味着有更多子窗需要进行处理。

如何构建一个足够快的分类器来对每个子窗进行快速判断。

分类器的构建有两种方式,一种是pixel-based(基于像素),另一种是feature-based(基于特征)。当把神经网络作为图像分类器时,输入是图像的像素值,即基于像素的分类器。用图像像素作为输入不包含任何和待分类目标有关的特定信息,往往训练这种分类器需要大量数据,并且分类过程较慢。基于特征的分类器就是先针对图像进行特征提取(HOG特征,SIFT特征等),再利用获取的特征进行分类。这种分类器不需要大量训练数据,且计算量一般会在特征计算部分,相对较小。

文章采用的是基于特征的分类器,选取了一种较为简单的特征即haar-like特征。利用矩形个数对可以将haar-like特征分为三类,分别由两个,三个,和四个 大小相同 的矩形组成。全部列举出来可以分为以下(a)(b)(c)(d)(e)五类(注意是五类不是五个,具体有多少个haar-like特征是由子窗大小决定的)。如下图所示(文章[1]中的图)。

当子窗大小给定后,我们可以用五个参数唯一确定 一个 haar-like特征,即特征种类(a/b/c/d/e),左上角x轴坐标,左上角y轴坐标,矩形的长,矩形的宽。对应的特征值等于位于白色矩形框中像素值总和减去位于黑色矩形框中的像素值总和。文章中用到的子窗大小为24x24像素,可以计算出来总共有162336个特征(把在子窗中所有可能位置和可能大小的特征全部列举出来)。利用haar-like特征进行分类只需两步:

haar-like特征有两个优点,第一是它是scale-invariant(不随图片大小而改变)的,第二是可以通过积分图像快速计算。简单的说下第一点的含义,例如我们用24x24像素的训练样本训练获取一组haar-like特征和对应的门限值,当对图像进行扫描时,子窗大小调整为SxS像素,此时只需将特征中的矩形大小按同样比例进行缩放(门限值同样需要缩放),计算所得的特征值依然是有效的。 积分图像是受卷积的微分性质启发而定义一种数据结构。积分图像定义: 其中 为积分图像, 为原图像。积分图像中 位置处的像素值等于原图中位于 的左侧和上方的所有像素值之和。有了积分图像我们就可以快速计算haar-like特征,以特征(a)为例,如下图所示。

S1到S6是积分图像在这六个顶点上的值。该特征值等于位于A中的像素总和减去位于B中的像素总和,而A中像素总和等于S5+S1-S2-S4,B中像素总和等于S6+S2-S3-S5,并且无论矩形多大,我们总能在固定时间内计算出特征值(6次索引操作和少量的加法乘法计算)。积分图像只需计算一次后续可以一直使用,事实上在算法实现时,我们只需保存样本的积分图像,原图像反而不用保存。

现在找到了一类特征用于构建分类器,和快速计算该类特征的方法。分类器是由一组特征构成的,而不是一个,如何找到一组有效的特征。

文章列举了前人的一些特征选取方法(此处就不列举了),它们虽然取得了一定的效果,但最终选出来的特征数量还是太多。文章将adaBoost算法用于特征选取(创新点),即每次训练的弱分类器的过程看做特征选取的过程,一次从162336个特征中选取一个特征(同时还包括了对应的门限值,极性,加权误差)。

adaboost算法就不详细介绍了,它的基本思想是训练一系列“弱”分类器,组成一个committee(即每个弱分类器都有投票权,但是权重不同,加权误差越小的弱分类器权重越大)。adaboost采用迭代训练方式,给定一个t阶committee,如何寻找第t+1个弱分类器和对应的权重,以最小化在一定分布下的训练样本的加权指数损失。这个优化过程可以转换为对训练样本的分布进行调整(即增大上一轮错误判断的样本的权重,减小正确判断的样本权重),在调整后的样本分布下寻找最小化加权0-1损失的弱分类器并计算对应的加权0-1损失。

可以利用adaboost找到一组特征构成分类器,使得该分类器有极高的准确率和召回率(这种分类器势必会有较大的计算量),这样会导致图像中的每一个子窗都享有同等的计算量,扫描一整幅图会有几十万甚至上百万子窗,总体计算量依然很大。实际上一幅图像中只有极少可能包含人脸的位置是我们感兴趣的,其他不包含人脸的子窗我们希望能够快速筛除,将更精细的计算用于包含人脸的子窗。

文章引入了attention-cascade的机制(注意力级联),即训练多个分类器进行级联,替代单一的分类器。结构如下图所示(文章[3]中的图)。

上图所示的分类器有三级,上一级的输出是下一级的输入,只有预测为正的样本才能传递给下一级,预测为负的样本直接舍弃。大部分非人脸子窗往往在前几级分类器就被舍弃,这样使得扫描每个子窗所需的平均计算量大大减小。

分类器是一级一级训练之后级联起来的,训练分类器时,整个级联分类器的假负率(fpr_overall)有一个训练目标(文章[1]中设置为10e-7),同时每一级有一对训练目标,即假正率和假负率。每级分类器训练的思想是在假负率极低的情况下(文章[1]中设置为)尽量得到一个较低的假正率(文章中[1]中设置为),即我们保证在正样本尽可能多的通过该级分类器的情况下尽量筛除更多的负样本。文章[3]通过一个松弛量来调节假正率和假负率。

下一级用到的训练数据是由所有的正样本和上一级输出的假正样本组成的,这样训练的好处是可以让处于级联后半部分的分类器“看到”更多负样本数据,缺点是训练后期假正样本很难获取,训练时间会比较长。

尽管我们获取了一个级联分类器,但依然不能保证对同一幅图中的一张人脸只会检测到一次(子窗相对人脸有所便宜或者缩放子窗大小都可能导致重复检测),如何消除重复检测,获得更好的检测效果。

文章[3]中说的较为简略,主要是针对检测框构建并查集,并对并查集中的候选框求平均得出最终的检测框。

文章[1]中是采用连通分量算法,计算每种大小检测框的置信度,根据置信度选取最终结果,但前提是检测器在图像中扫描的步进必须是1个像素,处理时间可能会比较长。

只能用于正脸检测,如果人脸朝屏幕内外或者在屏幕平面上旋转均有可能失效 在背景较亮,人脸较暗的情况下可能失效。 在有遮挡的情况下大概率失效。

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

人脸检测论文英语

llery images是用于训练还是测确比较多

Viola-jones人脸检测算法是一种基于滑动窗口的目标检测算法,但它却克服了滑动窗口检测带来的低效问题,可以用于实时人脸检测,主要归功于以下三点:

我参考论文[1]实现了Viola Jones中提到的attention cascade检测框架,此处是 github传送门 。

下面进一步详细介绍整个检测原理。

基于滑窗的目标检测基本原理很简单,首先构建一个classifier(分类器),以人脸检测为例,分类器的工作是判断给定大小的图像的是否为人脸,用该分类器从左至右从上到下扫描整幅图像,扫描获取的部分图像称为子窗(文章中子窗大小为24x24像素),当分类器判断子窗是人脸时,即完成了人脸检测。

这样处理有个问题,如果图像中包含的人脸变大了,此时采用固定大小的子窗就无法进行检测。通常有两种解决方法,1. 采用image-pyramid(图像金字塔),也就是通过resize获得多种不同大小图像并堆叠在一起,用固定大小分类器同时对所有图像进行扫描;2. 采用不同大小的分类器进行扫描。文章中用到的是第二种方法,尽管如此,虽然避免了调整图像大小带来的计算开销,但不同大小的分类器意味着有更多子窗需要进行处理。

如何构建一个足够快的分类器来对每个子窗进行快速判断。

分类器的构建有两种方式,一种是pixel-based(基于像素),另一种是feature-based(基于特征)。当把神经网络作为图像分类器时,输入是图像的像素值,即基于像素的分类器。用图像像素作为输入不包含任何和待分类目标有关的特定信息,往往训练这种分类器需要大量数据,并且分类过程较慢。基于特征的分类器就是先针对图像进行特征提取(HOG特征,SIFT特征等),再利用获取的特征进行分类。这种分类器不需要大量训练数据,且计算量一般会在特征计算部分,相对较小。

文章采用的是基于特征的分类器,选取了一种较为简单的特征即haar-like特征。利用矩形个数对可以将haar-like特征分为三类,分别由两个,三个,和四个 大小相同 的矩形组成。全部列举出来可以分为以下(a)(b)(c)(d)(e)五类(注意是五类不是五个,具体有多少个haar-like特征是由子窗大小决定的)。如下图所示(文章[1]中的图)。

当子窗大小给定后,我们可以用五个参数唯一确定 一个 haar-like特征,即特征种类(a/b/c/d/e),左上角x轴坐标,左上角y轴坐标,矩形的长,矩形的宽。对应的特征值等于位于白色矩形框中像素值总和减去位于黑色矩形框中的像素值总和。文章中用到的子窗大小为24x24像素,可以计算出来总共有162336个特征(把在子窗中所有可能位置和可能大小的特征全部列举出来)。利用haar-like特征进行分类只需两步:

haar-like特征有两个优点,第一是它是scale-invariant(不随图片大小而改变)的,第二是可以通过积分图像快速计算。简单的说下第一点的含义,例如我们用24x24像素的训练样本训练获取一组haar-like特征和对应的门限值,当对图像进行扫描时,子窗大小调整为SxS像素,此时只需将特征中的矩形大小按同样比例进行缩放(门限值同样需要缩放),计算所得的特征值依然是有效的。 积分图像是受卷积的微分性质启发而定义一种数据结构。积分图像定义: 其中 为积分图像, 为原图像。积分图像中 位置处的像素值等于原图中位于 的左侧和上方的所有像素值之和。有了积分图像我们就可以快速计算haar-like特征,以特征(a)为例,如下图所示。

S1到S6是积分图像在这六个顶点上的值。该特征值等于位于A中的像素总和减去位于B中的像素总和,而A中像素总和等于S5+S1-S2-S4,B中像素总和等于S6+S2-S3-S5,并且无论矩形多大,我们总能在固定时间内计算出特征值(6次索引操作和少量的加法乘法计算)。积分图像只需计算一次后续可以一直使用,事实上在算法实现时,我们只需保存样本的积分图像,原图像反而不用保存。

现在找到了一类特征用于构建分类器,和快速计算该类特征的方法。分类器是由一组特征构成的,而不是一个,如何找到一组有效的特征。

文章列举了前人的一些特征选取方法(此处就不列举了),它们虽然取得了一定的效果,但最终选出来的特征数量还是太多。文章将adaBoost算法用于特征选取(创新点),即每次训练的弱分类器的过程看做特征选取的过程,一次从162336个特征中选取一个特征(同时还包括了对应的门限值,极性,加权误差)。

adaboost算法就不详细介绍了,它的基本思想是训练一系列“弱”分类器,组成一个committee(即每个弱分类器都有投票权,但是权重不同,加权误差越小的弱分类器权重越大)。adaboost采用迭代训练方式,给定一个t阶committee,如何寻找第t+1个弱分类器和对应的权重,以最小化在一定分布下的训练样本的加权指数损失。这个优化过程可以转换为对训练样本的分布进行调整(即增大上一轮错误判断的样本的权重,减小正确判断的样本权重),在调整后的样本分布下寻找最小化加权0-1损失的弱分类器并计算对应的加权0-1损失。

可以利用adaboost找到一组特征构成分类器,使得该分类器有极高的准确率和召回率(这种分类器势必会有较大的计算量),这样会导致图像中的每一个子窗都享有同等的计算量,扫描一整幅图会有几十万甚至上百万子窗,总体计算量依然很大。实际上一幅图像中只有极少可能包含人脸的位置是我们感兴趣的,其他不包含人脸的子窗我们希望能够快速筛除,将更精细的计算用于包含人脸的子窗。

文章引入了attention-cascade的机制(注意力级联),即训练多个分类器进行级联,替代单一的分类器。结构如下图所示(文章[3]中的图)。

上图所示的分类器有三级,上一级的输出是下一级的输入,只有预测为正的样本才能传递给下一级,预测为负的样本直接舍弃。大部分非人脸子窗往往在前几级分类器就被舍弃,这样使得扫描每个子窗所需的平均计算量大大减小。

分类器是一级一级训练之后级联起来的,训练分类器时,整个级联分类器的假负率(fpr_overall)有一个训练目标(文章[1]中设置为10e-7),同时每一级有一对训练目标,即假正率和假负率。每级分类器训练的思想是在假负率极低的情况下(文章[1]中设置为)尽量得到一个较低的假正率(文章中[1]中设置为),即我们保证在正样本尽可能多的通过该级分类器的情况下尽量筛除更多的负样本。文章[3]通过一个松弛量来调节假正率和假负率。

下一级用到的训练数据是由所有的正样本和上一级输出的假正样本组成的,这样训练的好处是可以让处于级联后半部分的分类器“看到”更多负样本数据,缺点是训练后期假正样本很难获取,训练时间会比较长。

尽管我们获取了一个级联分类器,但依然不能保证对同一幅图中的一张人脸只会检测到一次(子窗相对人脸有所便宜或者缩放子窗大小都可能导致重复检测),如何消除重复检测,获得更好的检测效果。

文章[3]中说的较为简略,主要是针对检测框构建并查集,并对并查集中的候选框求平均得出最终的检测框。

文章[1]中是采用连通分量算法,计算每种大小检测框的置信度,根据置信度选取最终结果,但前提是检测器在图像中扫描的步进必须是1个像素,处理时间可能会比较长。

只能用于正脸检测,如果人脸朝屏幕内外或者在屏幕平面上旋转均有可能失效 在背景较亮,人脸较暗的情况下可能失效。 在有遮挡的情况下大概率失效。

这么严格啊 还要中英文对照的。帮不了你了

姓名:张钰  学号:21011210154  学院:通信工程学院 【嵌牛导读】Frequency-aware Discriminative Feature Learning Supervised by Single-Center Loss for Face Forgery Detection论文阅读笔记 【嵌牛鼻子】Deepfake人脸检测方法,基于单中心损失监督的频率感知鉴别特征学习框架FDFL,将度量学习和自适应频率特征学习应用于人脸伪造检测,实现SOTA性能 【嵌牛提问】本文对于伪造人脸检测的优势在哪里体现 【嵌牛正文】 转自:

人脸检测与识别论文

dlib的安装很头疼我自己折腾了好几星期才成功 要讲的话很多所以写在了word里

链接:

人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷,晓电晓受晓受晓晓晓多晓电晓米晓受晓联晓受晓零晓电晓受晓米晓多晓晓e少量惠量量e米惠d量晓晓受晓晓晓晓米晓晓多晓少米受在一定程度上有泛滥成“灾”之嫌。为了更好地对人脸识别研究的历史和现状进行介绍,本文将AFR的研究历史按照研究内容、技术芳珐等方面的特点大体划分为三个时间阶段,如表受所示。该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。下面对三个阶段的研究进展情况作简单介绍: 第一阶段(受惠米联年~受惠惠零年) 这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometricfeature based)的芳珐。这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。金出武雄于受惠少晓年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,仍然是人脸识别领域的活跃人物之一。他所在的研究组也是人脸识别领域的一支重要力量。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。 第二阶段(受惠惠受年~受惠惠少年) 这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干伤业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。 美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特兰德(Pentland)提出的“特征脸”芳珐无疑是这一时期内最负盛名的人脸识别芳珐。其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(NormalizedCorrelation)芳珐一道成为人脸识别的性能测试基准算法。 这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)于受惠惠电年左右做的一个对比实验,他们对比了基于结构特征的芳珐与基于模板匹配的芳珐的识别性能,并给出了一个比较确定的结论:模板匹配的芳珐优于基于特征的芳珐。这一导向性的结论与特征脸共同作用,基本中止了纯粹的基于结构特征的人脸识别芳珐研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别芳珐的发展,使其逐渐成为主流的人脸识别技术。 贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别芳珐是这一时期的另一重要成果。该芳珐首先采用主成分分析(PrincipalComponent Analysis,PCA,亦即特征脸)对图像表观特征进行降维。在此基础上,采用线性判别分析(LinearDiscriminant Analysis, LDA)的芳珐变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该芳珐目前仍然是主流的人脸识别芳珐之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别芳珐以及近期的一些基于核学习的改进策略。 麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别芳珐。该芳珐通过“作差法”,将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维,计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的芳珐来进行人脸识别。 人脸识别中的另一种重要芳珐——弹性图匹配技术(Elastic GraphMatching,EGM) 也是在这一阶段提出的。其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换【受电】特征,称为Jet;边的属性则为不同特征点之间的几何关系。对任意输入人脸图像,弹性图匹配通过一种优化馊索策略来定位预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该芳珐的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。近来还出现了一些对该芳珐的扩展。 局部特征分析技术是由洛克菲勒大学(RockefellerUniversity)的艾提克(Atick)等人提出的。LFA在本质上是一种基于统计的低维对象描述芳珐,与只能提取全局特征而且不能保留局部拓扑结构的PCA相比,LFA在全局PCA描述的基础上提取的特征是局部的,并能够同时保留全局拓扑信息,从而具有更佳的描述和判别能力。LFA技术已伤业化为著名的FaceIt系统,因此后期没有发表新的学术进展。 由美国国防部反技术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。该项目分别于受惠惠联年,受惠惠多年和受惠惠米年组织了晓次人脸识别评测,几种最知名的人脸识别算法都参家了测试,极大地促进了这些算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。 柔性模型(Flexible Models)——包括主动形状模型(ASM)和主动表观模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。ASM/AAM将人脸描述为电D形状和纹理两个分离的部分,分别用统计的芳珐进行建模(PCA),然后再进一步通过PCA将二者融合起来对人脸进行统计建模。柔性模型具有良好的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。柔性模型目前已被广泛用于人脸特征对准(FaceAlignment)和识别中,并出现了很多的改进模型。 总体而言,这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别伤业公司。从技术方案上看, 电D人脸图像线性子空间判别分析、统计表观模型、统计模式识别芳珐是这一阶段内的主流技术。 第三阶段(受惠惠量年~现在) FERET’惠米人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的伤业系统进一步发展。为此,美国军方在FERET测试的基础上分别于电零零零年和电零零电年组织了两次伤业系统评测。 基奥盖蒂斯(Georghiades)等人提出的基于光照锥 (Illumination Cones) 模型的多姿态、多光照条件人脸识别芳珐是这一时期的重要成果之一,他们证明了一个重要结论:同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。为了能够从少量未知光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉芳珐进行了扩展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的少幅同一视点图像恢复物体的晓D形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的晓幅已知光照条件的图像恢复物体表面的法向量方向),从而可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。识别则通过计算输入图像到每个光照锥的距离来完成。 以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。支持向量机是一个两类分类器,而人脸识别则是一个多类问题。通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。 布兰兹(Blanz)和维特(Vetter)等提出的基于晓D变形(晓D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别芳珐是这一阶段内一项开创性的工作。该芳珐在本质上属于基于合成的分析技术,其主要贡献在于它在晓D形状和纹理统计变形模型(类似于电D时候的AAM)的基础上,同时还采用图形学模拟的芳珐对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更家有利于人脸图像的分析与识别。Blanz的实验表明,该芳珐在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该芳珐的有效性。 电零零受年的国际计算机视觉大会(ICCV)上,康柏研究院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特征和AdaBoost的实时人脸检测系统,在CIF格式上检测准正面人脸的速度达到了每秒受多帧以上。该芳珐的主要贡献包括:受)用可以快速计算的简单矩形特征作为人脸图像特征;电)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习芳珐;晓)采用了级联(Cascade)技术提高检测速度。目前,基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。这为后端的人脸识别提供了良好的基础。 沙苏哈(Shashua)等于电零零受年提出了一种基于伤图像【受晓】的人脸图像识别与绘制技术。该技术是一种基于特定对象类图像集合学习的绘制技术,能够根据训练集合中的少量不同光照的图像,合成任意输入人脸图像在各种光照条件下的合成图像。基于此,沙苏哈等还给出了对各种光照条件不变的人脸签名(Signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有效性。 巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的芳珐解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。这不仅与先前的光照统计建模芳珐的经验实验结果相吻合,更进一步从理论上促进了线性子空间对象识别芳珐的发展。而且,这使得用凸优化芳珐来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。 FERET项目之后,涌现了若干人脸识别伤业系统。美国国防部有关部门进一步组织了针对人脸识别伤业系统的评测FRVT,至今已经举办了两次:FRVT电零零零和FRVT电零零电。这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT电零零电测试就表明Cognitec, Identix和Eyematic三个伤业铲品遥遥领先于其他系统,而它们之间的差别不大。另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对晓少联晓少人受电受,多量惠 幅图像的人脸识别(Identification)最高首选识别率为少晓%,人脸验证(Verification)的等错误率(EER【受联】)大约为米%。FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。例如,FRVT电零零电测试就表明:目前的人脸识别伤业系统的性能仍然对于室内外光照变化、姿态、时间跨度等变化条件非常敏感,大规模人脸库上的有效识别问题也很严重,这些问题都仍然需要进一步的努力。 总体而言,目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模芳珐、统计学习理论、基于Boosting【受多】的学习技术、基于晓D模型的人脸建模与识别芳珐等逐渐成为备受重视的技术发展趋势。 总而言之, 人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用。这些成果更家深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统可能已经超过了人类,但对于复杂变化条件下的一般人脸识别问题,自动人脸识别系统的鲁棒性和准确度还远不及人类。这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还十分肤浅。但从模式识别和计算机视觉等学科的角度判断,这既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模芳珐(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想。相信随着研究的继续深入,我们的认识应该能够更家准确地逼近这些问题的正确答案。

python使用dlib进行人脸检测与人脸关键点标记

Dlib简介:

首先给大家介绍一下Dlib

Dlib是一个跨平台的C++公共库,除了线程支持,网络支持,提供测试以及大量工具等等优点,Dlib还是一个强大的机器学习的C++库,包含了许多机器学习常用的算法。同时支持大量的数值算法如矩阵、大整数、随机数运算等等。

Dlib同时还包含了大量的图形模型算法。

最重要的是Dlib的文档和例子都非常详细。

Dlib主页:

这篇博客所述的人脸标记的算法也是来自Dlib库,Dlib实现了One Millisecond Face Alignment with an Ensemble of Regression Trees中的算法

这篇论文非常出名,在谷歌上打上One Millisecond就会自动补全,是CVPR 2014(国际计算机视觉与模式识别会议)上的一篇国际顶级水平的论文。毫秒级别就可以实现相当准确的人脸标记,包括一些半侧脸,脸很不清楚的情况,论文本身的算法十分复杂,感兴趣的同学可以下载看看。

Dlib实现了这篇最新论文的算法,所以Dlib的人脸标记算法是十分先进的,而且Dlib自带的人脸检测库也很准确,我们项目受到硬件所限,摄像头拍摄到的画面比较模糊,而在这种情况下之前尝试了几个人脸库,识别率都非常的低,而Dlib的效果简直出乎意料。

相对于C++我还是比较喜欢使用python,同时Dlib也是支持python的,只是在配置的时候碰了不少钉子,网上大部分的Dlib资料都是针对于C++的,我好不容易才配置好了python的dlib,这里分享给大家:

Dlib for python 配置:

因为是用python去开发计算机视觉方面的东西,python的这些科学计算库是必不可少的,这里我把常用的科学计算库的安装也涵盖在内了,已经安装过这些库的同学就可以忽略了。

我的环境是:

大家都知道Ubuntu是自带的,而且很多Ubuntu系统软件都是基于的,有一次我系统的python版本乱了,我脑残的想把卸载了重装,然后……好像是提醒我要卸载几千个软件来着,没看好直接回车了,等我反应过来Ctrl + C 的时候系统已经没了一半了…

所以我发现想要搞崩系统,这句话比rm -rf 还给力…

sudo apt-get remove

首先安装两个python第三方库的下载安装工具,好像是预装了easy_install

以下过程都是在终端中进行:

1.安装pip

sudo apt-get install python-pip1

2.安装easy-install

sudo apt-get install python-setuptools1

3.测试一下easy_install

有时候系统环境复杂了,安装的时候会安装到别的python版本上,这就麻烦了,所以还是谨慎一点测试一下,这里安装一个我之前在博客中提到的可以模拟浏览器的第三方python库测试一下。

sudo easy_install Mechanize1

4.测试安装是否成功

在终端输入python进入python shell

python1

进入python shell后import一下刚安装的mechanize

>>>import mechanize1

没有报错,就是安装成功了,如果说没有找到,那可能就是安装到别的python版本的路径了。

同时也测试一下PIL这个基础库

>>>import PIL1

没有报错的话,说明PIL已经被预装过了

5.安装numpy

接下来安装numpy

首先需要安装python-dev才可以编译之后的扩展库

sudo apt-get install python-dev1

之后就可以用easy-install 安装numpy了

sudo easy_install numpy1

这里有时候用easy-install 安装numpy下载的时候会卡住,那就只能用 apt-get 来安装了:

sudo apt-get install numpy1

不推荐这样安装的原因就是系统环境或者说python版本多了之后,直接apt-get安装numpy很有可能不知道装到哪个版本去了,然后就很麻烦了,我有好几次遇到这个问题,不知道是运气问题还是什么,所以风险还是很大的,所以还是尽量用easy-install来安装。

同样import numpy 进行测试

python>>>import numpy1234

没有报错的话就是成功了

下面的安装过程同理,我就从简写了,大家自己每步别忘了测试一下

6.安装scipy

sudo apt-get install python-scipy1

7.安装matplotlib

sudo apt-get install python-matplotlib1

8.安装dlib

我当时安装dlib的过程简直太艰辛,网上各种说不知道怎么配,配不好,我基本把stackoverflow上的方法试了个遍,才最终成功编译出来并且导入,不过听说更新之后有了,那真是极好的,我没有亲自配过也不能乱说,这里给大家分享我配置的过程吧:

1.首先必须安装libboost,不然是不能使用.so库的

sudo apt-get install libboost-python-dev cmake1

2.到Dlib的官网上下载dlib,会下载下来一个压缩包,里面有C++版的dlib库以及例子文档,Python dlib库的代码例子等等

我使用的版本是,大家也可以在我这里下载:

之后进入python_examples下使用bat文件进行编译,编译需要先安装libboost-python-dev和cmake

cd to 123

之后会得到一个,复制到dist-packages目录下即可使用

这里大家也可以直接用我编译好的.so库,但是也必须安装libboost才可以,不然python是不能调用so库的,下载地址:

将.so复制到dist-packages目录下

sudo cp /usr/local/lib/

最新的好像就没有这个bat文件了,取而代之的是一个setup文件,那么安装起来应该就没有这么麻烦了,大家可以去直接安装,也可以直接下载复制我的.so库,这两种方法应该都不麻烦~

有时候还会需要下面这两个库,建议大家一并安装一下

9.安装skimage

sudo apt-get install python-skimage1

10.安装imtools

sudo easy_install imtools1

Dlib face landmarks Demo

环境配置结束之后,我们首先看一下dlib提供的示例程序

1.人脸检测

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image.  In#   particular, it shows how you can take a list of images from the command#   line and display each on the screen with red boxes overlaid on each human#   face.##   The examples/faces folder contains some jpg images of people.  You can run#   this program on them and see the detections by executing the#   following command:#       ./ ../examples/faces/*.jpg##   This face detector is made using the now classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear classifier, an image#   pyramid, and sliding window detection scheme.  This type of object detector#   is fairly general and capable of detecting many types of semi-rigid objects#   in addition to human faces.  Therefore, if you are interested in making#   your own object detectors then read the example#   program.  ### COMPILING THE DLIB PYTHON INTERFACE#   Dlib comes with a compiled python interface for python on MS Windows. If#   you are using another python version or operating system then you need to#   compile the dlib python interface before you can use this file.  To do this,#   run .  This should work on any operating#   system so long as you have CMake and boost-python installed.#   On Ubuntu, this can be done easily by running the command:#       sudo apt-get install libboost-python-dev cmake##   Also note that this example requires scikit-image which can be installed#   via the command:#       pip install -U scikit-image#   Or downloaded from . import sysimport dlibfrom skimage import iodetector = ()win = ()print("a");for f in [1:]:print("a");print("Processing file: {}".format(f))img = (f)# The 1 in the second argument indicates that we should upsample the image# 1 time.  This will make everything bigger and allow us to detect more# = detector(img, 1)print("Number of faces detected: {}".format(len(dets)))    for i, d in enumerate(dets):print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format(i, (), (), (), ()))()(img)(dets)()# Finally, if you really want to you can ask the detector to tell you the score# for each detection.  The score is bigger for more confident detections.# Also, the idx tells you which of the face sub-detectors matched.  This can be# used to broadly identify faces in different (len([1:]) > 0):img = ([1])dets, scores, idx = (img, 1)    for i, d in enumerate(dets):print("Detection {}, score: {}, face_type:{}".format(d, scores[i], idx[i]))1234567891011128192021222324252627282930337383940414243444546474849505575859606162636465666768697077778798081

我把源代码精简了一下,加了一下注释:

# -*- coding: utf-8 -*-import sysimport dlibfrom skimage import io#使用dlib自带的frontal_face_detector作为我们的特征提取器detector = ()#使用dlib提供的图片窗口win = ()#[]是用来获取命令行参数的,[0]表示代码本身文件路径,所以参数从1开始向后依次获取图片路径for f in [1:]:    #输出目前处理的图片地址print("Processing file: {}".format(f))    #使用skimage的io读取图片img = (f)    #使用detector进行人脸检测 dets为返回的结果dets = detector(img, 1)    #dets的元素个数即为脸的个数print("Number of faces detected: {}".format(len(dets)))    #使用enumerate 函数遍历序列中的元素以及它们的下标#下标i即为人脸序号#left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离#top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离for i, d in enumerate(dets):print("dets{}".format(d))print("Detection {}: Left: {} Top: {} Right: {} Bottom: {}".format( i, (), (), (), ()))    #也可以获取比较全面的信息,如获取人脸与detector的匹配程度dets, scores, idx = (img, 1)for i, d in enumerate(dets):print("Detection {}, dets{},score: {}, face_type:{}".format( i, d, scores[i], idx[i]))    #绘制图片(dlib的ui库可以直接绘制dets)(img)(dets)    #等待点击()123456789101112819202122232425262728293033738394041424344454647484950

分别测试了一个人脸的和多个人脸的,以下是运行结果:

运行的时候把图片文件路径加到后面就好了

python ./data/

一张脸的:

两张脸的:

这里可以看出侧脸与detector的匹配度要比正脸小的很多

2.人脸关键点提取

人脸检测我们使用了dlib自带的人脸检测器(detector),关键点提取需要一个特征提取器(predictor),为了构建特征提取器,预训练模型必不可少。

除了自行进行训练外,还可以使用官方提供的一个模型。该模型可从dlib sourceforge库下载:

也可以从我的连接下载:

这个库支持68个关键点的提取,一般来说也够用了,如果需要更多的特征点就要自己去训练了。

源程序:

#!/usr/bin/python# The contents of this file are in the public domain. See   This example program shows how to find frontal human faces in an image and#   estimate their pose.  The pose takes the form of 68 landmarks.  These are#   points on the face such as the corners of the mouth, along the eyebrows, on#   the eyes, and so forth.##   This face detector is made using the classic Histogram of Oriented#   Gradients (HOG) feature combined with a linear

相关百科

热门百科

首页
发表服务