人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。以下是我精心整理的人工智能的利与弊论文的相关资料,希望对你有帮助!
摘要:自1956年人工智能诞生起,几十年的发展让其有了许多的进步,并广泛用于机器视觉,专家系统,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学等各大领域,并且与人类生活联系越来越紧密。在安全性没有得到确切认证的情况下广泛发展人工智能是否是可行的做法,人工智能是否会战胜人类智能,现在还存在广泛的争论。本文从人工智能的概况,应用领域与人类生活的联系等方面讨论,联系有关理论,认为人工智能的发展需要在人类智能可控的范围内进行。
关键字:人工智能 超越 人类智能 退化
一.人工智能的概况
(一)人工智能的概念
人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
(二)人工智能的兴起
1956年,被认为是人工智能之父的John McCarthy组织了一次学会,将许多对机器智能感兴趣的专家学者聚集在一起进行了一 个月的讨论。他请他们到 Vermont参加 " Dartmouth人工智能夏季研究会"。从那时起,这个领域被命名为 "人工智能"。1976年Newell 和Simon提出了物理符号系统假设,认为物理符号系统是表现智能行为必要和充分的条件。 Minsky从心理学的研究出发,提出了框架知识表示方法。到80年代,Minsky认为人的智能,根本不存在统一的理论。以McCarthy和Nilsson等为代表,主张用逻辑来研究人工智能,即用形式化的方法描述客观世界。逻辑学派在人工智能研究中,强调的是概念化知识表示、模型论语义、演绎推理等。 McCarthy主张任何事物都可以用统一的逻辑框架来表示,在常识推理中以非单调逻辑为中心。传统的人工智能研究思路是“自上而下”式的,它的目标是让机器模仿人,认为人脑的思维活动可以通过一些公式和规则
来定义,因此希望通过把人类的思维方式翻译成程序语言输入机器,来使机器有朝一日产生像人类一样的思维能力。这一理论指导了早期人工智能的研究。
(三)人工智能的发展状况
1956年,Samuel研制了跳棋程序,它在1959年击败了Samuel本人
1959年美籍华人学者、洛克菲勒大学教授王浩 自动定理证明
1976年 “四色定理”的证明
1977年,曾是赫伯特·西蒙的研究生、斯坦福大学青年学者费根鲍姆
(E.Feigenbaum),在第五届国际人工智能大会上提出了”知识工程”的概念 1976年美国斯坦福大学肖特列夫开发医学专家系统MYCIN
80年代,AI 被引入了市场,并显示出实用价值
1997年 “深蓝”
2011年9月,在印度古瓦哈蒂举行的电脑科技展上,一个“聪明机器(Cleverbot)”成功骗过近800名观众,使他们难以分辨对话出自真人还是电脑软件。当日参加聊天试验的30名志愿者被安排进行4分钟在线文字聊天,聊天的对象可能是“聪明机器人”,也可能是一个真人。他们的对话内容展示在一个
大屏幕上,1334名普通观众观看对话内容后进行投票。结果,超过59.3%的观众 把人与“聪明机器人”的对话误认成人与人之间的对话“聪明机器人”的发明 者、英国人罗洛·卡彭特很高兴地告诉记者:“骗过一半以上观众,你可以说聪明机器人算是通过了"图灵测试"
二.人们对人工智能的依靠
(一)人工智能主要应用领域
目前人工智能主要的应用领域在机器视觉(指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别),专家系统,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解,遗传编程等。
(二)人们生活与人工智能的密切关系
从智能手机、自动驾驶汽车到医疗机器人,人工智能革命已经到来。人工智能让互联网搜索更加灵敏;将文本从一种语言翻译成另一种语言;在拥挤的交通
中推荐最畅通的线路;帮助识别信用卡诈骗„„虽然很多时候我们甚至没有意识到它的存在,但我们的生活却因它悄悄改变。
在美国硅谷,尼古拉斯·亚宁早上起来准备去上班,到公司需要40分钟车程。这位在Google工作的技术员走向他的Lexus汽车。汽车即将驶上加州拥挤的高速路,此时他的“司机”———汽车开始掌控大局。亚宁的这辆车是Google正在实验的自动驾驶汽车,安装有复杂的人工智能技术,使得他可以放松地坐在驾驶座上充当乘客。
在马萨诸塞州贝德福特的iRobot公司,一名参观者看着5英尺高的机器人爱娃小心翼翼地行走在大厅里,躲避着周围的障碍物———包括人类。今年年底它将开始自己的第一份真正工作———远程医疗助手,让数千英里之外的专家通过安装在它“头”上的视频屏幕给医院的病人看病。当医生准备看望下一位病人时,他只需点击电脑地图上的新位置。爱娃根据地图找到并赶往下一个病房,它还会自己乘坐电梯。
在华盛顿普尔曼,华盛顿州立大学的研究者们正在给“智能”房间安装上感应器,使之能够根据需要自动调节房间的光线,监控住户的一切活动,包括他们每天睡眠多少小时,锻炼多少分钟。听上去有点像是被监禁,但事实上,倡导者们认为这样的技术就像一个富有爱心的保姆:智能房屋可以帮助老年人,尤其是有身体或智力障碍的老人过上独立的生活。
从今年夏天在火星登陆的好奇号太空探测器,到仪表盘能够与人对话的汽车,再到智能手机,人工智能正在改变我们的生活———有时候以一种显而易见的方式,更多的时候,我们甚至没有意识到它的存在。人工智能让互联网搜索更加灵敏;将文本从一种语言翻译成另一种语言;在拥挤的交通中推荐最畅通的线路;帮助识别信用卡诈骗;告诉驾驶员什么时候越过了道路中央的分道线。
甚至连烤面包机也即将加入人工智能革命。你可以将一个面包放进去,用智能手机拍张照片,手机将把所有需要的信息传送给烤面包机,指导它如何将面包烤得恰到好处。
从某个方便说,人工智能几乎无处不在,从控制数码相机的光圈和快门速度的智能感应器,到干衣机中的温度和湿度探测器,再到汽车中的自动泊车功能。更复杂的应用还在源源不断地走出实验室。
三.人工智能的弊端
(一)关于人工智能超越人类智能的假说
人工智能只可以作为人类智能的补充,但是人工智能的发展速度远远超过人类智能的发展速度,即根据进化论来说人工智能的进化速度比人类智能进化得快许多。由于人工智能起步较低,故现在和人类智能有一定差距,但其表现出了在局部超越了人类智能的现状,让人有理由相信人工智能超越人类智能只是时间上的问题。
人工智能超越人类智能论据有:一是达尔文进化论;二是类比人类的创造性即由于人类智能的不断探索欲会把自己独有创造赋予人工智能,这会导致人工智能战胜人类智能;三是“量变质变定律”人工智能不断的在某些领域超越人类智能,最终将在质上战胜人类智能。
其代表人物有四川大学社科系教授王黔玲从世界观角度提出的“人工智能将超越人类智能”的论断。华东师范大学哲学系教授郦全民认为在好奇心的驱使下,在不前进就会落后的“象棋皇后”效应的作用下,人类不会停止对比自己先进的更高的智能系统的探索。而进化法则又不可违背,将使得进化之链朝着超越人类的方向发展。因此地球上出现超越人类的高智能物种是进化的必然。代维也大胆预测“人工智能将在不远的将来战胜人类智能,但会有自己的存在方式,不会对人类构成威胁”。约翰·麦卡锡——人工智能之父认为“没有理由相信我们不能写出一个能使电脑像人一样思考的公式。”斯蒂芬·霍金 说过“在我看来,如果非常复杂的化学分子可以在人体内活动并使人类产生智慧的话,那么太阳复杂的电子电路也可以使计算机以智能化的方式采取行动。”德国班贝克大学心理学教授德尔纳认为“有灵魂的机器是存在的。”
(二)人类退化的假说
从智能手机、自动驾驶汽车到医疗机器人,人工智能革命已经到来。人工智能让互联网搜索更加灵敏;将文本从一种语言翻译成另一种语言;在拥挤的交通中
第5 / 6页
推荐最畅通的线路;帮助识别信用卡诈骗等。虽然很多时候我们甚至没有意识到它的存在,但我们的生活却因它悄悄改变。人们总是趋向于安逸的生活,人工智能的出现满足了人们许多的需求,这会导致人们满足于享受当前的生活而忘记许多自己的本能。根据达尔文的进化学说,那些我们不在经常使用的本能会在生物的繁衍中逐渐的退化消失。人工智能化的发展,我们的衣食住行都可以有简单的解决方法,并且也越来越为人们所依赖。就像过去几千年我们没有电话手机,一样可以有自己的通讯方式,可是现在手机发展不过几十年,就没有几个人能离得开手机了。试想一下日益进入我们生活中的人工智能,等你习惯后还能离得开吗。如果有了人工智能,你什么都不用自己动手,那经过生物衍变,人类的未来还能剩下什么呢。经过退化衍变的人类还有什么能力呢。
四.结语
现阶段人工智能在专家系统,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学等方面都有许多的应用,并且范围越来越广,虽然看似都是促进科学发展的,但是我们得注意其使用的度,就像克隆的应用一样,具有双面性的东西在发展时都应该慎重考虑。人工智能智能作为一种工具被人类智能限定在一定的范围里发展,才能在保证其安全的条件下最大程度的为人类发挥作用。 参考文献:
【1】史忠植. 高级人工智能(第二版). 科学出版社, 2006.
【2】玛格丽特·博登,人工智能哲学,上海译文出版社2001-11-01
【3】 Russell S., Peter Norvig,人工智能——一种现代方法(第二版)北京:人民邮电出版社, 2004 【4】史忠植. 智能主体及其应用.科学出版社,2000.
【5】 叶世伟, 史忠植 译. 神经网络原理(Simon Haykin: Neural Networks) . 机械工业出版社,2004.
【6】蔡自兴,徐光佑,人工智能及其应用(第三版). 北京:清华大学出版社,2003年
【7】卢格尔,人工智能,机械工业出版社,2009-03-01
【8】CarolynAbate,人工智能改变生活,南方都市报,2012-09-30
【9】门泽尔,机器人的未来,上海辞书出版社,2002年
【10】钱学森,关于思维科学,上海人民出版社,1986
【11】钱铁云,人工智能是否可以超越人类智能?,科学社会与辩证法,2004
【12】代维,人工智能VS人类智能。20年后谁称雄,青年探索,2002
【13】姜长阳,人类正在退化,自然辨证法研究,2000年11期
只要谈及科技对人类的意义,有一个词语出语率颇高――“双刃剑”。即科技在给人们带来便捷、舒适和高质量生活的同时,也不可避免地会带来诸多弊端。在这种种弊端中,有看得见的,如环境污染;而更多的则是看不见的,如科技对文化的冲击。
有关科技的利与弊,近年来舆论界一直争论不休,莫衷一是。这一现象也直接反映在了高考语文试题中――连续几年的高考作文都涉及到这一话题,且有逐年增多的趋势。
据统计,在近几年高考作文中讨论最多的话题是“科技对文化(尤其是传统文化)的冲击”――即科技会不会对文化构成冲击?又会构成什么样的冲击?如2012年高考湖北卷作文题就提供了这样一则材料:
语文课堂上,老师在讲到杜甫《春望》“烽火连三月,家书抵万金”时,不无感慨地说:“可惜啊,我们现在已经很难见到家书了,书信这种形式恐怕要消失了。”学生甲:“没有啊,我上大学的表哥就经常给我写信,我觉得这种交流方式是不可替代的。”学生乙:“信息技术这么发达,打电话、发短信、写邮件更便捷,谁还用笔写信啊?”学生丙:“即使不用笔写信,也不能说明书信消失了,只不过是书信的形式变了。”学生丁:“要是这样说的话,改变的又何止是书信?社会发展了,科技进步了,很多东西都在悄然改变。”……
诚然,电话、短信、邮件在带给我们方便、快捷的同时,也消减了我们生活中的诗意。可是我们不妨思量一下,“云中谁寄锦书来”或许能带给我们诗意和遐想,可在“烽火连三月”的情况下,恐怕还是一条快捷的短信更让人放心。因此,我们要充分考虑到两者的得失,对如何处理好科技与文化的关系作出深刻的反思:是为了保存传统的美好而抱残守缺,还是为了方便快捷就抛弃传统?是在传统的树干上嫁接上时尚的枝条,还是在崭新的文化中打上旧补丁?笔者想:应该思考这类问题的绝不仅仅是我们的中学生,更有我们的决策者、我们的专家,甚至我们每一个普普通通的公民。反思永远强于抱怨,只有总结反思,才能使我们的下一步走得更好,走得更稳健,从而一步步接近我们理想中的伊甸园。
与此一脉相承的是2014年高考广东卷的作文题。所不同的是广东卷的材料放弃了书信与手机,取而代之的是黑白胶片与数码技术:
黑白胶片的时代,照片很少,只记录下人生的几个瞬间,在家人一次次的翻看中,它能唤起许多永不褪色的记忆。但照片渐渐泛黄,日益模糊。数码技术的时代,照片很多,记录着日常生活的点点滴滴,可以随时上传到网络与人分享。它从不泛黄,永不模糊,但在快速浏览与频繁更新中,值得珍惜的“点滴”也可能被稀释。
黑白胶片与数码技术就像尺素与短信、马车与高铁、书法与“键谈”、远足与网游、品茗与快餐,品评它们又岂是一个“利”字或“弊”字可以概括的?这当中,掺和有科技的因素,有文化的因素,有传统的因素,有心理习惯的因素……其实,人们最希望拥有的是现代科技的便捷加上传统文化的醇香,而这恰如鱼与熊掌,兼而得之实在不易。
高考作文涉及到的又一方面的话题是“科技对传统审美观念的冲击”。如2014年高考辽宁卷作文题提供了这样一则材料:
夜晚,祖孙二人倚窗远眺。“瞧万家灯火,大街通明,霓虹闪耀,真美!”男孩说,“要是没有电,没有现代科技,没有高楼林立,上哪儿看去?”老人颔首,又沉思摇头:“可惜满天繁星没有了。沧海桑田,转眼之间啊!当年那些祖先,山洞边点燃篝火,看月亮初升,星汉灿烂,他们欣赏的也许才是美景。”
读罢这则材料,笔者觉得:如果“当年那些祖先”能够“穿越”回来,即便他们依然认为篝火、明月、星汉是大自然中最美丽的景观,但他们还乐意栖居在山洞里燃着篝火欣赏那满天繁星吗?现代科技早已潜入到了人们的灵魂深处,纵然我们会偶尔生出几许怀旧的情愫,那不过是我们在内心珍存的原始记忆陨落时的惆怅,纵然我们心向往之,也未必愿意返璞归真。在现代社会中,像陶渊明、梭罗这些真正倾心于自然的隐者已经很难寻觅了。
高考作文所涉及的有关科技的材料,还触及到了近乎于“科幻”的话题。如2014年高考天津卷的作文材料,讲的是一则带有几分科幻色彩的故事,揭示了现代科技给人带来的“荒诞感”:
也许将来有这么一天,我们发明了一种智慧芯片,有了它,任何人都能古今中外无一不知,天文地理无所不晓。比如说,你在心里默念一声“物理”,人类有史以来有关物理的一切公式、定律便纷纷浮现出来,比老师讲的还多,比书本印的还全。你逛秦淮河时,脱口一句“旧时王谢堂前燕”,旁边卖雪糕的老大娘就接茬说“飞入寻常百姓家”,还慈祥地告诉你,这首诗的作者是刘禹锡,这时一个金发碧眼的外国小女孩抢着说,诗名《乌衣巷》,出自《全唐诗》365卷4117页……这将是怎样的情形啊!
不知道是否真的有那么一天,不知道这样的情形是否真的会出现,也不知道这样的情形出现究竟是喜是悲。
平心而论,科技带给我们的永远是利大于弊,否则我们绝不会视之为“第一生产力”,也不会有那么多仁人志士为科技献身,为科技发展不遗余力了。我们现在要探究的是在发展科技的同时怎样将它的负面效应降到最低,乃至使之成为促进文化传承与发展的助力;而不是因噎废食,视科技为文化的宿敌,甚至视若洪水猛兽――而承担这一重任的主力,将会是今天走上考场的一代青年。从这一意义上看,让他们先写这样的文章真的很有价值。想必“科技”这一话题在随后的高考作文中仍会有一定的地位。
随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!
图像识别技术研究综述
摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。
关键词:图像处理;图像识别;成像
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02
图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。
1 图像处理技术
图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。
1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。
2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。
3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。
4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。
5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。
2 图像识别技术
图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:
2.1 指纹识别
指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。
2.2 人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。
2.3 文字识别
文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。
3 结束语
人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。
参考文献:
[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.
[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.
[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.
[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.
[6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.
点击下页还有更多>>>图像识别技术论文
人脸识别是一个被广泛研究着的热门问题,大量的研究论文层出不穷,晓电晓受晓受晓晓晓多晓电晓米晓受晓联晓受晓零晓电晓受晓米晓多晓晓e少量惠量量e米惠d量晓晓受晓晓晓晓米晓晓多晓少米受在一定程度上有泛滥成“灾”之嫌。为了更好地对人脸识别研究的历史和现状进行介绍,本文将AFR的研究历史按照研究内容、技术芳珐等方面的特点大体划分为三个时间阶段,如表受所示。该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。下面对三个阶段的研究进展情况作简单介绍:
第一阶段(受惠米联年~受惠惠零年)
这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometricfeature based)的芳珐。这集中体现在人们对于剪影(Profile)的研究上,人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。人工神经网络也一度曾经被研究人员用于人脸识别问题中。较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。金出武雄于受惠少晓年在京都大学完成了第一篇AFR方面的博士论文,直到现在,作为卡内基-梅隆大学(CMU)机器人研究院的一名教授,仍然是人脸识别领域的活跃人物之一。他所在的研究组也是人脸识别领域的一支重要力量。总体而言,这一阶段是人脸识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。
第二阶段(受惠惠受年~受惠惠少年)
这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干伤业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。
美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特兰德(Pentland)提出的“特征脸”芳珐无疑是这一时期内最负盛名的人脸识别芳珐。其后的很多人脸识别技术都或多或少与特征脸有关系,现在特征脸已经与归一化的协相关量(NormalizedCorrelation)芳珐一道成为人脸识别的性能测试基准算法。
这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)于受惠惠电年左右做的一个对比实验,他们对比了基于结构特征的芳珐与基于模板匹配的芳珐的识别性能,并给出了一个比较确定的结论:模板匹配的芳珐优于基于特征的芳珐。这一导向性的结论与特征脸共同作用,基本中止了纯粹的基于结构特征的人脸识别芳珐研究,并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别芳珐的发展,使其逐渐成为主流的人脸识别技术。
贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别芳珐是这一时期的另一重要成果。该芳珐首先采用主成分分析(PrincipalComponent Analysis,PCA,亦即特征脸)对图像表观特征进行降维。在此基础上,采用线性判别分析(LinearDiscriminant Analysis, LDA)的芳珐变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。该芳珐目前仍然是主流的人脸识别芳珐之一,产生了很多不同的变种,比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别芳珐以及近期的一些基于核学习的改进策略。
麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上,提出了基于双子空间进行贝叶斯概率估计的人脸识别芳珐。该芳珐通过“作差法”,将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题,类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维,计算两个类别的类条件概率密度,最后通过贝叶斯决策(最大似然或者最大后验概率)的芳珐来进行人脸识别。
人脸识别中的另一种重要芳珐——弹性图匹配技术(Elastic GraphMatching,EGM) 也是在这一阶段提出的。其基本思想是用一个属性图来描述人脸:属性图的顶点代表面部关键特征点,其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换【受电】特征,称为Jet;边的属性则为不同特征点之间的几何关系。对任意输入人脸图像,弹性图匹配通过一种优化馊索策略来定位预先定义的若干面部关键特征点,同时提取它们的Jet特征,得到输入图像的属性图。最后通过计算其与已知人脸属性图的相似度来完成识别过程。该芳珐的优点是既保留了面部的全局结构特征,也对人脸的关键局部特征进行了建模。近来还出现了一些对该芳珐的扩展。
局部特征分析技术是由洛克菲勒大学(RockefellerUniversity)的艾提克(Atick)等人提出的。LFA在本质上是一种基于统计的低维对象描述芳珐,与只能提取全局特征而且不能保留局部拓扑结构的PCA相比,LFA在全局PCA描述的基础上提取的特征是局部的,并能够同时保留全局拓扑信息,从而具有更佳的描述和判别能力。LFA技术已伤业化为著名的FaceIt系统,因此后期没有发表新的学术进展。
由美国国防部反技术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。该项目包括三部分内容:资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。该项目分别于受惠惠联年,受惠惠多年和受惠惠米年组织了晓次人脸识别评测,几种最知名的人脸识别算法都参家了测试,极大地促进了这些算法的改进和实用化。该测试的另一个重要贡献是给出了人脸识别的进一步发展方向:光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。
柔性模型(Flexible Models)——包括主动形状模型(ASM)和主动表观模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。ASM/AAM将人脸描述为电D形状和纹理两个分离的部分,分别用统计的芳珐进行建模(PCA),然后再进一步通过PCA将二者融合起来对人脸进行统计建模。柔性模型具有良好的人脸合成能力,可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。柔性模型目前已被广泛用于人脸特征对准(FaceAlignment)和识别中,并出现了很多的改进模型。
总体而言,这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别伤业公司。从技术方案上看, 电D人脸图像线性子空间判别分析、统计表观模型、统计模式识别芳珐是这一阶段内的主流技术。
第三阶段(受惠惠量年~现在)
FERET’惠米人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的伤业系统进一步发展。为此,美国军方在FERET测试的基础上分别于电零零零年和电零零电年组织了两次伤业系统评测。
基奥盖蒂斯(Georghiades)等人提出的基于光照锥 (Illumination Cones) 模型的多姿态、多光照条件人脸识别芳珐是这一时期的重要成果之一,他们证明了一个重要结论:同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。为了能够从少量未知光照条件的人脸图像中计算光照锥,他们还对传统的光度立体视觉芳珐进行了扩展,能够在朗博模型、凸表面和远点光源假设条件下,根据未知光照条件的少幅同一视点图像恢复物体的晓D形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的晓幅已知光照条件的图像恢复物体表面的法向量方向),从而可以容易地合成该视角下任意光照条件的图像,完成光照锥的计算。识别则通过计算输入图像到每个光照锥的距离来完成。
以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。支持向量机是一个两类分类器,而人脸识别则是一个多类问题。通常有三种策略解决这个问题,即:类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。
布兰兹(Blanz)和维特(Vetter)等提出的基于晓D变形(晓D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别芳珐是这一阶段内一项开创性的工作。该芳珐在本质上属于基于合成的分析技术,其主要贡献在于它在晓D形状和纹理统计变形模型(类似于电D时候的AAM)的基础上,同时还采用图形学模拟的芳珐对图像采集过程的透视投影和光照模型参数进行建模,从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开,更家有利于人脸图像的分析与识别。Blanz的实验表明,该芳珐在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率,证明了该芳珐的有效性。
电零零受年的国际计算机视觉大会(ICCV)上,康柏研究院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特征和AdaBoost的实时人脸检测系统,在CIF格式上检测准正面人脸的速度达到了每秒受多帧以上。该芳珐的主要贡献包括:受)用可以快速计算的简单矩形特征作为人脸图像特征;电)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习芳珐;晓)采用了级联(Cascade)技术提高检测速度。目前,基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。这为后端的人脸识别提供了良好的基础。
沙苏哈(Shashua)等于电零零受年提出了一种基于伤图像【受晓】的人脸图像识别与绘制技术。该技术是一种基于特定对象类图像集合学习的绘制技术,能够根据训练集合中的少量不同光照的图像,合成任意输入人脸图像在各种光照条件下的合成图像。基于此,沙苏哈等还给出了对各种光照条件不变的人脸签名(Signature)图像的定义,可以用于光照不变的人脸识别,实验表明了其有效性。
巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的芳珐解析地证明了一个重要的结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。这不仅与先前的光照统计建模芳珐的经验实验结果相吻合,更进一步从理论上促进了线性子空间对象识别芳珐的发展。而且,这使得用凸优化芳珐来强制光照函数非负成为可能,为光照问题的解决提供了重要思路。
FERET项目之后,涌现了若干人脸识别伤业系统。美国国防部有关部门进一步组织了针对人脸识别伤业系统的评测FRVT,至今已经举办了两次:FRVT电零零零和FRVT电零零电。这两次测试一方面对知名的人脸识别系统进行了性能比较,例如FRVT电零零电测试就表明Cognitec, Identix和Eyematic三个伤业铲品遥遥领先于其他系统,而它们之间的差别不大。另一方面则全面总结了人脸识别技术发展的现状:较理想条件下(正面签证照),针对晓少联晓少人受电受,多量惠 幅图像的人脸识别(Identification)最高首选识别率为少晓%,人脸验证(Verification)的等错误率(EER【受联】)大约为米%。FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。例如,FRVT电零零电测试就表明:目前的人脸识别伤业系统的性能仍然对于室内外光照变化、姿态、时间跨度等变化条件非常敏感,大规模人脸库上的有效识别问题也很严重,这些问题都仍然需要进一步的努力。
总体而言,目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模芳珐、统计学习理论、基于Boosting【受多】的学习技术、基于晓D模型的人脸建模与识别芳珐等逐渐成为备受重视的技术发展趋势。
总而言之, 人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用。这些成果更家深了我们对于自动人脸识别这个问题的理解,尤其是对其挑战性的认识。尽管在海量人脸数据比对速度甚至精度方面,现有的自动人脸识别系统可能已经超过了人类,但对于复杂变化条件下的一般人脸识别问题,自动人脸识别系统的鲁棒性和准确度还远不及人类。这种差距产生的本质原因现在还不得而知,毕竟我们对于人类自身的视觉系统的认识还十分肤浅。但从模式识别和计算机视觉等学科的角度判断,这既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别),更可能意味着我们采用了不合适的人脸建模芳珐(人脸的内部表示问题),还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。但无论如何,赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想。相信随着研究的继续深入,我们的认识应该能够更家准确地逼近这些问题的正确答案。
人脸识别的优点:
人脸识别在社会上有很多好处,包括增加安全和保障,防止犯罪,减少人际交往。在某些情况下,它甚至可以帮助支持医疗工作。
(1)帮助寻找失踪的人
执法机构用面部识别来寻找失踪的人,他们也用它来寻找失踪的儿童。当面部识别与显示孩子几年后的样子的衰老软件相结合时,它甚至可以帮助找到失踪多年的人。
(2)保护企业免受盗窃
当小偷进入商店时,企业主使用面部识别软件和安全摄像头来识别已知或可疑的小偷。这种先发制人的安全措施有助于防止入店行窃。由于人们在知道自己被监视的情况下犯罪的可能性更小,这项技术也起到了威慑作用。
(3)加强安全措施
面部识别还有助于提高安全性和安全性。多年来,面部识别一直是机场安检的常规组成部分,有助于识别罪犯以及对航空公司和乘客的潜在威胁。
银行和其他机构也使用面部识别来防止欺诈,因为这项技术可以识别之前被指控犯罪的人,并向银行发出警报。如果面部识别技术标记了一名客户,银行就知道要仔细检查这个人在银行的业务。
(4)减少接触点的数量
与指纹等其他类型的安全措施相比,面部识别需要的人力资源更少。它也不需要身体接触或直接的人际互动。相反,它使用人工智能使其成为一个自动和无缝的过程。它还限制了开门和智能手机解锁、从ATM机取钱或执行其他通常需要PIN码、密码或钥匙的任务时的接触点。
(5)让购物更有效率
面部识别的便利性也超越了安全领域。不用现金或信用卡在商店购物,面部识别技术可以识别你的脸,并将商品记入你的账户。
(6)提高组织照片
面部识别还可以通过苹果或谷歌标记你云存储中的照片。这使得它更容易组织,查找和分享你的照片。它还在推荐Facebook上的标签方面发挥了作用。
(7)改善医疗
面部识别技术的一个令人惊讶的用途是检测遗传疾病。通过研究微妙的面部特征,在某些情况下,面部识别软件可以确定特定的基因突变是如何导致特定的综合症的。这项技术可能比传统的基因检测更快更便宜。
人脸识别的缺点:
与任何技术一样,使用面部识别也存在潜在的缺陷,比如对隐私的威胁、侵犯权利和个人自由、潜在的数据盗窃和其他犯罪。此外,由于技术上的缺陷,还存在出错的风险。
(1)威胁到个人和社会隐私
对个人隐私的威胁是面部识别技术的一个重大缺点。人们不喜欢他们的脸被记录并存储在数据库中,以供未知的未来使用。
隐私是一个大问题,一些城市,包括加州的旧金山和马萨诸塞州的剑桥,已经禁止执法部门使用实时面部识别监控。在这些情况下,警方可以使用个人拥有的监控视频设备录制的视频,但他们不能使用实时面部识别软件。
(2)侵犯人身自由
被面部识别技术记录和扫描,会让人觉得自己的行为总是被监视和判断。此外,警方还可以使用面部识别技术在虚拟犯罪队列中对数据库中的每个人进行识别,这就像在没有正当理由的情况下把你当作犯罪嫌疑人一样。
(3)侵犯了个人的权利
在一些个人自由有限的国家,通常使用面部识别来监视公民,逮捕那些被视为捣乱者。
(4)创建数据漏洞
人们还担心面部识别数据的存储,因为这些数据库有可能被攻破。
黑客曾侵入银行、警察部门和国防公司过去收集和使用的面部扫描数据库。
(5)为诈骗和其他犯罪提供机会
不法分子也可以利用面部识别技术对无辜受害者实施犯罪。他们可以收集个人的个人信息,包括从面部扫描中收集并存储在数据库中的图像和视频,来实施身份欺诈。
有了这些信息,小偷可以盗取受害者的信用卡和其他债务,或者以受害者的名义开立银行账户,甚至用受害者的身份建立犯罪记录。除了欺诈,坏人还可以使用面部识别技术骚扰或跟踪受害者。
例如,跟踪者可以对在公共场所拍摄的照片进行反向图像搜索,以收集受害者的信息,确定他们是谁,住在哪里。此外,由于技术犯罪比法律发展得更快,人们可能在该行为被视为犯罪之前就受害。
(6)技术是不完美的
面部识别并不完美。例如,它在识别女性和有色人种方面不如白人男性有效。这项技术依靠算法来进行面部匹配。这些算法对白人男性比其他群体更有效,因为数据库中白人男性的数据比女性和有色人种的数据更多。这在算法中造成了无意识的偏见。
(7)无辜的人可能会受到指控
错误肯定存在固有的危险。面部识别软件可能会错误地将某人识别为罪犯,从而导致逮捕。当你补充说,这项技术与有色人种之间的斗争增加了种族定性指控的可能性时,这个问题就变得令人恼火了。
(8)技术可以被愚弄
其他因素也会影响这项技术识别人脸的能力,包括摄像头角度、光线水平、图像或视频质量。人们戴上伪装或稍微改变他们的外表也可以摆脱面部识别技术。