文字识别研究现状论文

随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文，欢迎阅读!

图像识别技术研究综述

摘要：随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解，由于图像在成像时受到外部环境的影响，使得图像具有特殊性，复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词：图像处理;图像识别;成像

中图分类号：TP391 文献标识码：A 文章编号：1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像，是人类最重要的信息源，它是通过各种观测系统从客观世界中获得，具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展，图像处理技术的应用也越来越广泛，并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段，比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等，在这些应用中，都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理，着重强调图像与图像之间进行的交换，主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性，使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析，以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理，而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声，将原始图像编程适于计算机进行特征提取的形式，主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集，图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像，也包括一些动态图像，并可以将其转为数字图像，和文字、图形、声音一起存储在计算机内，显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强，图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化，数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分，使图像的主体结构更加明确，必须对图像进行改善，即图像增强。通过图像增强，以减少图像中的图像的噪声，改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量，使图像中的物体的轮廓更加清晰，细节更加明显。图像增强不考虑图像降质的原因，增强后的图像更加赏欣悦目，为后期的图像分析和图像理解奠定基础。

3)图像复原，图像复原也称图像恢复，由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊，为了提取比较清晰的图像需要对图像进行恢复，图像恢复主要采用滤波方法，从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建，该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩，数字图像的显著特点是数据量庞大，需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频，那么必须对图像进行编码和压缩。目前，图像压缩编码已形成国际标准，如比较著名的静态图像压缩标准JPEG，该标准主要针对图像的分辨率、彩色图像和灰度图像，适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列，因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术，图像分割是把图像分成一些互不重叠而又具有各自特征的子区域，每一区域是像素的一个连续集，这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位，然后把目标从背景中分离出来。目前，图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰，使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述，描述是用数字或者符号表示图像或景物中各个目标的相关特征，甚至目标之间的关系，最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时，可以采用模板匹配模型。在某些具体的应用中，图像识别除了要给出被识别对象是什么物体外，还需要给出物体所处的位置和姿态以引导计算初工作。目前，图像识别技术已广泛应用于多个领域，如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有：

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段，主要应用于身份验证。指纹识别是生物特征的一个部分，它具有不变性：一个人的指纹是终身不变的;唯一性：几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前，指纹识别技术与我们的现实生活紧密相关，如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别目前大多数人脸识别系统使用可见光或红外图像进行人脸识别，可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下，其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响，但由于红外线不能穿透玻璃，如果待识别的对象戴有眼镜，那么在图像识别时，眼部信息全部丢失，将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术，可以自动地把文字和其他信息分离出来，通过智能识别后输入计算机，用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档，如银行票据、文稿、各类公式和符号等自动录入，可以提供文字的处理效率，有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样，使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事，但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下，图像识别技术取得了一定的成功，但在复杂的环境下，仍面临着许多问题：如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准，以及算法本身存在一定的局限性，这使得图像识别的最终结果不十分精确等。

参考文献：

[1] 胡爱明，周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用，2003，39(7)：90—91.

[2] 胡学龙.数字图像处理[M].北京：电子工业出版社，2011.

[3] 范立南，韩晓微，张广渊.图像处理与模式识别[M].北京：科学出版社，2007.

[4] 晓慧，刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用，2009，1(29)：8.

[5] 陈良育，曾振柄，张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用，2005，25(7)：1629-1631.

[6] Sanderson C，Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33，Martigny，Swizerland，2002.

点击下页还有更多>>>图像识别技术论文

这不是你所问的答案,而是“语言符号是约定俗成的吗”的答案在中国的先秦和欧洲的古希腊时期，这个问题都曾经是哲学家们争论的焦点。东西方在那个时间大致相近的时代都出现了学术上的百家争鸣。那个时代的学术气象宏大，崇尚追求真理的精神，所以人类语言的发生也是哲学家们所关注的。当时东西方就都有本质说和约定说两种主张。到了近代资本主义发展的前期，十七八世纪，欧洲还出现过与语言符号问题实为一体的语言起源问题的争论，它甚至是学界关注的焦点。1769年，柏林普鲁士皇家科学院甚至决定设立专项奖来征求有关语言起源问题的最佳解答，来自欧洲各国的数十名学者参加了竞争……在中国，与此大致相当的时期，清代乾嘉时期及其后的学者们，也从实学的角度再次进入语言符号即音义关系问题。但是，从十九世纪起，欧洲的许多语言学家就拒绝再讨论语言起源问题，因为他们认为这个问题的答案无法得到证实。奇怪的是，他们一方面认为语言起源问题的答案无法证实，一方面却在学术界承认一种答案：语言发生时语言符号是约定即任意的。而且成为一个原则，没有人反对！现代语言学之父索绪尔说：“曾几何时，人们把名称派分给事物，在概念和音响形象之间订立了一种契约———这种行为是可以设想的，但是从来没有得到证实。我们对符号的任意性有一种非常敏感的感觉，这使我们想到事情可能是这样。”语言符号的任意性，这种从来没有得到证实，只是想当然以为应该是这样的东西，成了语言符号的头等重要的特征和关于语言符号的第一原则。是否可以说，从拒绝讨论语言是怎么发生的，到想当然地认为语言之初语言符号是约定的，以之为语言符号的第一原则，不但是缺乏追求真理的精神，而且是缺乏科学的严谨？我总不明白，语言发生时语言符号是怎么约定的？因为“约定”就必须使用语言，那么这最早的、用来“约定”的语言是怎么来的？否则难道“约定”是打手势？约定俗成是一种社会行为，因此它还得有一个假设作前提，即语言是在人类社会的某一个时间内才产生的，而不是随着从动物到人的漫长的进化而慢慢不断协调、调整、演变、完满、丰富起来的。单就这一点就很让人疑惑，因为我们会问，语言符号约定之前，人或人之前的猴子是怎么交流思想的？如果一开始不是用语言而是用另一种方式，那么后来是怎么突变，换成另一种交流工具即发声语言的？语言的生理机制难道是突然发达起来的吗？如果人类语言发明之前一直没有语言的交流，语言的生理机制如何进化，大脑的思维能力又如何发展？语言难道是一开始就像人们所理解的人类语言那样完满的吗？如果一开始就有语言，那么它就应当是从猴子最初的叫喊开始的，是与动物和人的心智本能联系的而不是人类社会约定的。从动物到人类，是一个渐变的过程，其语言是演变进化的。我的这些疑问，有传统语言学与近现代西方语言学不同主张碰撞的背景。汉代以来，中国的传统语言文字学，在词义上有非常深入的研究，形成对词的声音(即“名”)与词的意义(涉及“实”)之间的复杂关系的独特认识。他们不是主要在理论层面上讨论名实之间是本质关系还是约定关系，却在具体词义的研究中进入音义关系领域，触及语言的起源问题。这在清代乾嘉时代形成学术的高峰，其精华培育出了清末民初章太炎黄侃刘师培等国学大师。他们以丰富的文献语言材料为根柢，继承和发扬两千年来学术传统的精华，借鉴了印度古代语言学的理论，提出、论述了声音和意义有密切关系的主张，本可以得到弘扬光大，建设有自己特色的中国现代语义学。然而，在西学东渐中，语言学界主流将语言符号的约定说作为现代先进理论引进，奉为圭臬，然后引荀子的“约定俗成”相呼应(其实荀子的“约定俗成”是指后王之成名，而不是指语言之初)。传统词义研究的学术主张遂被轻视、废置。中国的传统语言学，本来在意义研究上是最有成就的，而其核心正是音义关系即语言符号研究。在吸收了西方语言学理论，把“约定俗成”奉为不可逾越的信条之后，意义的研究落到语音、语法甚至文字研究的后面，成为最不发达的学科，其中是否有取彼之短抑己之长的原因？上大学以来，我读清人词义研究著作，虽然其中很少理论的阐述，却在大量的材料中贯串理论主张，让人只要读进去就得承认名实关系并非偶然。于是，我一方面读着本民族的语言材料和传统语言学专著，感受着名实关系的复杂性，一方面却受着引进的现代语言学理论的指导，被灌输以语言符号的约定说。但是，我读清人和章黄著作“中毒”太深，而且很不理解，以西人追求真理的勇气和思想解放的程度，怎么就让这种不加证明的观点成为第一原则而皆无异议呢？在我的学位论文中，虽然没有直接触及语言起源的禁区，而讨论的所有问题，却结结实实地构成向那个方向讨答案的通道。针对约定俗成说成为“共识”的现状，我写道：“哪一种说法要作为定论都为时尚早。” 揣着上述看法，赫尔德的《论语言的起源》引起我的注意是必然的。书的第一句话说：“当人还是动物的时候，就已经有了语言。”这句话就足以让我看上了它。那是在2001年春季图书订货会上，作为陈列品，它不卖，这让我专程到读者服务部去了一趟。赫尔德认为有这样一条自然规律：“我们面前存在着一个有感觉的动物，它不可能把它的任何生动感受禁闭在自身之中；即使不具任何意志和目的，它从一开始就必须把每一种感受用声音表达出来。”人类的声音是与他的感受直接联系的！他还说：“存在着一种感觉的语言，它是自然规律的直接结果。”即语言是自然规律作用的结果。“当人处在他所独有的悟性状态之中，而这一悟性(思考能力[rflexion])初次自由地发挥了作用，他就发明了语言。”语言是由人类所独有的悟性发挥作用而发明的。而悟性当是心智能力对自然客观事物和规律的本能感受。“……这第一个被意识到的特征就是心灵的词！与词一道，语言就被发明了。”心智所意识到的是特征！就是说，人所感受到的不是事物本质属性而是事物特征。“人类思维的所有这些痕迹都刻在了最早的名称上面！”感受经过了思维而发为声音！……这些意见跟我们传统语言学关于语言符号的认识何其相近！请看西方语言学的另一些理论还没有主导我国词汇研究时，我们本土的理论是怎么说的。在清代戴震、段玉裁、王念孙、郝懿行等大师对大量古代文献语言的音义关系进行研究的基础上，清代黄承吉说：“人之生也，凡一声皆为一情，则即是一义。”陈澧说：“声者，肖乎意而生者也。”章太炎演绎荀子“凡同类同情者，其天官之意物也同”的主张，认为名称的命定，是从五官的感受开始，传于心中形成心像，心中的感觉要用声音表现，作成名称，即名称的产生是经过对客观的感受——心中对事物特征的取像——所取的心像表现为声音等过程。这些都是对语言起源的探讨，而都逼近本能说。作为对语言起源的论证，赫尔德不是像中国的学者那样以材料的丰富明理，而是以哲理和雄辩取胜，他的才气折服了在观点上不同意见的评委，文章获得科学院奖并成为惟一被指定出版的一篇。赫尔德提出语言的发明是人类的本能，来批驳语言神授说。他的根据是，人感受到事物特征就会自然地发出声音，把每一种感受用声音表达出来，就发明了语言。因为语言起源与语言符号问题的同一性，他在语言起源问题的讨论中，指出语言符号是由感受自然发出的，不是什么约定俗成的！这跟两千年来中国传统语言学从大量语言材料出发进行的语源学研究所得的结论极相近。我不明白，赫尔德这么些清新活泼、思辨性强的思想，为什么会被实证主义闷杀，而大家甘心遵奉约定说。革命的思想哪里去了？追求真理的精神哪里去了？我一向钦敬西方学术中的活泼、敏锐、求真，这一点却让我感到他们的学术中也有不可信的东西。所以，我引赫尔德的话并没有“引经据典”的意思——不能引一个西人的主张以证明另一批西人的主张之非，而是钦敬他的革命性思想和自由活泼的思维，敢于向成说挑战的精神。真理是需要辩论的，学术不能拒绝辩论。赫尔德的出发点是反对神授说，他有一种革命的精神，而十九世纪的拒绝讨论就导致保守，无怪乎会信奉约定说。不要把西方的约定说奉为圣经，这是我读赫尔德最有心得的地方。至于他的具体观点与我们传统的观点可以相发明，则是居其次的。赫尔德也有矛盾的地方。他为批驳神授说，提出“当人还是动物的时候，就已经有了语言”。同时，他为了批驳约定说，提出人的悟性一开始就处于完备状态，足以发明语言。前者本来可以说明语言是随着从动物到人类的演化而演进的，后者则说明语言是人在有悟性即成为人之后而发明的。那么，人还是动物时的语言，是不是后来突然中断，被代之以人成为人之后的即悟性所发明的语言呢？这种中断和突变是可能的吗？其实，语言(包括它所含有的思想)是随着从动物到人的物种演进而演进、发达、丰富的，同时，悟性(包括理性、思维能力)也是随着动物到人的进化而演进、发达的。总之，在进化中动物与人之间没有一条判然分别的分界线。（《论语言的起源》，[德].赫尔德著，姚小平译，商务印书馆，1999年）

研究课题申报中“目前的研究状况”是指研究课题目前国内外有些什么研究成果，以及对这些成果的观点综述。写国内外研究现状应注意：

1、文中反映最新研究成果。预期成果一般是论文或调查（实验）报告等形式。成果表达方式是通过文字、图片、实物和多媒体等形式来表现。

2、如果没有与毕业论文选题直接相关的文献，选择一些与毕业论文选题比较靠近的内容来写。另外，还应提出该课题目前已做了哪些工作，还存在哪些困难和问题，在哪些方面需要得到学校和老师帮助等。

写研究状况方法

1、研究背景研究背景即提出问题，阐述研究该课题的原因。研究背景包括理论背景和现实需要。还要综述国内外关于同类课题研究的现状。

2、目的意义目的意义是指通过该课题研究将解决什么问题（或得到什么结论），而这一问题的解决（或结论的得出）有什么意义。有时将研究背景和目的意义合二为一。

3、成员分工成员分工应是指课题组成员在研究过程中所担负的具体职责，要人人有事干、个个担责任。组长负责协调、组织。

4、实施计划实施计划是课题方案的核心部分，它主要包括研究内容、研究方法和时间安排等。研究内容是指可操作的东西，一般包括：研究方向；子课题（数目和标题）；与研究方案有关的内容，即要通过什么、达到什么等等；研究方法要写明是文献研究还是实验、调查研究。

5、可行性论证可行性论证是指课题研究所需的条件，即研究所需的信息资料、实验器材、研究经费、学生的知识水平和技能及教师的指导能力。

姓名:吴兆阳学号: 转自机器人学习研究会嵌牛导读:OCR（Optical Character Recognition，光学字符识别）的概念早于1920年代便被提出，一直是模式识别领域中重要的研究方向。近年来，随着移动设备的快速更新迭代，以及移动互联网的快速发展，使得OCR有更为广泛的应用场景，从以往的扫描文件的字符识别，到现在应用到自然场景中图片文字的识别，如识别身份证、银行卡、门牌、票据及各类网络图片中的文字。嵌牛鼻子:ORC技术嵌牛提问:什么是ORC，如何使用？嵌牛正文: 以深度学习兴起的时间为分割点，直至近五年之前，业界最为广泛使用的仍然是传统的OCR识别技术框架，而随着深度学习的崛起，基于这一技术的OCR识别框架以另外一种新的思路迅速突破了原有的技术瓶颈（如文字定位、二值化和文字分割等），并已在工业界得到广泛应用。笔者针对业务中的身份证照片文字识别需求分别尝试了传统OCR识别框架及基于深度学习的OCR识别框架。下面就以身份证文字识别为例分别简要介绍两种识别框架。传统OCR技术框架如上图所示，传统OCR技术框架主要分为五个步骤：首先文本定位，接着进行倾斜文本矫正，之后分割出单字后，并对单字识别，最后基于统计模型（如隐马尔科夫链，HMM）进行语义纠错。可按处理方式划分为三个阶段：预处理阶段、识别阶段和后处理阶段。其中关键在于预处理阶段，预处理阶段的质量直接决定了最终的识别效果，因此这里详细介绍下预处理阶段。预处理阶段中包含了三步：定位图片中的文字区域，而文字检测主要基于连通域分析的方法，主要思想是利用文字颜色、亮度、边缘信息进行聚类的方式来快速分离文字区域与非文字区域，较为流行的两个算法分别是：最大极值稳定区域(MSER)算法及笔画宽度变换(SWT)算法，而在自然场景中因受到光照强度、图片拍摄质量和类文字背景的干扰，使得检测结果中包含非常多的非文字区域，而目前从候选区域区分出真正文字区域主要两种方法，用规则判断或轻量级的神经网络模型进行区分；文本区域图像矫正，主要基于旋转变换和仿射变换；行列分割提取出单字，这一步利用文字在行列间存在间隙的特征，通过二值化并在投影后找出行列分割点，当在文字与背景的区分度较好时，效果很好，而拍摄的图片中光照、摄像质量的影响，并且文字背景难以区分时，常造成错误分割的情况。下面介绍基于传统OCR框架处理身份证文字识别：身份证识别技术流程与上述框架稍微有所差异。对该问题，已知先验信息：a.证件长宽固定；b.字体及大小一致；c.文本相对于证件位置固定；d.存在固定文字。因此，处理该问题的思路为：先定位目标物体（证件），矫正后提取文字进行识别，最后进行语义纠错，如下图：目标物体定位并矫正。基于现有的先验信息，定位最后的方法为采用模板关键点特征匹配的方法，并利用模板上特征点及目标图像特征点坐标之间的关系进行透视变换，以定位目标物体，如下图所示。接着，基于四角的坐标，进行旋转、仿射、尺寸的变换，并提取出目标物体的俯视图。因文字位置相对固定，接着便分割出文字区域，二值化后，行列分割出单个字符。这里的技术难点在于二值化，二值化效果的好坏直接影响字符分割，并最终影响识别结果。受光照和拍摄质量的影响，全局二值化难以设置统一的阈值，而自适应二值化算法易受到阴影及模糊边界的干扰。所以在这边尝试过许多方法，测试下来未发现在任何情形下效果都满足要求的方法。分割出单字后接着用分类器进行识别，并在这步基于统计上的先验信息定义了一个简单的优化函数，可看做1-gram语言模型。先验信息为：2400（总共660273）汉字的使用频率之和为99%以上。定义的优化函数为：式中，Pi为该字出现的概率，confi为置信度值。下图给出了示例：因上述的优化过程中假定各状态相互独立并与上一状态没有联系，故不可避免存在语义上的错误。而如何基于现有的输出序列，对序列进行语义上的修正，那么最直观的想法就是用隐马尔可夫模型（Hidden Markov Model，HMM）解决这个问题，其基于观察序列，求出最优隐序列。其可以抽象为如下图的过程。在给定O序列情况下，通过维特比算法，找出最优序列S：传统OCR冗长的处理流程以及大量人工规则的存在，使得每步的错误不断累积，而使得最终识别结果难以满足实际需求。接下来讨论基于深度学习的OCR。基于深度学习的OCR识别框架目前，从技术流程上来说，主要分为两步，首先是检测出图像中的文本行，接着进行序列识别。可见，基于深度学习的OCR识别框架相比于传统OCR识别框架，减少了三个步骤，降低了因误差累积对最终识别结果的影响。文本行检测，其又可分为水平行文字检测算法与倾斜文字行检测算法。这里主要介绍下Tian提出算法CTPN，其算法框架如下图。主要思路是将文本行识别看做一个序列识别问题，不同于一般的目标检测问题，引入RNN来利用上下文的信息。具体流程为：用VGG16的5个卷积层得到特征图（feature map，W*H*C）；在Conv5的feature map的每个位置上取3*3*C的窗口的特征，这些特征将用于预测该位置k个anchor（anchor的定义和Faster RCNN类似）对应的类别信息，位置信息；将每一行的所有窗口对应的3*3*C的特征（W*3*3*C）输入到RNN（BLSTM）中，得到W*256的输出；将RNN的W*256输入到512维的fc层； fc层特征输入到三个分类或者回归层中。第二个2k scores 表示的是k个anchor的类别信息（是字符或不是字符）。第一个2k vertical coordinate和第三个k side-refinement是用来回归k个anchor的位置信息。2k vertical coordinate表示的是bounding box的高度和中心的y轴坐标（可以决定上下边界），k个side-refinement表示的bounding box的水平平移量。这边注意，只用了3个参数表示回归的bounding box，因为这里默认了每个anchor的width是16，且不再变化（VGG16的conv5的stride是16）。回归出来的box如中那些红色的细长矩形，它们的宽度是一定的；用简单的文本线构造算法，把分类得到的文字的proposal（图（b）中的细长的矩形）合并成文本线。上图为给出基于CTPN的例子，框线部分是算法识别出的文字行，可见在图片光照不均、人工合成及文字背景对比不明显的情形下均有很好的效果。相比于传统文字定位方法，具有更好的鲁棒性及明显的优势。文字行识别。近两年比较受关注的主要有两种，一种是CNN+RNN+CTC的方法，另外一种是用attention model+CNN+RNN的方法。这里主要介绍下CNN+RNN+CTC，算法框架由图给出。分为三层，CNN层、RNN层及解码（transcription）层。在CNN层，用于提取图像特征，利用Map-to-Sequence表示成特征向量；在RNN层，用双向LSTM识别特征向量，得到每列特征的概率分布；在解码层，利用CTC和前向后向算法求解最优的label序列。因此，该方法能够识别不定长的文字行。两个例子： Out：辽宁省长海县广鹿乡沙尖 Out：河南省邓州市九龙乡姚营

人脸识别研究现状的论文

随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文，欢迎阅读!

图像识别技术研究综述

摘要：随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解，由于图像在成像时受到外部环境的影响，使得图像具有特殊性，复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词：图像处理;图像识别;成像

中图分类号：TP391 文献标识码：A 文章编号：1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像，是人类最重要的信息源，它是通过各种观测系统从客观世界中获得，具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展，图像处理技术的应用也越来越广泛，并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段，比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等，在这些应用中，都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理，着重强调图像与图像之间进行的交换，主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性，使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析，以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理，而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声，将原始图像编程适于计算机进行特征提取的形式，主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集，图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像，也包括一些动态图像，并可以将其转为数字图像，和文字、图形、声音一起存储在计算机内，显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强，图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化，数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分，使图像的主体结构更加明确，必须对图像进行改善，即图像增强。通过图像增强，以减少图像中的图像的噪声，改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量，使图像中的物体的轮廓更加清晰，细节更加明显。图像增强不考虑图像降质的原因，增强后的图像更加赏欣悦目，为后期的图像分析和图像理解奠定基础。

3)图像复原，图像复原也称图像恢复，由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊，为了提取比较清晰的图像需要对图像进行恢复，图像恢复主要采用滤波方法，从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建，该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩，数字图像的显著特点是数据量庞大，需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频，那么必须对图像进行编码和压缩。目前，图像压缩编码已形成国际标准，如比较著名的静态图像压缩标准JPEG，该标准主要针对图像的分辨率、彩色图像和灰度图像，适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列，因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术，图像分割是把图像分成一些互不重叠而又具有各自特征的子区域，每一区域是像素的一个连续集，这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位，然后把目标从背景中分离出来。目前，图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰，使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述，描述是用数字或者符号表示图像或景物中各个目标的相关特征，甚至目标之间的关系，最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时，可以采用模板匹配模型。在某些具体的应用中，图像识别除了要给出被识别对象是什么物体外，还需要给出物体所处的位置和姿态以引导计算初工作。目前，图像识别技术已广泛应用于多个领域，如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有：

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段，主要应用于身份验证。指纹识别是生物特征的一个部分，它具有不变性：一个人的指纹是终身不变的;唯一性：几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前，指纹识别技术与我们的现实生活紧密相关，如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别目前大多数人脸识别系统使用可见光或红外图像进行人脸识别，可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下，其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响，但由于红外线不能穿透玻璃，如果待识别的对象戴有眼镜，那么在图像识别时，眼部信息全部丢失，将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术，可以自动地把文字和其他信息分离出来，通过智能识别后输入计算机，用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档，如银行票据、文稿、各类公式和符号等自动录入，可以提供文字的处理效率，有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样，使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事，但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下，图像识别技术取得了一定的成功，但在复杂的环境下，仍面临着许多问题：如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准，以及算法本身存在一定的局限性，这使得图像识别的最终结果不十分精确等。

参考文献：

[1] 胡爱明，周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用，2003，39(7)：90—91.

[2] 胡学龙.数字图像处理[M].北京：电子工业出版社，2011.

[3] 范立南，韩晓微，张广渊.图像处理与模式识别[M].北京：科学出版社，2007.

[4] 晓慧，刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用，2009，1(29)：8.

[5] 陈良育，曾振柄，张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用，2005，25(7)：1629-1631.

[6] Sanderson C，Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33，Martigny，Swizerland，2002.

点击下页还有更多>>>图像识别技术论文

人脸识别是一个被广泛研究着的热门问题，大量的研究论文层出不穷，在一定程度上有泛滥成“灾”之嫌。

为了更好地对人脸识别研究的历史和现状进行介绍，本文将AFR的研究历史按照研究内容、技术方法等方面的特点大体划分为三个时间阶段，如表1所示。

该表格概括了人脸识别研究的发展简史及其每个历史阶段代表性的研究工作及其技术特点。

下面对三个阶段的研究进展情况作简单介绍：

第一阶段(1964年~1990年)

这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究，所采用的主要技术方案是基于人脸几何结构特征(Geometricfeature based)的方法。

这集中体现在人们对于剪影(Profile)的研究上，人们对面部剪影曲线的结构特征提取与分析方面进行了大量研究。

人工神经网络也一度曾经被研究人员用于人脸识别问题中。

较早从事AFR研究的研究人员除了布莱索(Bledsoe)外还有戈登斯泰因(Goldstein)、哈蒙(Harmon)以及金出武雄(Kanade Takeo)等。

金出武雄于1973年在京都大学完成了第一篇AFR方面的博士论文，直到现在，作为卡内基-梅隆大学(CMU)机器人研究院的一名教授，仍然是人脸识别领域的活跃人物之一。

他所在的研究组也是人脸识别领域的一支重要力量。

总体而言，这一阶段是人脸识别研究的初级阶段，非常重要的成果不是很多，也基本没有获得实际应用。

第二阶段(1991年~1997年)

这一阶段尽管时间相对短暂，但却是人脸识别研究的 *** 期，可谓硕果累累：不但诞生了若干代表性的人脸识别算法，美国军方还组织了著名的FERET人脸识别算法测试，并出现了若干商业化运作的人脸识别系统，比如最为著名的Visionics(现为Identix)的FaceIt系统。

美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特兰德(Pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。

其后的很多人脸识别技术都或多或少与特征脸有关系，现在特征脸已经与归一化的协相关量(NormalizedCorrelation)方法一道成为人脸识别的性能测试基准算法。

这一时期的另一个重要工作是麻省理工学院人工智能实验室的布鲁内里(Brunelli)和波基奥(Poggio)于1992年左右做的一个对比实验，他们对比了基于结构特征的方法与基于模板匹配的方法的识别性能，并给出了一个比较确定的结论：模板匹配的方法优于基于特征的方法。

这一导向性的结论与特征脸共同作用，基本中止了纯粹的基于结构特征的人脸识别方法研究，并在很大程度上促进了基于表观(Appearance-based)的线性子空间建模和基于统计模式识别技术的人脸识别方法的发展，使其逐渐成为主流的人脸识别技术。

贝尔胡米尔(Belhumeur)等提出的Fisherface人脸识别方法是这一时期的另一重要成果。

该方法首先采用主成分分析(Principalponent Analysis，PCA，亦即特征脸)对图像表观特征进行降维。

在此基础上，采用线性判别分析(LinearDiscriminant Analysis, LDA)的方法变换降维后的主成分以期获得“尽量大的类间散度和尽量小的类内散度”。

该方法目前仍然是主流的人脸识别方法之一，产生了很多不同的变种，比如零空间法、子空间判别模型、增强判别模型、直接的LDA判别方法以及近期的一些基于核学习的改进策略。

麻省理工学院的马哈丹(Moghaddam)则在特征脸的基础上，提出了基于双子空间进行贝叶斯概率估计的人脸识别方法。

该方法通过“作差法”，将两幅人脸图像对的相似度计算问题转换为一个两类(类内差和类间差)分类问题，类内差和类间差数据都要首先通过主成分分析(PCA)技术进行降维，计算两个类别的类条件概率密度，最后通过贝叶斯决策(最大似然或者最大后验概率)的方法来进行人脸识别。

人脸识别中的另一种重要方法——弹性图匹配技术(Elastic GraphMatching，EGM) 也是在这一阶段提出的。

其基本思想是用一个属性图来描述人脸：属性图的顶点代表面部关键特征点，其属性为相应特征点处的多分辨率、多方向局部特征——Gabor变换[12]特征，称为Jet;边的属性则为不同特征点之间的几何关系。

对任意输入人脸图像，弹性图匹配通过一种优化搜索策略来定位预先定义的若干面部关键特征点，同时提取它们的Jet特征，得到输入图像的属性图。

最后通过计算其与已知人脸属性图的相似度来完成识别过程。

该方法的优点是既保留了面部的全局结构特征，也对人脸的关键局部特征进行了建模。

近来还出现了一些对该方法的扩展。

局部特征分析技术是由洛克菲勒大学(RockefellerUniversity)的艾提克(Atick)等人提出的。

LFA在本质上是一种基于统计的低维对象描述方法，与只能提取全局特征而且不能保留局部拓扑结构的PCA相比，LFA在全局PCA描述的基础上提取的特征是局部的，并能够同时保留全局拓扑信息，从而具有更佳的描述和判别能力。

LFA技术已商业化为著名的FaceIt系统，因此后期没有发表新的学术进展。

由美国国防部反毒品技术发展计划办公室资助的FERET项目无疑是该阶段内的一个至关重要的事件。

FERET项目的目标是要开发能够为安全、情报和执法部门使用的AFR技术。

该项目包括三部分内容：资助若干项人脸识别研究、创建FERET人脸图像数据库、组织FERET人脸识别性能评测。

该项目分别于1994年，1995年和1996年组织了3次人脸识别评测，几种最知名的人脸识别算法都参加了测试，极大地促进了这些算法的改进和实用化。

该测试的另一个重要贡献是给出了人脸识别的进一步发展方向：光照、姿态等非理想采集条件下的人脸识别问题逐渐成为热点的研究方向。

柔性模型(Flexible Models)——包括主动形状模型(ASM)和主动表观模型(AAM)是这一时期内在人脸建模方面的一个重要贡献。

ASM/AAM将人脸描述为2D形状和纹理两个分离的部分，分别用统计的方法进行建模(PCA)，然后再进一步通过PCA将二者融合起来对人脸进行统计建模。

柔性模型具有良好的人脸合成能力，可以采用基于合成的图像分析技术来对人脸图像进行特征提取与建模。

柔性模型目前已被广泛用于人脸特征对准(FaceAlignment)和识别中，并出现了很多的改进模型。

总体而言，这一阶段的人脸识别技术发展非常迅速，所提出的算法在较理想图像采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能，也因此出现了若干知名的人脸识别商业公司。

从技术方案上看， 2D人脸图像线性子空间判别分析、统计表观模型、统计模式识别方法是这一阶段内的主流技术。

第三阶段(1998年~现在)

FERET’96人脸识别算法评估表明：主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。

因此，光照、姿态问题逐渐成为研究热点。

与此同时，人脸识别的商业系统进一步发展。

为此，美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。

基奥盖蒂斯(Gehiades)等人提出的基于光照锥 (Illumination Cones) 模型的多姿态、多光照条件人脸识别方法是这一时期的重要成果之一，他们证明了一个重要结论：同一人脸在同一视角、不同光照条件下的所有图像在图像空间中形成一个凸锥——即光照锥。

为了能够从少量未知光照条件的人脸图像中计算光照锥，他们还对传统的光度立体视觉方法进行了扩展，能够在朗博模型、凸表面和远点光源假设条件下，根据未知光照条件的7幅同一视点图像恢复物体的3D形状和表面点的表面反射系数(传统光度立体视觉能够根据给定的3幅已知光照条件的图像恢复物体表面的法向量方向)，从而可以容易地合成该视角下任意光照条件的图像，完成光照锥的计算。

识别则通过计算输入图像到每个光照锥的距离来完成。

以支持向量机为代表的统计学习理论也在这一时期内被应用到了人脸识别与确认中来。

支持向量机是一个两类分类器，而人脸识别则是一个多类问题。

通常有三种策略解决这个问题，即：类内差/类间差法、一对多法(one-to-rest)和一对一法(one-to-one)。

布兰兹(Blanz)和维特(Vetter)等提出的基于3D变形(3D Morphable Model)模型的多姿态、多光照条件人脸图像分析与识别方法是这一阶段内一项开创性的工作。

该方法在本质上属于基于合成的分析技术，其主要贡献在于它在3D形状和纹理统计变形模型(类似于2D时候的AAM)的基础上，同时还采用图形学模拟的方法对图像采集过程的透视投影和光照模型参数进行建模，从而可以使得人脸形状和纹理等人脸内部属性与摄像机配置、光照情况等外部参数完全分开，更加有利于人脸图像的分析与识别。

Blanz的实验表明，该方法在CMU-PIE(多姿态、光照和表情)人脸库和FERET多姿态人脸库上都达到了相当高的识别率，证明了该方法的有效性。

2001年的国际计算机视觉大会(ICCV)上，康柏研究院的研究员维奥拉(Viola)和琼斯(Jones)展示了他们的一个基于简单矩形特征和AdaBoost的实时人脸检测系统，在CIF格式上检测准正面人脸的速度达到了每秒15帧以上。

该方法的主要贡献包括：1)用可以快速计算的简单矩形特征作为人脸图像特征;2)基于AdaBoost将大量弱分类器进行组合形成强分类器的学习方法;3)采用了级联(Cascade)技术提高检测速度。

目前，基于这种人脸/非人脸学习的策略已经能够实现准实时的多姿态人脸检测与跟踪。

这为后端的人脸识别提供了良好的基础。

沙苏哈(Shashua)等于2001年提出了一种基于商图像[13]的人脸图像识别与绘制技术。

该技术是一种基于特定对象类图像集合学习的绘制技术，能够根据训练集合中的少量不同光照的图像，合成任意输入人脸图像在各种光照条件下的合成图像。

基于此，沙苏哈等还给出了对各种光照条件不变的人脸签名(Signature)图像的定义，可以用于光照不变的人脸识别，实验表明了其有效性。

巴斯里(Basri)和雅各布(Jacobs)则利用球面谐波(Spherical Harmonics)表示光照、用卷积过程描述朗博反射的方法解析地证明了一个重要的结论：由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间。

这意味着一个凸的朗博表面物体在各种光照条件下的图像集合可以用一个低维的线性子空间来近似。

这不仅与先前的光照统计建模方法的经验实验结果相吻合，更进一步从理论上促进了线性子空间对象识别方法的发展。

而且，这使得用凸优化方法来强制光照函数非负成为可能，为光照问题的解决提供了重要思路。

FERET项目之后，涌现了若干人脸识别商业系统。

美国国防部有关部门进一步组织了针对人脸识别商业系统的评测FRVT，至今已经举办了两次：FRVT2000和FRVT2002。

这两次测试一方面对知名的人脸识别系统进行了性能比较，例如FRVT2002测试就表明Cognitec, Identix和Eyematic三个商业产品遥遥领先于其他系统，而它们之间的差别不大。

另一方面则全面总结了人脸识别技术发展的现状：较理想条件下(正面签证照)，针对37437人121,589 幅图像的人脸识别(Identification)最高首选识别率为73%，人脸验证(Verification)的等错误率(EER[14])大约为6%。

FRVT测试的另一个重要贡献是还进一步指出了目前的人脸识别算法亟待解决的若干问题。

例如，FRVT2002测试就表明：目前的人脸识别商业系统的性能仍然对于室内外光照变化、姿态、时间跨度等变化条件非常敏感，大规模人脸库上的有效识别问题也很严重，这些问题都仍然需要进一步的努力。

总体而言，目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。

而非线性建模方法、统计学习理论、基于Boosting[15]的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。

总而言之，人脸识别是一项既有科学研究价值，又有广泛应用前景的研究课题。

国际上大量研究人员几十年的研究取得了丰硕的研究成果，自动人脸识别技术已经在某些限定条件下得到了成功应用。

这些成果更加深了我们对于自动人脸识别这个问题的理解，尤其是对其挑战性的认识。

尽管在海量人脸数据比对速度甚至精度方面，现有的自动人脸识别系统可能已经超过了人类，但对于复杂变化条件下的一般人脸识别问题，自动人脸识别系统的鲁棒性和准确度还远不及人类。

这种差距产生的本质原因现在还不得而知，毕竟我们对于人类自身的视觉系统的认识还十分肤浅。

但从模式识别和计算机视觉等学科的角度判断，这既可能意味着我们尚未找到对面部信息进行合理采样的有效传感器(考虑单目摄像机与人类双眼系统的差别)，更可能意味着我们采用了不合适的人脸建模方法(人脸的内部表示问题)，还有可能意味着我们并没有认识到自动人脸识别技术所能够达到的极限精度。

但无论如何，赋予计算设备与人类似的人脸识别能力是众多该领域研究人员的梦想。

相信随着研究的继续深入，我们的认识应该能够更加准确地逼近这些问题的正确答案。

题名题名相当于论文的标签,是简明、确切地反映论文最重要特点内容、研究范围和深度的最恰当的词语的逻辑组合,通常是读者最先浏览的内容,也是检索系统首先收录的部分,是体现论文水平与范围的第一重要信息。总结起来有如下几个要求:(1)题文相扣,概念表达准确题名要准确表达论文的内容和主题,恰当反映研究的范围和深度,与论文内容要互相匹配,紧扣-题要扣文,文要扣题。切忌题名过大,而应该限定到问题或者所使用的解决方法层面,例如：太笼统的题名:人脸识别研究; 限定到方法:一种基于感受野学习的人脸识别新方法。(2)题目长度适中,以及语序正确性题目用词要简短精炼、太长或太短都不好。一般过长的题目中都有废话,包括但不限于“调查”“研究”以及一些冠词“a”等。我们在小学语文中就做过这样的练习,把一句比较长的话改短,又不改变其原来的意思。例如: 机器人定位与导航若干神经计算方法的研究; 因为导航包括定位,去掉冗余后:机器人导航若干神经计算方法的研究。此外,题名像一条标签,忌用冗长的主、谓、宾语结构的完整语句,习惯上常用以名词或名词性词组为中心的偏正词组,一般不用动宾结构。英语题名,建议将表达核心内容的主题词放在题名的开头。例如: Age invariant face recognition and retrieval byCoupled auto-encoder。(3)注意术语的使用术语在科技论文中大量出现,特别在通讯领域,拥有众多各类术语。很多术语即便是内行也难以辨别。因此,除非是众所周知的缩略语,否则不简写。例如： Image-to-Image Translation with ConditionalAdversarial Networks, 而非 Image-to—Image Translation with Conditional GAN, 因为GAN(生成对抗网络)这个词最近2年才出来,即便在机器学习领域,也有很多人对它很陌生。摘要摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。摘要具有独立性和自主性,能充分反映研究的创新点,拥有论文同等量的主要信息,即不阅读全文就能获得必要的信息。摘要字数通常不超过论文字数5%。摘要的基本结构及内容摘要本质上是一篇高度浓缩的论文,其基本结构与论文的结构是对应的。摘要主要包括以下内容的梗概: (1)目的。研究工作的前提、目的、任务及所涉及的主题范围。 (2)方法——所用的理论、技术、材料、手段、设备、算法、程序等 (3)结果—观测、实验的结果和数据,得到的效果、性能和结论,创新与独到之处。摘要规范表达一般原则 1)摘要篇幅应尽量简短,切忌把应在前沿中出现的篇幅较长的内容写入摘要,而且不得有对论文的正式进行补充和修改的内容，尤其不要进行评价。 2)摘要的内容在正文应该出现,但不宜简单地重复。中文摘要多用第三人称来写,建议采用“对…进行了研究",“报告了…现状"等记述方法。 3)摘要要使用公知公用的规范的术语和符号,新术语应写出全称。一般不要使用公式和化学结构式。英文摘要规范表达英文摘要时态的运用应以简练为佳,常用一般现在时、一般过去时,少用现在完成时、过去完成时,基本不用进行时和其他复合时态。一般现在时用于说明研究目的、叙述研究内容、描述研究结果、得出研究结论、提出建议或讨论等。涉及公认事实、自然规律、永恒真理等,用一般现在时。如: In order to study the rigidity coeficient.…, the stress and strain model is concluded.与之相反,一般过去时用于叙述过去某一时刻(时段)的发现、某一研究过程。如The heat pulse technique was aplied to study two main tree species in July and August, 1996. a.介绍背景资料时,句子内容不受时间影响的普遍事实,应用现在时,对某种趋势的概述,用现在完成时。 b.叙述研究目的或主要研究活动,多使用现在时。 C.叙述实验程序、方法和主要结果常用现在时。 d.叙述结论或建议时可使用现在时,或may, should, could等助动词。关键词关键词(key words)是为了满足文献标引或计算机检索及国际计算机联机检索工作的需要, 而从论文题名和正文中选出来的能够反映论文主题内容的词或词组。关键词应为规范的术语,通常位于摘要之后。关键词:股票市场;在线股评;相关分析引言一般来说,引言部分通常需要14页的篇幅。基本内容应包括研究背景、存在的问题和研究目的等。通常先介绍范围较宽泛的一般性事实,为说明研究工作与过去工作的关系,须要回顾国内外研究历史(文献回顾或文献综述)，并对研究情况横向比较,写明前人在本课题相关领域所做的工作及存在的空白或不足。然后将重点逐渐转入与论文所探讨的问题有密切联系的主题,指出有某个问题或现象仍值得进一步研究,进而将焦点转到要探讨的研究问题上最后阐述研究目的,将作者的研究任务具体化,还可根据情况说明作者在已有工作基础上的贡献或创新。对篇幅较长、结构复杂的论文,其引言的结尾部分还应有简略说明研究的主要结论以及论文构架的内容。引文规范写作原则 1)按写作要求和内容逐渐展开,不要将引言写成摘要的注释,不讨论,不重复摘要内容。 2)要慎重而有保留第叙述前人工作的欠缺及自己研究的创新,一般不用评价式的用语。 3)研究背景应该准确、简洁,不宜过于分散和琐碎。正文正文写作过程中,不论小节层次,还是次小节层次,都应该遵循自上而下的细化方法。这种金字塔式的细化方法也应该体现论文的总体结构层次。也就是说,创建高层次的小节,用以描述搞层次的思想,然后使用低级别的章节层次结构描述更多的技术细节。每个段落都应该有一个中心论点,称为中心句或主题句,通常段落以此为起始句。之后,围绕这中心论点进行更加细致的阐释。结论结论可以是中心思想的重申、研究结果或主要观点的归纳,也可以是某些启示性的解释或考虑,以及在研究结果基础上所进行的预测等。主要包含： 1)本研究有什么新发现,得到了什么规律性的东西,解决了什么理论与实际问题,适用范围是什么? 2)研究的创新点,研究工作与他人已有研究成果的异同 3）研究的局限性、不足之处或遗留问题,以及可能的应用前景和进一步深入的研究方向。参考文献参考文献是指为撰写论文而引用前人(包括作者自己)已发表的有关文献,是科技论文不可缺少的重要组成部分。按规定,在科技论文中,凡是引用前人或他人(包括本人)已发表的文献中的观点、数据和材料等,都要在引用处予以标明,在文末(结论之后,,如有致谢,则在致谢之后)列出参考文献表称为参考文献的著录。一、参考文献著录的目的和作用 1)提高科学依据,表明广度和深度著录参考文献反映出了科技论文作者的科学态度,并为论文提供了真实、广泛的科学依据。所著录的参考文献数量多少以及发表时间,就能衡量该科技论文研究的广度与深度。 2)区分研究成果,尊重他人成果 3)节省论文篇幅,避免资料堆积适当引用参考文献,可避免过多介绍他人的工作,避免一般性表述和资料堆积。 4)便于读者查找,达到资源共享。二、著录的原则 1）只著录必要的最新的文献。 2）采用标准化的著录格式。各个期刊都有各自的规定,可在投稿前看相关期刊的文献著录格式。 3）一般只著录已公开发表的文献。三、标注方法正文中引用文献的标注方法可以采用顺序编码或著者—出版年制,相应地文后的参考文献表按顺序编码或者著者-出版年制组织。 1)顺序编码制引文采用序号标注,参考文献表按引文的顺序列出在同一处引用多篇参考文献时,只需在方括号内全部列出,例如：用多种优化模型[3,5,12—15]. 参考文献做主语的时候,例如:与文献[6,7]中的分析一致。引用英文人名时,要注意文献人名表达形式的统一性和特殊性。如作者姓氏相同,则应写全名,如"LEE Y S"和"LEE C W”.

识字教学论文研究现状

随着我国教育事业的发展，大家对小学低年级学生识字能力培养方面的教学研究逐渐增多。在这样的情况下，有关培养小学低年级学生自主识字能力的教学方法也日渐丰富，不过，在小学低年级的教学实践中可知，真正可发挥高效教学作用的还是以下几种：一、充分运用识字工具，培养学生自主识字能力小学低年级学生的识字教学中，教学工具的应用非常普遍和广泛。各类教学工具在培养小学生低年级学生自主识字能力方面功不可没。 1.现代教学设备的应用现代教学设备的应用主要是为了吸引学生的注意力，让学生对识字产生兴趣，愿意跟老师学习，愿意主动识字。常用的教学设备主要包括：投影仪、电脑等信息技术设备，卡片、照片、积木、益智玩具等设计精巧的识字道具。例如：当教小学生汉语拼音时，需要准备一些能够吸引学生注意力的图片，画面要求色彩丰富、积极向上、符合小学低年级学生的审美标准。画面内容富有趣味性，能引起人的联想并且与课堂教学内容相关。教学开始时还需要借助信息化设备的帮助。先在投影仪上演示一下静态图画中教学信息的动态影像，比如图画中小女孩的头部和辫子如何构成“a”的外形，还有小女孩张嘴唱歌时发出的“啊――”的声音等。动态影像充分吸引学生注意力、调动了学生的积极性。此时再拿出静态的图画或者照片、让学生主动探寻图画与动画之中的相似点，从而记住本课所要学习的“a” 的外形和发音。 2.必备自主识字工具的应用在小学低年级识字教学中，除了基础的教学道具外，学生自主识字能力的培养还需要具备三件基本识字工具，分别是汉语拼音、字典的使用方法和汉字的基础知识。这三种识字工具与教学道具的不同之处在于需要通过教师的教学才能掌握，所以也可以称为识字教学之前必须掌握的自主识字基础能力。学生掌握了这种能力便能在教师教学的基础上，独立自主的认识汉语文字。以“陡峭”二字为例，学生先需要通过汉字基础知识分析得出“陡”和“峭”两个字的偏旁分别为两划的“阝”和三划的“山”，从字典中找到这两个偏旁后，再根据“走”和“肖”的比划数量在字典目录中找到“陡峭”二字，翻至具体页数，便能看到两字的拼音拼写方式和读音“dǒu qiào”，依据之前掌握的汉语拼音知识便能轻松掌握“陡峭”二字的读法和基本意思。二、充分发挥教师作用，培养学生自主识字能力在小学生自主识字能力培养的过程中，小学语文老师要通过多种方法开展识字教学，调动学生自主识字兴趣的同时积极培养小学生多种渠道的识字能力。其中，最常用的两种渠道便是教授学生识字方法和培养学生识字习惯。 1.教导学生掌握识字的方法小学低年级的识字方法需要根据小学生的学习能力、学习特点，兴趣爱好等因素进行设计，要具有极强的趣味性和吸引力。在小学低年级的教学中，有助于学生自主识字的识字方法主要有：猜谜法、演示法、游戏识字法等。猜谜法针对小学低年级学生年龄小，好奇心强的特点，以谜语的形式激发学生的识字兴趣。比如，学习“田”字时，根据“田”的形状和构字特点变成一个谜语：“四座大山山对山，四个大川川对川，四个日头连环套，四个嘴巴紧相连。” 演示法包括了拟声和拟形演示两个部分。比如在教授“雨”字的时候，老师利用投影仪等演示“雨”字的构成方式，还有各种与“雨”有关的背景图画、音像资料，让学生对各种“雨”的形象记忆更为丰富。与此同时还可以加上各种“雨”的声音以及与“雨”字读音相似的声音，加深学生对“雨”字读音的认识，让学生对生字的构成方式和读法记忆更为深刻。游戏识字法是根据小孩子爱玩的天性而制定的识字教学方法之一，最能凸显小学低年级学生的年龄特点。语文教学中最常用的游戏识字法便是以生字教学为主的“拼一拼，画一画，说一说”等类似游戏的活动。除了这些比较生动形象的识字教学方法外，还有比较有趣的顺口溜教学方法、表演识字法和讲故事识字法等。 2.教导学生培养自主识字习惯自主识字习惯能让学生完全自主自愿的学习和认识更多的文字，最有利于小学低年级学生自主识字能力的培养。而经过教学研究发现能培养学生自主识字习惯的方法主要有以下几种：第一，培养学生的形象思维模式。比如，教师用大量与生字相关的声音、图片、动作、情境等帮助学生加深对生字的印象。引起学生的自主学习兴趣的同时，也开发了学生对汉字的音、形、意等基本内容的合理联想。第二，帮助学生养成探寻文字规律的习惯。教师在日常教学中要对学生分析、教导文字规律和相关的文字转化方式。例如，在教授“她”“他”等生字的读音和写法时，教师要让学生掌握“他”“她”之间相似之处，比如读音相同都念“ta”，构词方面都有相同的部分“也”，还有两个字偏旁的意义等。学生以后遇到与“他”“她”相似的情况时也能以同样的方式来解读文字。第三，启发学生了解拆字、组字的乐趣，养成熟字拆分、新字组合的习惯。例如，在教学生学习“把”字的时候，可以让学生把“把”字拆分成为“巴”和“扌”两个部分，然后分别给这两部部分搭配其他的汉字元素，如“跳”字上拆分下来的“兆”可以和“扌”组成新字“挑”等。学生掌握这种拆字组字的方法不仅可以拓展生字学习的范围，还能从中获得游戏般的愉悦感受。三、时刻掌握教学契机，培养学生自主识字能力学生学字的途径从来便不会局限在课堂之中，所以学生自主识字能力的培养也可以拓展到课堂之外，教师充分把握课外活动的教学契机对提高学生自主识字能力大有裨益。首先，锻炼学生在生活中识字的本能。例如：教师可以通过引导学生观察生活之中存在的各种字，来培养学生随时观察、学字的习惯。观察对象包括校名、标语、铭牌、宣传栏、广告、路牌还有生活中各种日用品上的文字等。其次，教师还可以有针对性地训练学生的阅读能力，让学生在语文阅读中掌握识字的能力，并因为阅读对象的吸引，养成自主阅读和识字的习惯。比如：培养学生晨读的习惯，让学生熟读语文教材，反复阅读加深对教材中文字的印象，达到识字目标。另外，还要积极扩展学生的阅读面，增加一些儿童读物和课外读物，当学生在阅读中遇到不懂或者不认识的生字、词时，必须自己主动查字典寻找答案，或者主动请教其他人。在培养阅读习惯的同时，也培养出学生主动识字的习惯。两者相辅相成，让学生认识更多文字的同时，也能获得更多的阅读乐趣。

试论小学识字教学1000字论文

识字教学是小学语文教学的重要环节，它是阅读和作文的基础。21世纪是信息社会，而获取信息最主要的途径是阅读。要想大量阅读，必须做到大量识字。而面对如此大的识字量，低年级小学生怎样才能做到认得快、不遗忘？实践证明，一切知识都来源于生活。而在生活中学习生字，巩固生字是最好的识字方法。只要学生能够在生活实际中不断积累识字，并且掌握一定的识字方法，再通过少写多认多再现进行巩固，他们就可以轻松完成《新课标》提出的识字要求，为阅读和作文奠定坚实基础。

低年级教师的任务不光是在课堂教学中采用灵活多样的教学方法教学生识字，还要利用各种生活情境让学生识字。因此，只有科学地抓住遗忘规律进行反遗忘识字教学，才能扬长避短，才能进行有效的因材施教，达到预期的教学目标。

一、课堂生活中识字

1、游戏合作中识字

学生识字本来应该是个体行为，但在教学活动中如果独自面对每课的大量生字，学生就会产生畏难情绪。如果让孩子们以小组为单位合作学，自由选择、自行决定组员，在自己喜欢的环境下互相合作、互相促进，就能学到他们所需要的一切。小小年龄的他们有着合作的原则和标准，在以他们为群体的小组中，孩子们充分显示了他们的主动精神。

如果让孩子们在自己小组讨论的基础上，与其他小组调换组长后，能把各小组好的想法带给别的小组，这样讨论的效果更好。一年级学生识字的主要问题在于他们学得快、忘得也快；如何解决这个难题？通过实践，我发现巩固识字的好方法就是要寓教于乐，让孩子在玩中学习，在轻松、有趣的氛围中记住汉字。小组合作中游戏识字效果更佳。

通常我们在教学中常用的游戏：开火车（各种形式）、接龙，摘苹果，猜字，排字，举字……多种多样的游戏给学生带来了乐趣也使他们记住了生字。

例如：“我的朋友在哪里”，让学生拿着生字卡片，在小组中找到能与自己的卡片上的字组成词语的“朋友”；“我是小医生”，出示含有错别字的词句，让学生扮医生来诊治；“摘苹果”，树上苹果的上面写要求会认的字，谁读对了，就把苹果作为奖品发给他；如果学习合体字，把所学字的偏旁与部首分别写在半个苹果上，打乱贴于一棵苹果树上，要求学生在限定的时间内把偏旁和部首组成字，读对了，就把“苹果”送给他。这样学生不仅学习情绪高涨，而且也培养了学生快速思考、判断的能力。又如，根据小学生好胜心强的特点，我们还可以运用竞赛的形式进行识字教学，调动起学生的积极性，进而更好地巩固已学的知识。比如：“开火车”，以小组为单位，快速念出字卡上的字，哪个小组“火车”不断，哪个小组获胜；“我也要当老师”，谁先记住了生字，谁就可以当老师来教同学们识字；“考考你”，以小组为单位，准备好字卡，迅速挑出组长所念汉字的字卡，组长可以轮换当。通过各种竞赛，使学生在轻松的环境中熟练地掌握所学的生字，激发了学生的学习兴趣，使识字学习由枯燥变为有趣。

再如，我在引导小朋友们巩固识字时说：“请小朋友在小组长的带领下，用你们喜欢的游戏来记住这些生字。”在小组开展游戏时，我发现有些小组把几种游戏结合在一起。如：把举字和排字游戏相结合；在叫号游戏中加入数学的加减法；把猜字游戏和卡片识字结合起来，变成了“翻牌”游戏等。

这一切让我惊喜不已，也使我认识到学生不断需要更新更有趣的游戏。于是，我又在进行新课教学时，根据课文内容的不同，设计与课文内容有关的游戏。如：教学《脚印》这课时，我让学生把自己知道的脚印形状画下来，我在各种脚印背后写上字宝宝和由字宝宝组成的词宝宝。，学生异常活跃兴奋，因为游戏规则是谁读得最多最正确就能得到最多的脚印。

总之，让孩子们在喜欢的游戏或竞赛中巩固识字，可以达到识字记字事半功倍的效果。

2、学习拓展中识字

所谓识字的拓展就是指把所学的生字放到新的识字环境中进行再认识。在识字过程中，学生记得快，忘得也快。针对学生这一识记特点，在尝试教学中，我常常让学生根据熟字换偏旁这类字的特点，让学生加减法识记生字。如“报”与“服”“近”与“听”“惊”与“就”等等，通过对比记忆，学生不仅能较快掌握新字，而且还能在对比中与以往的熟字多次见面，进一步巩固了旧字，可谓一举两得。

另外，在尝试识字教学中，我还通过让学生“拼”“摆”“书空”生字笔画部件的方法，给学生以直接、立体感官刺激，从而调动他们进一步尝试的兴趣，促使他们在自学、自悟、自得中不断探索，达到巩固识记生字的目的。如，发给学生一些熟字卡片（“大”“人”“干”“木”）和分别写在卡片上的几种形态的“点”，请学生自己动手摆一摆，说说这些字加上“点”后会变成什么字。如“大”可变成“太”“头”，“人”变成“火”，“干”变成“平”，“木”变成“米”……

再如，在《老山羊当医生》这课的教学中，我意外地发现学生并不满足于教师安排的识字拓展内容，他们有自己“编写”新儿歌的欲望。在这课教学之后，学生共创作很多儿歌。虽然这些儿歌显得稚嫩，但我看到了孩子们创作火花的闪现，启发我要为孩子多搭建表现自我的舞台。事后，我把他们创作的儿歌布置在教室里，孩子们看着自己和同学的作品，兴奋地读个不停。瞧！又在主动识字了！孩子的探究潜能无法估量，让我们都来创设一片广阔的天地，让孩子自由翱翔吧！

二、课余生活中识字

语文是母语学习，无处不在、无时不在。从儿童的认知规律看，他们最先认的字，是与他们的日常生活最密切相关的，如“爸、妈、我”等。因此，教师应从学生的兴趣入手，把学生的视野引向丰富多彩的生活中，拓展识字领域，引导他们在生活中识字。开学第一天，我对孩子们说：“从今天开始，我们就是一年级的新学生了。我是大家的班主任老师。”边说边把“学生”、“一年级”、“老师”几个词语板书到黑板上，引起学生对生活经验中这几个词语意义的共鸣，结合生活中他们的理解，那么识记这几个字就不难了。在接下来的学习中，“汉语拼音、声母、韵母……”等字，就在潜移默化中被学生牢记在心里了。还有各种课程名称“数学、语文、英语、美术……”也逐渐的被孩子们记住了。

在课堂上分发学生作业时，我发现孩子们虽然竭力想帮老师的忙，但苦于识字不多只能干着急。于是，我把全班同学的名字贴出来，每个字都标注拼音，告诉他们谁先把全班同学的名字读下来，就请谁做老师的小助手帮忙发作业。课后，孩子们有的去读拼音，有的向同学请教对方的名字怎么读。不到两周时间，大多数学生都能抢着去发作业了。

教室里有很多现成的实物，如门、窗、讲台、黑板、电视机、电脑、投影机、录音机，我都在上面贴上字卡，让学生看到什么就认表示该实物的字。还分类进行识字比赛，比一比谁认识的字多。如，学习用品类、水果类、蔬菜类、植物类、动物类。

为学生建立识字档案，每周让家长帮助学生把认的字记录下来，然后在班上交流。我还在班上专门设了一块泡沫塑料板，以“今天我又认识了……”为题，让学生把搜集的包装盒、包装袋上的字展示出来交流、互相学习。“可口可乐”“娃哈哈”“旺旺雪饼”等字学生早就能认了。

三、课外生活中识字

苏霍林斯基曾经把识字教学描绘成一种美妙的境界：“识字应成为孩子们生活中生动的形象，充满音乐和旋律，非常好的、非常有趣的事情。”常言道：“行万里路，读万卷书。”识字教学资源又何尝不是这样啊!学生的所见所闻，所思所想，都与汉语符号紧密相连，丰厚的教学资源就在我们身边，所以要求老师们一定要强化资源意识。学生作为社会大家庭的一个成员，每天与各种各样的人和事接触，也丰富了他们的学习渠道。要抓住这一契机，引导学生去主动识字。走在街上，不少学生注意观察街道两旁的标牌、广告牌、标语就会问家长这些字怎么读；坐在电视前，电视上的铺天盖地的广告，如“祝你百事可乐”、“喜之郎”等为孩子提供了最好的听、读、认字的教材；生活中的各种食品包装袋上也有许多字，孩子在吃食品的同时，也会留意包装袋上的品牌、商标，如“恰恰瓜子”、“福满多方便面”等。而且很多学生都是很自然地去学习生字的，他们很乐意去做，效果很不错。

例如教学生字“红”：师：（出示几个生字）你有什么好方法能记住哪个字？生：我认识“红”，这个字我在广告里就见过“我爱喝红牛”，红牛是饮料。生：我也认识这个“红”字，我们每天早晨都要升五星红旗。生：我爸爸抽过的“红双喜”烟中的第一个字就是我们学的。师：再来找一找我们身边有没有这个字宝宝？（此时，教师似乎是不经意的点拨，却把学生的“视线”拉到了自己身边，引发学生无穷的探究热情。）生：对了，我的同桌的名字里就有个“红”字。

语文是母语教育，汉字在学生的生活中是随处可见的。在课外生活中识字，是一种重要的识字方法，它是课堂识字的巩固与补充，因为生活是个大课堂，汉字在生活中是随处可见的。我们要鼓励学生在生活中看到字就读一读，遇到不认识的字就问一问、查一查，做个生活的有心人，让生活教会自己更多的汉字。同时，为了增加趣味性，也为了进行宏观调控，我们还鼓励学生把生活中识得的汉字收集起来，制成识字本或识字袋，带回学校交流、展示。在这里，我想介绍一下我们年级组在一年级时采用的几种反馈、激励课外识字的方式。

1、制作识字本。

所谓识字本就是学生把从生活中识得的字收集起来，利用剪贴等形式制作成的本子。制作识字本是一种非常适合一年级学生的识字法。我们最常用的'是商标识字，因为商标形形色色、颜色鲜艳，学生对它特别喜爱，而且很多商标都成为生活的废弃品，刚好可以重新利用。这一方面我们教研组的隗合宾老师做得非常好，校园的展示板上还留有他们班学生的作品。那是一本本用八开的素描纸钉成的本子，纸上贴着形形色色的商标，非常美观。另外，梁淑艳老师利用学生特别喜欢动物的特点，请学生把收集来的生字拼成一种种动物的图形，贴在学习园地里，让大家去读，实现了资源的共享，还培养了学生的合作能力，学生的兴致也非常高。

2、使用识字袋。

一年级时，我用得比较多的是识字袋。识字袋没有识字本那么好看，但制作更方便，使用也很方便。我的识字袋很简单，只是请学生把课外识得的字一股脑地装进一个袋子里，经常掏出来读一读，自己读一读，同学拼起来读一读，并且定期带回来展示、交流，比比谁收集得更多就行了。那个袋子里的东西多了，就保存起来，再装一袋，以免新旧混合，影响阅读。这是一种上不得台面的方法，但对于当班主任的语文老师来说，却是可以一试的。

现实生活中，识字教学资源无处不在，就看孩子有没有一双慧眼，教师有没有正确引导，教给孩子一个点石成金的指头。以上这些第二课堂学习资源的有效开发和利用，将使学生受益匪浅。

四、实践中识字

课堂只是小天地，天地乃为大课堂，开发和利用课程资源绝不仅仅束缚于课堂和教材之中，在“大语文观”的指引下，开展丰富多彩的语文实践活动，培养学生有效的学习方式，关注学生的种种活动与兴趣，可以使学生将自己学到的知识、技能恰如其分地运用于实践，在实践中锻炼，在实践中成长。

我们从儿童的生活实际出发，从儿童的兴趣出发，开展实践活动。每次活动有一个主题，引导学生围绕这个主题自己动手、动脑去收集资料，并交流收获。交流之后，还可采取模拟、创设情境的办法让儿童识字。著名心理学家维果茨基说过：“活动和交往是发展的源泉。”活动是儿童生活的一部分，教师在教学中就要注意和社会生活相沟通，使儿童尽快从“我”的世界跨入更广阔的周围环境，以吸收各种信息，扩展想象和思维的空间。因此，当学生掌握了识字方法，乐于识字，善于识字后，教师就要有意识地让学生在生活中识字。

识字教学需要课本，这是学习语文的凭借。然而识字仅仅靠几册课本是远远不够的，是因为课本能容纳的东西实在是太有限了。尽管大部分生字先后要在课本上几次出现，但绝大部分仍达不到让学生形成永久记忆的次数。至于生字的多义性，要在有限的课本中体现出来，更是不可能的了。因此，我们引导学生把教材向课外延伸，把学生学习生字与现实生活结合起来。把学生生活中接触最多的广告招牌、商品包装物，还有各种报刊杂志，让他们收集起来，剪剪、画画、贴贴，就成了图文并茂的“识字课本”。在这个过程中，学生动手，动脑，收集，整理，编排，还是一个创造的过程。

总之，小小汉字，奥妙无穷。教师要充分发挥教师的主导作用，结合学生的思维特点，调动学生的多种感官，使学生积极地参与识字教学，处处从学生主体的实际出发，鼓励学生想象，实践，学生就能获得成功的喜悦。从而使枯燥的识字教学成为培养学生发现兴趣和热情探索的热土。让学生无论是在课堂中、课余、课外及实践中无处不识字，学好祖国的汉字。

参考文献：

《小学语文课程标准》

《教师及学生心理健康》北京出版社.

《素质教育案例精选》中华工商联合出版社.彭坤明《创新教育》.

试论小学识字教学

单位：房山区佛子庄中心小学

姓名：刘国华

日期：2009、10

论文人脸识别算法研究现状

人脸识别技术流程

人脸识别的技术原理主要包括三大步骤：首先是建立人脸图像数据库，其次是通过各种方式来获得当前要进行识别的目标人脸图像，最后是将目标人脸图像与数据库中既有的人脸图像进行比对和筛选，其技术流程如下：

应用场景广泛，安防和考勤门禁占比较高

目前，人脸识别在考勤/门禁领域的应用最为成熟，约占行业市场的40%左右;安防作为人脸识别最早应用的领域之一，其市场份额占比在30%左右;金融作为人脸识别未来重要的应用领域之一，其市场规模在逐步扩大，目前约占行业的20%。

三维人脸识别技术是发展主流

从人脸识别技术发展过程来看，未来三维人脸识别是人脸识别主要技术手段，二维人脸识别只是人脸识别发展的过渡阶段。实验结果显示，二维人脸识别系统在人脸左右偏转达到40度识别率迅速下降到50%以下;而采用三维人脸识别后，识别率可以提高至少10-20个百分点。

——以上数据来源于前瞻产业研究院《中国人脸识别行业市场前瞻与投资战略规划分析报告》。

身边的图像识别、人脸识别、文字识别应用案例，还有网络延迟方面的改进或创新之处。

1、金融领域。人脸识别当前在金融领域的应用最为广泛，当前国内金融领域监管要求严格，金融相关产品都需要实名认证，并且具有较高的安全性要求，活体识别，银行卡ocr识别，身份证ocr识别，人证对比等在各大手机银行，金融app，保险app等都已经成为不可或缺的一个环节。

2、安保领域。目前大量的企业，住宅，社区，学校等安全管理越来越普及，人脸门禁系统已经成为非常普及的一种安保方式。

3、通行领域。很多城市的火车站已经安装了人脸识别通行设备，进行人证对比过检，有些城市的地铁站也可以通过人脸识别的方式进行地铁进出站通行。

人脸识别技术在中国的发展起步于上世纪九十年代末，经历了技术引进-专业市场导入-技术完善-技术应用-各行业领域使用等五个阶段。目前，国内的人脸识别技术已经相对发展成熟，该技术越来越多的被推广到安防领域，延伸出考勤机、门禁机等多种产品，可以全面覆盖煤矿、楼宇、银行、军队、社会福利保障、电子商务及安全防务等领域，人脸识别的全面应用时代已经到来。

人脸识别技术介绍

(1)人脸识别技术流程

人脸识别的技术原理主要包括三大步骤：首先是建立人脸图像数据库，其次是通过各种方式来获得当前要进行识别的目标人脸图像，最后是将目标人脸图像与数据库中既有的人脸图像进行比对和筛选，其技术流程如下：

(2)人脸识别的主要方法

人脸识别技术是一个跨越多个学科领域知识的高端技术研究工作，涉及图像处理、生理学、心理学、模式识别等知识，目前比较常见的人脸识别方法包括基于特征脸的方法、基于几何特征的方法、基于深度学习的方法、基于支持向量机的方法以及其他综合方法。

(3)常用人脸数据库介绍

目前世界较为常用的人脸数据库包括：ERET人脸数据库、CMU Multi-PIE人脸数据库、YALE人脸数据库、YALE人脸数据库B、MIT人脸数据库、ORL人脸数据库、BioID人脸数据库、年龄识别数据集IMDB-WIKI等。

人脸识别技术具有非侵犯性

人脸识别是生物特征识别技术的一个重要方向，不同的生物识别技术在细分技术上各具优势，人脸识别技术是非接触和不需要主动接受的，具有非侵犯性。此外，人们对这种技术的排斥心理最小，因此人脸识别技术是一种最友好的生物特征识别技术，并且图像采集可以由安防中的摄像头完成，不需要重新再布置新的采集设备。

行业技术环境十分活跃

截至2019年底，在soopat专利搜索引擎上以“人脸识别”为关键词检索得到20208项专利申请记录，行业技术环境十分活跃。

从申请年来看，2010-2018年，我国专利申请数逐年增长，2018年增加至5618项，为近年来最高，2019年我国人脸识别相关专利申请数达3024项。

从公开年来看，我国最早于2002年有人脸识别相关专利公开，当年公开数量为1项，随后专利公开量保持快速增长态势，2019年我国人脸识别相关专利公开数量为6700项。

中国人脸识别技术发明专利申请量超六成

在超2万项的人脸识别技术专利中，发明专利的申请量最多，达12407项，占比为;其次为实用新型专利，占比为。

G06K专利申请量过万

从我国人脸识别相关热门专利技术申请分布领域来看，G06K(数据识别、数据表示、记录载体、记录载体的处理)申请量最多，达10134项;其次为G07C(时间登记器或出勤登记器、登记或指示机器的运行、产生随机数、投票或彩票设备、未列入其他类目的核算装置)，申请数量为1302项。

人脸识别错误率逐年降低

经过了40多年的发展，人脸识别技术取得了长足进步，根据LFW测试成绩显示，目前最优的系统在千万分之一的误报下达到识别准确率准确率已经超过，甚至超过了人类的识别程度，错误验证率也控制在以下。

即使是采用评测标准最严格的FRVT测试，根据2019年7月3日NIST公布的FRVT最新报告显示了全球人脸识别算法的最高水平可以做到在千万分之一误报率下，漏报率降低于，这意味着千万分位误报下的识别准确率已经超过99%，人脸识别技术的不断进步无疑会促进其在更广泛范围内的应用。

应用场景广泛，安防和考勤门禁占比较高

目前，人脸识别在考勤/门禁领域的应用最为成熟，约占行业市场的40%左右;安防作为人脸识别最早应用的领域之一，其市场份额占比在30%左右;金融作为人脸识别未来重要的应用领域之一，其市场规模在逐步扩大，目前约占行业的20%。

三维人脸识别技术是发展主流

从人脸识别技术发展过程来看，未来三维人脸识别是人脸识别主要技术手段，二维人脸识别只是人脸识别发展的过度阶段。实验结果显示，二维人脸识别系统在人脸左右偏转达到40度识别率迅速下降到50%以下;而采用三维人脸识别后，识别率可以提高至少10-20个百分点。

以上数据来源于前瞻产业研究院《中国人脸识别行业市场前瞻与投资战略规划分析报告》。

情感识别研究现状论文怎么写

研究现状是开题报告的关键部分，对开题报告的层次和水平起决定性作用，也是英语论文“文献综述”的基础。

撰写研究现状之前，需要查阅与论文选题有关的国内外文献，以便了解国内外在该选题上的研究现状，比如：目前已经有了哪些方面的研究；这些研究是如何实施的；它们的研究方向和深度；取得了什么成果；还有哪些问题有待解决等等。

对选题相关文献的认真查阅不但可以让我们避免进行无效重复的研究工作，而且可以开阔我们的视野、拓展我们的研究视角。通过较全面的国内外文献资料的分析就可以发现以往研究的不足或漏洞，甚至可以启迪新的研究思维和角度，为我们提供新的研究目的和切入点。

写论文研究现状注意事项

研究现状内容长度一般是在1000字左右。并要附上有权威性和时效性的参考文献目录。在写研究现状时，不能单纯列举，应避免繁琐和不得要领。

另外也应避免空洞和泛泛而谈。要先从大处着手，然后逐步归拢，最后集中到本选题的研究问题上。要对所搜集到的研究文献进行的归纳和整合，客观地阐述研究背景，然后对巳有研究的不足进行主观评论。

必须指出国内外文献就相关论题已经提出的观点、解决方法和阶段性成果，阐述这些研究的广度、深度和不足，从而提出有待进一步研究的问题，确定本选题研究的平台，并指出本选题的研究预期将有哪些突破。

莫言研究的现状很好写呀，可以写一下大家的研究论文，大多数没有创意出现抄袭的现象

一、文献综述是什么？1、定义文献综述主要是撰写人在确定论文选题后，结合前人的观点、研究，进一步进行研究、分析，从而提出自己对选题的见解和研究思路。它非常重要，是开题报告的重点。2、内容和要求文献综述在内容上，主要包括了这些内容：现在存在的一些观点；国内外的研究背景和现状；前人研究的基本概括、还待研究的内容、以及发展方向。文献综述在字数上，有着一定的要求，字数一般要在1000字左右。二、如何写文献综述？1、文献综述一般有这3种结构：第一种结构：研究背景及意义--现状--评述--参考文献；第二种结构：研究现状--主流观点--存在的争议点与矛盾--参考文献；第三种结构：背景及演变--主流观点--研究方法--目前研究中存在的矛盾与不足--参考文献。2、找文献综述，要满足这2个条件的：一新的，二有代表性的。文献综述不需要太多，一般10篇左右就够了。但是呢，每一篇文献综述都要花时间好好研读一篇。3、在写文献综述的研究背景及意义时，字数不需要太多，一般200-300字左右就够了。写的时候，重点一点要突出，要涵盖这些内容：国内外背景、为什么选择这个课题、有什么意义等等。4、写文献综述的评述时，字数要把握在200-300字之间。评述中不仅要指出亮点和缺点，还要进一步叙述接下来研究的思路。5、写文献综述的参考文献时，则要注意格式的问题了。不少朋友在写参考文献时，格式都出错了。所以格式问题要特别注意。6、写文献综述时，切忌莫无中生有，任凭自己的想象力进行杜撰，这是一种很不负责的行为。另外，写文献综述要客观、公平、公正，千万别为了放大自己论文的亮点，故意抹黑、放大前人研究中的不足之处，要知道这种行为是很可耻的！

研究课题申报中“目前的研究状况”是指研究课题目前国内外有些什么研究成果，以及对这些成果的观点综述。写国内外研究现状应注意：

1、文中反映最新研究成果。预期成果一般是论文或调查（实验）报告等形式。成果表达方式是通过文字、图片、实物和多媒体等形式来表现。

2、如果没有与毕业论文选题直接相关的文献，选择一些与毕业论文选题比较靠近的内容来写。另外，还应提出该课题目前已做了哪些工作，还存在哪些困难和问题，在哪些方面需要得到学校和老师帮助等。

写研究状况方法

1、研究背景研究背景即提出问题，阐述研究该课题的原因。研究背景包括理论背景和现实需要。还要综述国内外关于同类课题研究的现状。

2、目的意义目的意义是指通过该课题研究将解决什么问题（或得到什么结论），而这一问题的解决（或结论的得出）有什么意义。有时将研究背景和目的意义合二为一。

3、成员分工成员分工应是指课题组成员在研究过程中所担负的具体职责，要人人有事干、个个担责任。组长负责协调、组织。

4、实施计划实施计划是课题方案的核心部分，它主要包括研究内容、研究方法和时间安排等。研究内容是指可操作的东西，一般包括：研究方向；子课题（数目和标题）；与研究方案有关的内容，即要通过什么、达到什么等等；研究方法要写明是文献研究还是实验、调查研究。

5、可行性论证可行性论证是指课题研究所需的条件，即研究所需的信息资料、实验器材、研究经费、学生的知识水平和技能及教师的指导能力。

首页

> 期刊论文知识库

文字识别研究现状论文