汽车牌照自动识别技术是一项利用车辆的动态视频或静态图像进行牌照号码、牌照颜色自动识别的模式识别技术。通过对图像的采集和处理,完成车牌自动识别功能,能从一幅图像中自动提取车牌图像,自动分割字符,进而对字符进行识别.其硬件基础一般包括触发设备(监测车辆是否进入视野)、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机(如计算机)等,其软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。 某些牌照识别系统还具有通过视频图像判断车辆驶入视野的功能称之为视频车辆检测。一个完整的牌照识别系统应包括车辆检测、图像采集、牌照识别等几部分。当车辆检测部分检测到车辆到达时触发图像采集单元,采集当前的视频图像。牌照识别单元对图像进行处理,定位出牌照位置,再将牌照中的字符分割出来进行识别,然后组成牌照号码输出。 车牌识别停车场管理系统将摄像机在入口拍摄的车辆车牌号码图象自动识别并转换成数字信号。做到一卡一车,车牌识别的优势在于可以把卡和车对应起来,使管理提高一个档次,卡和车的对应的优点在于长租卡须和车配合使用,杜绝一卡多车使用的漏洞,提高物业管理的效益;同时自动比对进出车辆,防止偷盗事件的发生。升级后的摄像系统可以采集更清晰的图片,作为档案保存,可以为一些纠纷提供有力的证据。 方便了管理人员在车辆出场时进行比对,大大增强了系统的安全性。
原理就是通过摄像机拍摄道路上行驶的车辆图像进行车牌号码的识别,过程涉及:车辆检测—图像采集—预处理—车牌定位—字符分割—字符识别—结果输出。车辆检测:可采用埋地线圈检测、红外检测、雷达检测技术、视频检测等多种方式感知车辆的经过,并触发图像采集抓拍。图像采集:通过高清摄像抓拍主机对通行车辆进行实时、不间断记录、采集。预处理:噪声过滤、自动白平衡、自动曝光以及伽马校正、边缘增强、对比度调整等。车牌定位:在经过图像预处理之后的灰度图像上进行行列扫描,确定车牌区域。字符分割:在图像中定位出车牌区域后,通过灰度化、二值化等处理,精确定位字符区域,然后根据字符尺寸特征进行字符分割。字符识别:对分割后的字符进行缩放、特征提取,与字符数据库模板中的标准字符表达形式进行匹配判别。结果输出:将车牌识别的结果以文本格式输出。参考资料:
最近,端到端场景文本识别已成为一个流行的研究主题,因为它具有全局优化的优点和在实际应用中的高可维护性。大多数方法试图开发各种感兴趣的区域(RoI)操作,以将检测部分和序列识别部分连接到两阶段的文本识别框架中。然而,在这样的框架中, 识别部分对检测到的结果高度敏感(例如,文本轮廓的紧凑性)。 为了解决这个问题,在本文中,我们提出了一种新颖的“Mask Attention Guided One-stage”文本识别框架,称为MANGO,在该框架中无需RoI操作就可以直接识别字符序列。具体而言:
值得注意的是,MANGO自有地适应于任意形状的文本识别,并且仅使用粗略的位置信息(例如矩形边界框)和文本注释就可以进行端到端的训练。实验结果表明,该方法在规则和不规则文本识别基准(即ICDAR 2013,ICDAR 2015,Total-Text和SCUT-CTW1500)上均达到了有竞争力甚至最新性能。
场景文本识别由于其各种实际应用而备受关注,例如发票/收据理解中的关键实体识别,电子商务系统中的产品名称识别以及智能运输系统中的车牌识别。传统的场景文字识别系统通常分三步进行:定位文字区域,从原始图像中裁剪文字区域并将其识别为字符序列。然而尽管这种文本识别模型带来了许多可考虑的问题,例如: (1)错误将在多个单独的任务之间累 (2)维护多个单独的模型的成本很高 (3)该模型难以适应各种应用程序。
因此,提出了许多工作以端到端的方式来最终优化文本识别过程。这些方法通常使用各种兴趣区域(RoI)操作以可微分的方式桥接文本检测和识别部分,从而形成了两阶段框架。粗略地说,早期的端到端方法将轴对齐的矩形RoI用作连接模块。这些方法处理不规则的(例如,透视图或弯曲的)文本实例能力有限,因为这种类型的RoI可能会带来背景或其他文本的干扰。为了解决这个问题,后来的方法(设计了一些形状自适应RoI机制来提取不规则物体。文本实例并将其校正为规则形状。
图1:传统的两阶段文本识别过程和提出的MANGO的图示。 图(a)显示了通过RoI操作连接检测和识别部分的两阶段文本识别策略。 图(b)是一种提出的单阶段文本识别方法,它可以直接输出最终的字符序列。
在两阶段方法中,识别部分高度依赖于定位结果,这就要求检测部分必须能够捕获准确的文本边界以消除背景干扰。因此,训练鲁棒的文本检测模型依赖于准确的检测注释,例如在不规则文本识别中使用的多边形或蒙版注释。自然地,标记这种注释是费力且昂贵的。另一方面,要确保紧紧封闭的文本区域(由检测注释进行监督)对于以下识别任务而言是最佳形式,这并不容易。例如,在图1(a)中,紧密的文本边界可能会擦除字符的边缘纹理并导致错误的结果。 通常,需要手动扩展这些严格的检测结果,以适应实际应用中的识别。 此外,在proposals之后执行带有非极大抑制(NMS)的复杂RoI操作也很耗时,尤其是对于任意形状的区域。尽管(Xing et al.2019)提出了一种单阶段采用字符分割策略的字符级别的识别框架, 但很难扩展到具有更多字符类别(例如汉字)的情况。 它还会丢失角色之间的关键上下文信息。
实际上,当人们阅读时,他们不需要描绘文本实例的准确轮廓。通过视觉注意力关注的粗略文本位置来识别文本实例就足够了。在这里,我们将场景文本识别重新考虑为注意力和阅读的问题,即,一次直接读出粗略注意的文本区域的文本内容。
在本文中,我们提出了一种名为MANGO的“Mask Attention Guided One stage”文本监视程序,称为MANGO,这是一种紧凑而强大的单阶段框架,可直接从图像中同时预测所有文本,而无需进行任何RoI操作。具体来说,我们引入了一个位置感知蒙版注意力(PMA)模块以在文本区域上生成空间注意力,该模块包含实例级蒙版注意力(IMA)部分和字符级蒙版注意力(CMA)部分。 IMA和CMA分别负责感知图像中文本和字符的位置。可以通过位置感知注意力谱直接提取文本实例的特征,而不必进行显式的裁剪操作,这尽可能保留了全局空间信息。 在这里,使用动态卷积将不同文本实例的特征映射到不同的特征谱通道(Wang等人,2020c),如图1(b)所示。之后,应用轻量级序列解码器一次批量生成字符序列特征。
请注意,MANGO可以仅使用粗略的位置信息(例如,矩形边界框,甚至是文本实例的中心点)进行端到端优化,还可以使用序列注释。 受益于PMA,该框架可以自适应地识别各种不规则文本,而无需任何纠正机制,并且还能够了解任意形状的文本的阅读顺序。
本文的主要贡献如下: (1)我们提出了一种名为MANGO的紧凑而强大的一阶段文本识别框架, 该框架可以以端到端的方式进行训练。 (2)我们开发了位置感知蒙版注意力模块,以将文本实例特征生成为一个batch,并与最终字符序列建立一对一的映射。 只能使用粗略的文本位置信息和文本注释来训练该模块。 (3)广泛的实验表明,我们的方法在规则和不规则文本基准上均获得了有竞争甚至最新的性能。
早期场景文本发现方法(Liao,Shi,and Bai 2018; Liao et al.2017; Wang et al.2012)通常首先使用训练有素的检测器来定位每个文本,例如(Liao et al.2017; Zhou et al.2017; He et al.2017; Ma et al.2018; Xu et al.2019; Baek et al.2019),然后使用序列解码器识别裁剪后的文本区域(Shi et al.2016; Shi,Bai和Yao 2017; Cheng et al.2017; Zhan and Lu 2019; Luo,Jin and Sun 2019)。为了充分利用文本检测和文本识别之间的互补性,已经提出了一些工作以端到端的方式优化场景文本发现框架,其中使用了模块连接器(例如RoI Pooling(Ren等人,2015a))在(Li,Wang,and Shen 2017; Wang,Li,and Shen 2019)中,(He等人2018)中使用的RoI-Align和(Liu等人2018)中使用的RoI-Rotate的开发是为了文本检测和文本识别部分。请注意,这些方法无法发现任意形状的文本。 为了解决不规则问题,已经提出了许多最近的工作来设计各种自适应RoI操作以发现任意形状的文本。 Sun等人(2018年)采用了透视图RoI转换模块来纠正透视图文本,但是该策略仍然难以处理弯曲度较大的文本。 (Liao et al.2019)提出了受两阶段Mask-RCNN启发的mask textspotter,用于逐个字符地检测任意形状的文本,但是这种方法会丢失字符的上下文信息,并且需要字符级位置注释。 Qin等人(2019)直接采用Mask-RCNN和基于注意力的文本识别器,该模型使用RoI-Masking模块在识别之前消除了背景干扰。 (Feng et al.2019)将文本实例视为一组特征块,并采用RoI-Slide操作来重建直线特征图。 (Qiao et al。2020)和(Wang et al。2020a)都检测到文本周围的关键点,并应用薄板样条变换(Bookstein 1989)纠正不规则实例。为了获得弯曲文本的平滑特征(Liu et al.2020),使用Bezier曲线表示文本实例的上下边界,并提出了Bezier-Align操作以获取校正后的特征图。 上述方法在两阶段框架中实现了端到端场景文本点,其中需要设计基于RoI的连接器(例如RoI-Align,RoI-Slide和Bezier-Align等),以实现以下目的:明确裁剪特征图。 在两阶段框架中,性能很大程度上取决于RoI操作获得的文本边界精度。但是,这些复杂的多边形注释通常很昂贵,并且并不总是适合识别部分,如前所述。
在一般的对象定位领域,许多最新进展证明了在对象检测中研究的一阶段框架的效率和有效性(Redmon等人2016; Liu等人2016; Lin等人2017b; Tian等人2019;段等人(2019)或实例分割(Wang等人2019b; Tian,Shen和Chen 2020; Wang等人2020c; Xie等人2020; Chen等人2020)。但是,场景文本发现是一项更具挑战性的任务,因为它涉及序列识别问题而不是单个对象分类。这是因为场景文本具有许多特殊特征:任意形状(例如,曲线,倾斜或透视图等),数百万个字符组合,甚至是不受限制的阅读顺序(例如,从右到左)。最近,(Xing et al.2019)提出了一种通过直接分割单个字符的一种舞台场景文本识别方法。但是,它丢失了各个字符之间的序列上下文信息,并且很难传递给更多的字符类。据我们所知,以前没有工作可以在一个阶段的框架中处理序列级别的场景文本发现任务。
图2:MANGO的工作流程。 我们以S = 6为例。 将输入特征输入到位置感知蒙版注意力模块中,以将实例/字符的不同特征映射到不同通道。 识别器最终一次全部输出字符序列。 Centerline Segmentation分支用于生成所有文本实例的粗略位置。 前缀“ R-”和“ C-”分别表示网格的行和列。
我们提出了一个名为MANGO的单阶段场景文本查找器,如图2所示。其深层特征是通过ResNet-50(He等人,2016)和特征金字塔网络(FPN)(Lin等人,2017a)的主干提取的。 然后将生成的特征图馈送到三个可学习的模块中: (1)用于学习单个文本实例的位置感知蒙版注意力(PMA)模块,其中包括实例级蒙版注意力( IMA)子模块和字符级掩码注意力(CMA)子模块。 (2)识别器用于将注意力实例特征解码为字符序列。 (3)全局文本中心线分割模块,用于在推理阶段提供粗略的文本位置信息。
单阶段的文本识别问题可以视为原始图像中的纯文本识别任务。关键步骤是在文本实例到最终字符序列之间以固定顺序建立直接的一对一映射。在这里,我们开发了位置感知注意力(PMA)模块,以便为接下来的序列解码模块一次捕获所有表示文本的特征。受(Wang等人2019b)中使用的网格映射策略的启发,我们发现可以将不同的实例映射到不同的特定通道中,并实现实例到特征的映射。也就是说,我们首先将输入图像划分为S×S的网格。然后,通过提出的PMA模块将网格周围的信息映射到特征图的特定通道中。
具体来说,我们将特征提取后获得的特征图表示为x∈R C×H×W ,其中C,H和W分别表示为特征图的通道数量,宽度和高度。然后我们将特征图x送入PMA(包括IMA和CMA模块)模块,以生成文本实例的特征表示(如下所述)。
Instance-level Mask Attention MA负责生成实例级注意力蒙版遮罩,并将不同实例的特征分配给不同的特征图通道。 它是通过在切片网格上操作一组动态卷积内核(Wang等人2020c)来实现的,表示为G S×S×C 。卷积核大小设置为1×1。
因此可以通过将这些卷积核应用于原始特征图来生成实例级注意力掩码:
Character-level Mask Attention 正如许多工作 (Chenget等人2017; Xing等人2019)所表明的那样, 字符级位置信息可以帮助提高识别性能。 这激励我们设计全局字符级注意力子模块, 以为后续的识别任务提供细粒度的特征。
如图2所示,CMA首先将原始特征图x和实例级注意力蒙版x ins 连接在一起,然后是两个卷积层(卷积核大小= 3×3)遵循下式来预测字符级注意力蒙版:
由于将不同文本实例的注意蒙版分配给不同的特征通道,因此我们可以将文本实例打包为一批。 一个简单的想法是进行(Wang等人2020b)中使用的注意力融合操作,以生成批处理的连续特征x seq ,即
该模型现在能够分别输出S 2 网格的所有预测序列。 但是,如果图像中有两个以上的文本实例,我们仍然需要指出哪个网格对应于那些识别结果。
由于我们的方法不依赖准确的边界信息,因此我们可以应用任何文本检测策略(例如RPN(Ren等人2015b)和YOLO(Redmon等人。 2016)),以获取文本实例的粗略的几何信息。 考虑到场景文本可能是任意形状的,我们遵循大多数基于分割的文本检测方法(Long等人2018; Wang等人2019a)来学习单个文本实例的全局文本中心线区域分割(或缩小ground truth)。
IMA和CMA模块都用于使网络聚焦于特定的实例和字符位置,这在理论上只能通过最后的识别部分来学习。 但是,在复杂的场景文本场景中,如果没有位置信息的辅助,网络可能难以收敛。 但是,我们发现,如果模型已经在合成数据集上进行了预先的字符级监督,则可以轻松转移模型。 因此,可以分两步对模型进行优化。
首先,我们可以将IMA和CMA的学习视为纯分割任务。 结合中心线区域分割,所有分割任务都使用二进制Dice系数损失进行训练(Milletari,Navab和Ahmadi 2016),而识别任务仅使用交叉熵损失。 全局优化可以写成
请注意,预训练步骤实际上是一次性的任务,然后将主要学习CMA和IMA以适应该识别任务。 与以前需要平衡检测和识别权重的方法相比,MANGO的端到端结果主要由最终识别任务监督。
在推断阶段,网络输出一批(S×S)概率矩阵(L×M)。 根据中心线分割任务的预测,我们可以确定哪些网格应视为有效。 我们首先进行“广度优先搜索”(BFS),以找到各个相连的区域。 在此过程中,可以过滤许多类似文本的纹理。 由于每个连接区域可能与多个网格相交,因此我们采用字符加权投票策略来生成最终的字符串,如图3所示。
具体来说,我们计算连接区域i与网格j之间的连接率o i,j 作为每个字符的权重。 对于实例i的第k个字符,其字符加权投票结果通过
我们列出了本文使用的数据集如下:训练数据。我们使用SynthText 800k(Gupta,Vedaldi和Zisserman 2016)作为预训练数据集。利用实例级注释和字符级注释对PMA模块进行预训练。在微调阶段,我们旨在获得一个支持常规和非常规场景文本读取的通用文本点。在这里,我们构建了一个用于微调的通用数据集,其中包括来自Curved SynthText的150k图像(Liu等人2020),从COCO-Text过滤的13k图像(Veitet等人2016),从ICDAR-MLT过滤的7k图像(Nayefet等人2019)以及ICDAR2013(Karatzas等人2013),ICDAR2015(Karatzas等人2015)和Total-Text(Ch'ng and Chan 2017)中的所有训练图像。请注意,这里我们仅使用实例级别的注释来训练网络。测试数据集。我们在两个标准文本点标基准ICDAR2013(Karatzas等人2013)(IC13)和ICDAR2015(Karatzas等人2015)(IC15)中评估了我们的方法,其中主要包含水平和透视文本,以及两个不规则的基准Total-Text(Ch'ng和Chan 2017)和SCUT-CTW1500(Liu等人2019)(CTW1500),其中包含许多弯曲文本。车牌识别数据集CCPD中我们方法的能力(Xuet al.2018)。
所有实验均在Pytorch中使用8×32 GB-Tesla-V100 GPU进行。网络详细信息。特征提取器使用ResNet-50(He等人2016)和FPN(Lin等人2017a)从不同的特征图中获取融合特征水平。这里,C = 256的(4×)特征图用于执行后续的训练和测试任务.Lis设置为25以覆盖大多数场景文本单词。 BiLSTM模块有256个隐藏单元,训练详细信息,所有模型均由SGDoptimizer进行训练,批处理大小= 2,动量= 0.9和重量衰减= 1×10−4。在预训练阶段,以10个周期的初始学习比率1×10-2训练网络。每3个周期将学习率除以10.在微调阶段,初始学习率设置为1×10-3。为了平衡每批中的合成图像和真实图像的数量,我们将Curved SynthText数据集与其他真实数据集的采样比率保持为1:1。微调过程持续250k次迭代,其中学习率在120k迭代和200k迭代时除以10.我们还对所有训练过程进行数据扩充,包括1)将输入图像的较长边随机缩放为长度在[720,1800]范围内,2)将图像随机旋转[-15°,15°]范围内的角度,以及3)对输入图像应用随机的亮度,抖动和对比度。在不同的数据集中,我们将IC15的评估值设置为S = 60,将IC13,Total-Text和CTW1500的评估值设置为S = 40。我们将所有权重参数简单地设置为λ1=λ2=λ3=λ= 1。测试细节。由于输入图像的尺寸是重要的重要影响性能,因此我们将报告不同输入比例下的性能,即保持原始比例和将图像的较长边调整为固定值。所有图像都在单一尺度上进行测试。由于当前的实现方式仅提供了粗略的定位,因此,我们通过考虑IoU> 0.1的所有检测结果,修改(Wang,Babenko和Belongie 2011)的端到端评估指标。在这种情况下,由于某些低等级的建议匹配而导致精度下降,先前方法的性能甚至会下降。
常规文本的评估我们首先根据常规评估指标(Karatzas等,2015)对IC13和IC15的方法进行评估,然后基于三种不同的lexi-cons(强)对两个评估项目( 端到端''和 单词斑点'')进行评估,弱和通用)。表1显示了评估结果。与使用常规词典评估的先前方法相比,我们的方法在“通用”项目上获得了最佳结果(除了IC15的端到端通用结果之外),并在其余评估项目上获得了竞争结果(强”和“弱”)。与最近使用特定词典的最新MaskMaskTextSpotter(Liao et al.2019)相比,我们的方法在所有评估项目上均明显优于该方法。尽管推理速度很高,但FOTS的FPS最高(帧数第二),它无法处理不正常的情况。与基于不规则的方法相比,我们的方法获得了最高的FPS。不规则文本的评估我们在Total-Text上测试了我们的方法,如表2所示。我们发现我们的方法比最先进的方法高出3.2%和5.3 “无”和“满”指标中的百分比。请注意,即使没有明确的纠正机制,我们的模型也只能在识别监督的驱动下才能很好地处理不规则文本。尽管在1280的测试规模下,推理速度约为ABCNet的1/2,但我们的方法取得了显着的性能提升。我们还在CTW1500上评估了我们的方法。报告端到端结果的作品很少,因为它主要包含行级文本注释。为了适应这种情况,我们在CTW1500的训练集上对检测分支进行了重新训练,以学习线级中心线分割,并确定主干和其他分支的权重。请注意,识别不会受到影响,仍然会输出单词级序列。最终结果将根据推断的连接区域简单地从左到右连接起来。汉字设置为NOT CARE。结果如表3所示。我们发现,在“无”和“满”度量标准下,我们的方法明显比以前的提升了1.9%和4.6%。因此,我们相信,如果只有行级注解的数据足够多,我们的模型就可以很好地适应这种情况。
图4可视化了IC15和Total-Text上的端到端文本发现结果。 我们详细显示了字符投票之前每个正网格(oi,j> 0.3)的预测结果。 我们看到我们的模型可以正确地专注于相应的位置并学习任意形状(例如弯曲或垂直)文本实例的字符序列的复杂读取顺序。 采取字符投票策略后,将生成具有最高置信度的单词。我们还用可视化的CMA演示了CTW1500的一些结果,如图5所示。请注意,我们仅根据数据集的位置微调线级分割部分 标签,同时固定其余部分。在这里,我们通过将所有网格的注意图覆盖在相同的字符位置(k)上来可视化CMA的特征图:
网格编号的消除网格编号S2是影响最终结果的关键参数。如果太小,则占据相同网格的文本太多。否则,太大的S会导致更多的计算成本。在这里,我们进行实验以找到不同数据集的S的可行值。从表4中,我们发现IC13和TotalText的bestS均为40。 IC15的值为60。这是因为IC15包含更多密集和较小的实例。总而言之,当S> = 40时,总体性能随沙的增加而稳定。当然,FPS随S的增加而略有下降。信息。为了证明这一点,我们还进行了实验,以矩形边框的形式转移所有本地化注释。我们仅采用RPN头作为检测分支。表5显示了IC15和Total-Text的结果。即使进行严格的位置监控,MANGO的性能也只能降低0%到3%,并且可以与最新技术相比。请注意,粗略位置仅用于网格选择,因此可以根据特定任务的要求尽可能简化它。
为了证明模型的泛化能力,我们进行了实验以评估CCPD公共数据集上的端到端车牌识别结果(Xu et al.2018)。为了公平起见,我们遵循相同的实验设置,并使用带有250k图像的数据集的初始版本。 CCPD-Base数据集分为两个相等的部分:用于训练的100k样本和用于测试的100k样本。有6个复杂的测试集(包括DB,FN,旋转,倾斜,天气和挑战)用于评估算法的鲁棒性,总共有50k张图像。由于CCPD中的每个图像仅包含一个板,因此可以通过删除来进一步简化我们的模型检测分支直接预测最终字符序列。因此,网格数减少为S = 1,最大序列长度设置为L =8。我们直接对模型进行微调(已通过SynthText进行了预训练)在CCPD训练集上仅使用序列级注释,然后评估上述七个测试数据集的最终识别准确性。测试阶段是对尺寸为720×1160的原始图像执行的。 表6显示了端到端识别结果。尽管所提出的方法不是为车牌识别任务设计的,但仍然可以轻松地转移到这种情况下。我们看到,提出的模型在7个测试集中的5个中优于以前的方法,并达到了最高的平均精度。图6显示了CCPD测试集的一些可视化结果。故障样本主要来自图像太模糊而无法识别的情况。该实验表明,在许多情况下,只有一个文本实例(例如,工业印刷识别或仪表拨盘识别),可以使用良好的端到端模型无需检测注释即可获得。
在本文中,我们提出了一种名为MANGO的新颖的单阶段场景文本查找器。 该模型删除了RoI操作,并设计了位置感知注意模块来粗略定位文本序列。 之后,应用轻量级序列解码器以将所有最终字符序列成批获取。 实验表明,我们的方法可以在流行基准上获得具有竞争力的,甚至最先进的结果。
车牌自动识别能够快速准确的识别车牌号得益于百万高清像机及优异的车牌识别算法、优异的火眼臻睛车牌识别凭借数字宽动态技术及低照度清晰成像技术,车位视频检测终端在逆光、暗光等特殊环境下有良好的环境适应性表现,解决采用模拟摄像机无法准确的检测与识别的问题。
汽车牌照自动识别技术是一项利用车辆的动态视频或静态图像进行牌照号码、牌照颜色自动识别的模式识别技术。通过对图像的采集和处理,完成车牌自动识别功能,能从一幅图像中自动提取车牌图像,自动分割字符,进而对字符进行识别.其硬件基础一般包括触发设备(监测车辆是否进入视野)、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机(如计算机)等,其软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。 某些牌照识别系统还具有通过视频图像判断车辆驶入视野的功能称之为视频车辆检测。一个完整的牌照识别系统应包括车辆检测、图像采集、牌照识别等几部分。当车辆检测部分检测到车辆到达时触发图像采集单元,采集当前的视频图像。牌照识别单元对图像进行处理,定位出牌照位置,再将牌照中的字符分割出来进行识别,然后组成牌照号码输出。 车牌识别停车场管理系统将摄像机在入口拍摄的车辆车牌号码图象自动识别并转换成数字信号。做到一卡一车,车牌识别的优势在于可以把卡和车对应起来,使管理提高一个档次,卡和车的对应的优点在于长租卡须和车配合使用,杜绝一卡多车使用的漏洞,提高物业管理的效益;同时自动比对进出车辆,防止偷盗事件的发生。升级后的摄像系统可以采集更清晰的图片,作为档案保存,可以为一些纠纷提供有力的证据。 方便了管理人员在车辆出场时进行比对,大大增强了系统的安全性。
中国车牌的格式与国外有较大差异,所以国外关于识别率的报道只具有参考价值,其在中国的应用效果可能没有在其国内的应用效果好,但其识别系统中采用的很多算法具有很好的借鉴意义。从车牌识别系统进入中国以来,国内有大量的学者在从事这方面的研究,提出了很多新颖快速的算法。中国科学院自动化所的刘智勇等开发的系统在一个样本量为3180的样本集中,车牌定位准确率为99.42%,切分准确率为94.52%,这套系统后来应用于汉王公司的车牌识别系统,取得了不错的效果。但是包括其他研究人员提出的算法,都存在计算量和存储量大的问题,难以满足实时性的要求。此外,当车辆区域的颜色和附近颜色相近时,定位失误率会增加。国内还有许多学者一直在进行这方面的研究,并且取得了大量的研究成果。(2)国外研究现状 国外在这方面的研究工作开展较早,在上世纪70年代,英国就在实验室中完成了“实时车牌检测系统”的广域检测和开发。同时代,诞生了面向被盗车辆的第一个实时自动车牌监测系统。进入20世纪90年代后,车牌自动识别的系统化研究开始起步。典型的如特征提取、模板构造和字符识别等三个部分,完成车牌的自动识别。字符识别分析技术分析所获得的图像,首先在二值化图像中找到车牌,然后用边界跟踪技术提取字符特征,再利用统计最邻近分类器与字符库中的字符比较,得出一个或几个车牌候选号码,再对这些号码进行核实检查,确定是否为该车牌号码,最终确定车牌号码。这个时期的应用在识别正确率方面有所突破。发展到今日,国外对车牌检测的研究已经取得了一些令人瞩目的成就,识别率都在80%以上,甚至有高于90%。并且已经实现了产品化,并在实际的交通系统中得到了广泛的应用。
随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!
图像识别技术研究综述
摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。
关键词:图像处理;图像识别;成像
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02
图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。
1 图像处理技术
图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。
1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。
2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。
3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。
4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。
5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。
2 图像识别技术
图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:
2.1 指纹识别
指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。
2.2 人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。
2.3 文字识别
文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。
3 结束语
人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。
参考文献:
[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.
[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.
[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.
[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.
[6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.
点击下页还有更多>>>图像识别技术论文
车牌自动识别原理基本是经过车牌捕捉、定位、截取、二值化、字符切分,最后车牌OCR识别、结果输出,一般还会有字符识别后处理等几个步骤,这几个步骤要协调处理才行,还要使用各种情况,比如,雨雪天气、反光、阴阳车牌、晚上补光、污损车牌等具体实际情况进行各种优化,才能得到一个完美的车牌识别算法,如果做论文,可以直接用开源的一些东西去完善,如果实际应用,可以用商用的车牌OCR识别产品。启智畅想车牌识别SDK特点:1、毫秒级识别车牌,彻底解决手工输入痛点,快速、准确;2、手机相机视频预览识别车牌,可提供安卓、ISO、Windows、Linux等系统识别,支持移动设备离线识别以及电脑客户端、服务器端识别;3、支持识别的车牌种类多,蓝牌、黄牌、新能源车牌均可识别,4、复杂场景车牌均可识别,适应性强,白天晚上、远距离、大角度都能快速准确的识别车牌;5、车牌识别SDK开发部整体不超过500K,识别率高达99%;
汽车牌照定位与分割技术的研究论文编号:TX069 字数:35716,页数:73摘 要汽车牌照自动识别技术是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。汽车牌照自动识别系统是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统,它利用每一辆汽车都有唯一的车牌号码,通过摄像机所拍摄的车辆图像进行车牌号码的识别。在不影响汽车运行状态的情况下,计算机自动完成车牌的识别,可降低交通管理工作的复杂度。汽车牌照自动识别技术在车辆过路、过桥全自动不停车收费,交通流量控制指标的测量,车辆自动识别等方面有重要作用,因此ALPR技术的研究有重要的现实应用意义。本文重点介绍了汽车牌照自动识别系统中的关键技术,包括了图象预处理、汽车牌照定位与识别等内容。图象预处理方面主要介绍了图象灰度化和图象增强技术。在此基础上,还阐述了图像二值化和图像倾斜校正等方面的内容。对于汽车牌照定位与识别技术,重点是介绍了图像分割方法,简要提到了字符的识别技术。对于汽车牌照定位与分割系统的设计与实现,本文分别对该系统的两大模块进行了算法分析,并详细阐述了各模块实现的原理,最后给出了实验结果。关键词: 汽车牌照,图像预处理,牌照定位,图像分割,区域标识 ABSTRACTAutomatic license plate recognition (ALPR) is one of the most important aspects of applying computer techniques towards intelligent transportation systems. ALPR System uses computer vision and pattern recognition technology to management modern intelligent transportation. ALPR System is a smart identification system which based on digital image processing, pattern recognition and computer vision technology. ALPR System can identification license plate number because each vehicle have only one vehicle license plate number. Without affecting the operation of the vehicle, the computer can identify the license plate number automatically, which can reduce the complexity of the traffic management. Vehicle license automatic identification technology has important effect in vehicles crossing the bridge, measure the traffic indicators and automatic vehicle identification. Vehicle license automatic identification technology has played an important role in many different aspects. This paper focuses on the key technologies of the vehicle license plate recognition system, which include image preprocessing, vehicle license orientation and identification. In the part of image preprocessing introduces gray-scale image and image enhancement technology. On the other side, this paper also expounds on the value of the two images and proofread the gradient image. For vehicle licenses plate identification technology, the point is on the image segmentation method. This part also introduces the character recognition technique. In this paper, the design of the orientation and segmentation vehicle license plate system has two major modules. The most important is the algorithm analysis and the principle of the two modules. The end of paper is the experimental results.KEY WORDS vehicle licenses, image preprocessing, license positioning, image segmentation, regional identification 目录摘 要 IABSTRACT II第一章 绪论 11.1 研究背景及意义 11.2 国内外发展现状 21.3 车牌自动识别系统概述 41.4 论文组织结构 6第二章 车辆图像的预处理 72.1 图像的灰度化 72.2 图像增强 82.2.1 对比度增强 92.2.2 直方图均衡化 92.2.3 图像的滤波 102.3 图像的二值化 132.3.1 图像二值化的意义 132.3.2 二值化方法介绍 142.4 图像的倾斜校正 17第三章 车辆图像的分割 203.1 图像的分割 203.1.1 灰度门限法 203.1.2 灰度门限的确定 213.2 车牌分割的简介 213.2.1 基于区域的图像分割 223.2.2 基于边缘的图像分割 233.3 字符的分割与识别 243.3.1 字符的分割 243.3.2 字符的识别 25第四章 车辆定位与分割系统的设计与实现 274.1 图像预处理模块 274.1.1 图像灰度化算法实现 274.1.2 图像增强算法实现 294.2 牌照区域定位与分割模块 304.2.1 图像边缘检 31 4.2.2 阈值选取与图像二值化 324.2.3 定位车牌 334.3 设计介绍 354.3.1 系统模块分析 354.3.2 开发环境简介 364.3.3 界面功能介绍 37第五章 总结 415.1 工作总结 415.1.1 设计中遇到的困难 415.1.2 心得 425.2 工作展望 42致 谢 44参考文献 45附 录 程序 47--73以上回答来自:
车牌的底色有兰色、黄色、白色、黑色。 兰色是小车车牌(包括小吨位的货车) 黄色是大车或农用车用的车牌及教练车车牌,还有新产品为定型的试验车。摩托车也是黄牌的。 白色是特种车车牌(如军车警车车牌及赛车车牌) 黑色是外商及外商的企业由国外自带车的车牌。 大型民用汽车:黄底黑字; 小型民用汽车:蓝底白字; 武警专用汽车:白底红“WJ”、黑字; 其它外籍汽车:黑底白字; 使、领馆外籍汽车:黑底白字及空心“使”字标志; 试车牌照:白底红字,数字前有“试”字标志; 临时牌照:白底红字,数字前有“临时”二字; 汽车补用牌照:白底黑字。 另外,民用汽车牌照上有省、直辖市、自治区的名称和发证照及监督机关的代号,编号是英文大写字母。 后面的汽车编号,一般为5位数字,即从00001~99999。 编号超过10万时,就由A、B、C等英文字母代替,即A代表10万,B代表11万,C代表12万,最后一个字母及Z代表33万。 英文字母中的I和O避而不用,以免和数字中的1和0混淆。 使、领馆的外籍汽车牌照上的小数字是建交国家的代号,与所在地区的监管编号无关,就是这样.
第一个中文是 省份简称比如 皖第二个英文字母 是城市所写 比如皖A 指安徽合肥后面的是牌照的序号 安徽的牌照序号是选择的个性车牌,两个英文字母加3个数字,只要没重复的就可以用
原发布者:悠悠一心的论文申请理由尊敬的陈老师:您好!我是会计12-3班的李洪敏,我想要选您的论文《新疆中小企业融资问题分析》,很多同学都希望选您作为论文指导老师,所以我也倍感压力,现在我来陈述一下我选择的理由,希望老师您能允许我选这篇论文。首先,我先陈述我对这个论题的一些想法。我看到“新疆中小企业融资问题分析”这个题目就有一些想法,对这个论题很感兴趣,如果我写这篇文章,我会从以下几个方面来展开讨论:1、以新疆中小企业融资状况为研究背景,介绍新疆中小企业的发展历程及其在新疆经济发展中的作用。通过展现新疆中小企业对新疆发展的重要性来反映解决中小企业融资问题的必要性。2、分别展开分析新疆中小企业在直接和间接融资方面遇到的困境;比较新疆与内地中小企业融资方式;通过宏观和微观方面分析造成困境的原因。3、分析新疆中小企业现在的主要融资方式,以及长期无法有效的解决融资问题引起的弊端,迫使许多中小企业不融资或者转向非正规融资,前者限制其发展,后者存在扰乱正常融资秩序的风险。4、通过总结上述中小企业的融资案例分析,给出拓展新疆中小企业融资渠道对策(从自治区政府在融资制度方面给予优惠和完善、借鉴新的融资方式等方面提出对策),对新疆中小企业在融资过程中所遇到的问题给予一定的参考和借鉴。其次,对于这个论题我的优势,对于一名大四学生已经上过这方面的专业课,本人对融资方面的内容很感兴趣,所以这方面的知识也学的比较扎实,有信心能做好这个
申请答辩理由应该这样写:
毕业答辩申请理由篇
尊敬的毕业设计(论文)审核小组的领导和老师你们好:
经过近14周的努力,通过对螺旋棒零件的调研、翻阅相关的参考文献和资料,进行需求分析、系统研究、系统设计,最终完成了螺旋棒零件工艺规程设计及钻夹具的研究和设计。
在翻阅相关参考文献的阶段,通过查阅相关的机床夹具设计、切削用量手册等书籍,掌握了本系统研究设计的基本方法,基本掌握了如何操作该夹具对零件进行正常加工。
同时查阅外文资料并完成了对外文资料的翻译工作。
在需求分析和系统设计阶段,通过对可行性和系统进行分析,在确定设计确实可行的基础上进行进一步的研究。
在这次毕业设计中我认真学习螺旋棒零件工艺规程设计以及钻夹具设计的相关知识,严格遵循,老师的指导,按时完成任务,虚心的向同学请教和学习。
目前,毕业设计(论文)、中英文翻译、调研报告、3张A0图及相关资料文档均已完成,在此向老师提出答辩申请进入下一阶段的论文答辩,希望老师同意。
注意:论文答辩申请书范文的写作主要是写自己完成论文进程和完成论文的工作情况,并写自己是否可以按时答辩或者延期答辩
答辩申请书范文:校学位委员会:我是××级博士研究生(学号××),...在这里,拥有120多个实用范文栏目,非常值得已经成为公务员或即将成为公务员的...www.gwyoo.com/article/xzgaoshou/xzgs/200705/85682.asp
中国车牌的格式与国外有较大差异,所以国外关于识别率的报道只具有参考价值,其在中国的应用效果可能没有在其国内的应用效果好,但其识别系统中采用的很多算法具有很好的借鉴意义。从车牌识别系统进入中国以来,国内有大量的学者在从事这方面的研究,提出了很多新颖快速的算法。中国科学院自动化所的刘智勇等开发的系统在一个样本量为3180的样本集中,车牌定位准确率为99.42%,切分准确率为94.52%,这套系统后来应用于汉王公司的车牌识别系统,取得了不错的效果。但是包括其他研究人员提出的算法,都存在计算量和存储量大的问题,难以满足实时性的要求。此外,当车辆区域的颜色和附近颜色相近时,定位失误率会增加。国内还有许多学者一直在进行这方面的研究,并且取得了大量的研究成果。(2)国外研究现状 国外在这方面的研究工作开展较早,在上世纪70年代,英国就在实验室中完成了“实时车牌检测系统”的广域检测和开发。同时代,诞生了面向被盗车辆的第一个实时自动车牌监测系统。进入20世纪90年代后,车牌自动识别的系统化研究开始起步。典型的如特征提取、模板构造和字符识别等三个部分,完成车牌的自动识别。字符识别分析技术分析所获得的图像,首先在二值化图像中找到车牌,然后用边界跟踪技术提取字符特征,再利用统计最邻近分类器与字符库中的字符比较,得出一个或几个车牌候选号码,再对这些号码进行核实检查,确定是否为该车牌号码,最终确定车牌号码。这个时期的应用在识别正确率方面有所突破。发展到今日,国外对车牌检测的研究已经取得了一些令人瞩目的成就,识别率都在80%以上,甚至有高于90%。并且已经实现了产品化,并在实际的交通系统中得到了广泛的应用。
汽车牌照定位与分割技术的研究论文编号:TX069 字数:35716,页数:73摘 要汽车牌照自动识别技术是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。汽车牌照自动识别系统是以数字图像处理、模式识别、计算机视觉等技术为基础的智能识别系统,它利用每一辆汽车都有唯一的车牌号码,通过摄像机所拍摄的车辆图像进行车牌号码的识别。在不影响汽车运行状态的情况下,计算机自动完成车牌的识别,可降低交通管理工作的复杂度。汽车牌照自动识别技术在车辆过路、过桥全自动不停车收费,交通流量控制指标的测量,车辆自动识别等方面有重要作用,因此ALPR技术的研究有重要的现实应用意义。本文重点介绍了汽车牌照自动识别系统中的关键技术,包括了图象预处理、汽车牌照定位与识别等内容。图象预处理方面主要介绍了图象灰度化和图象增强技术。在此基础上,还阐述了图像二值化和图像倾斜校正等方面的内容。对于汽车牌照定位与识别技术,重点是介绍了图像分割方法,简要提到了字符的识别技术。对于汽车牌照定位与分割系统的设计与实现,本文分别对该系统的两大模块进行了算法分析,并详细阐述了各模块实现的原理,最后给出了实验结果。关键词: 汽车牌照,图像预处理,牌照定位,图像分割,区域标识 ABSTRACTAutomatic license plate recognition (ALPR) is one of the most important aspects of applying computer techniques towards intelligent transportation systems. ALPR System uses computer vision and pattern recognition technology to management modern intelligent transportation. ALPR System is a smart identification system which based on digital image processing, pattern recognition and computer vision technology. ALPR System can identification license plate number because each vehicle have only one vehicle license plate number. Without affecting the operation of the vehicle, the computer can identify the license plate number automatically, which can reduce the complexity of the traffic management. Vehicle license automatic identification technology has important effect in vehicles crossing the bridge, measure the traffic indicators and automatic vehicle identification. Vehicle license automatic identification technology has played an important role in many different aspects. This paper focuses on the key technologies of the vehicle license plate recognition system, which include image preprocessing, vehicle license orientation and identification. In the part of image preprocessing introduces gray-scale image and image enhancement technology. On the other side, this paper also expounds on the value of the two images and proofread the gradient image. For vehicle licenses plate identification technology, the point is on the image segmentation method. This part also introduces the character recognition technique. In this paper, the design of the orientation and segmentation vehicle license plate system has two major modules. The most important is the algorithm analysis and the principle of the two modules. The end of paper is the experimental results.KEY WORDS vehicle licenses, image preprocessing, license positioning, image segmentation, regional identification 目录摘 要 IABSTRACT II第一章 绪论 11.1 研究背景及意义 11.2 国内外发展现状 21.3 车牌自动识别系统概述 41.4 论文组织结构 6第二章 车辆图像的预处理 72.1 图像的灰度化 72.2 图像增强 82.2.1 对比度增强 92.2.2 直方图均衡化 92.2.3 图像的滤波 102.3 图像的二值化 132.3.1 图像二值化的意义 132.3.2 二值化方法介绍 142.4 图像的倾斜校正 17第三章 车辆图像的分割 203.1 图像的分割 203.1.1 灰度门限法 203.1.2 灰度门限的确定 213.2 车牌分割的简介 213.2.1 基于区域的图像分割 223.2.2 基于边缘的图像分割 233.3 字符的分割与识别 243.3.1 字符的分割 243.3.2 字符的识别 25第四章 车辆定位与分割系统的设计与实现 274.1 图像预处理模块 274.1.1 图像灰度化算法实现 274.1.2 图像增强算法实现 294.2 牌照区域定位与分割模块 304.2.1 图像边缘检 31 4.2.2 阈值选取与图像二值化 324.2.3 定位车牌 334.3 设计介绍 354.3.1 系统模块分析 354.3.2 开发环境简介 364.3.3 界面功能介绍 37第五章 总结 415.1 工作总结 415.1.1 设计中遇到的困难 415.1.2 心得 425.2 工作展望 42致 谢 44参考文献 45附 录 程序 47--73以上回答来自: