首页

> 期刊论文知识库

首页 期刊论文知识库 问题

图像融合的方法研究论文

发布时间:

图像融合的方法研究论文

【关键词】 图像配准; 多源传感器; 位置约束; 特征提取; 多种特征组合 【摘要】 随着遥感技术迅速发展和新型传感器的不断涌现,人们获取遥感图像数据的能力不断提高。在利用这些多源遥感图像进行数据融合、目标变化检测、目标识别等多源协同处理工作之前,必须进行多源图像配准工作,配准精度的高低直接影响到后续应用效果的好坏。为此,本文主要研究了多源遥感图像间的配准技术,作为协同系统中的关键技术,要求配准方法在运算能力和配准精度方面都能够达到较好的效果。首先,本文对现有的多源图像配准技术进行原理上的分析与介绍。通过对多种配准方法的分类与比较,指出了遥感图像配准的通用技术环节与技术要点。并在研究过程中分析关键技术环节的难点与所面临问题。其次,本文针对传统多源配准方法在进行控制点对应时运算量大,误配情况多的现状,提出了一种基于位置约束的多源遥感影像配准技术。该方法首先利用人工粗略选取少量控制点对,得到粗略位置映射关系,之后利用位置信息以及分辨率信息建立局部窗函数进行搜索匹配,对两幅图像中提取的Harris角点进行筛选,最终得到的控制点对作为求取配准参数的控制点输入,并利用此方法进行了多组图像的实验来证明方法的通用性。然后,本文针对传统配准方法需要人工参与,并且仅使用单一特征进行匹配效...更多果差的缺点,提出了一种基于多特征组合的多源遥感图像自动配准技术。这种方法利用了由粗至精的配准思想,结合使用点、线、面特征分别进行粗配准及精细配准两个过程。重点解决了其中少量初始控制点对的匹配和更多控制点对的获取。完成了存在闭合区域的多源遥感图像间的自动配准过程,并实验验证了方法的配准精度。最后,为了对配准后的遥感图像进行直观的视觉评价,本文介绍了配准后图像间的镶嵌以及融合等简单应用。通过实验,可以很直观的看出配准的效果,完成配准的定性评价。

图像融合是多传感器信息融合领域的一个重要分支[1],它是指将来自同一目标的不同传感器的信息通过一定的算法融合到一幅图上,从而获得比在单幅图上更完整、更精确的信息。图像融合在军事(如军事侦察、识别伪装)和非军事(如医疗诊断、遥感、计算机技术等)领域得到广泛的应用。就遥感图像融合而言,目前大致分4种类型:多种分辨率的融合处理、多时相的融合处理、多种传感器类型的融合处理、多波段大容量的融合处理。本文研究的对象属于最后一种,即不同光谱获得的图像。这里使用基于小波变换的塔式结构的优点是小波变换具有紧凑性、正交性、很好的方向性,这使得小波变换可以很好地提取不同尺度上的显著特征,相对于高斯—拉普拉斯金字塔技术而言,不仅可以产生更好的融合结果,而且进行反向变换时稳定性更好;另外小波变换的塔式结构还使得不管原图像的长度是否2的幂次方,最终变换后的图像与原图像尺寸相同,这使得开发实用的并行算法系统成为可能。本文正是基于这点,在对图像小波多分辨分解叙述的基础上,构造了一种图像融合算法,最后对算法进行了仿真,并对结果进行了分析。1图像的小波变换定义1多分辨分解设fj+1∈V2j+1,由V2j+1=V2j W2j可得,存在fj∈V2j,gj∈W2j,有fj+1=fj+gj对于图像f(x,y)而言,由文献[2]可得图像的Mallat二进小波的塔式分解为fj+1(x,y) =∑k,mCj,k,mj,k,m+∑ε=1,2,3∑k,mDεj,k,mΨεj,k,m(1)式中:Cj,k,m=∑l,nhl-2khn-2mCj+1,l,n;D1j,k,m=∑l,nhl-2kgn-2mCj+1,l,nD2j,k,m=∑l,ngl-2khn-2mCj+1,l,n;D3j,k,m=∑l,ngl-2kgn-2mCj+1,l,n在图像小波分解的表达式中Cj,k,m, D1j,k,m, D2j,k,m, D3j,k,m,分别对应图像的低频子带及水平、垂直与对角线3个方向的高频子带, Cj,k,m为图像在aj分辨率下的离散逼近,D1j,k,m, D2j,k,m, D3j,k,m为2j分辨率下的离散细节。{hk}k∈z可看作低通滤波器系数, {gk}k∈z可看作高通滤波器系数,为尺度函数,Ψ为正交小波函数。{j,k,m|k,m,∈z}构成Vj2的规范正交基,{Ψεj,k,m|j,k,m∈z}构成W2j的规范正交基。另外,通过小波分解,除了低频子带都是一些正的变换值外,其它的3个高频子带都包含了一些在零附近的变换值,在这些子带中,较大的变换值对应着亮度急剧变化的点,也就是图像中的显著特征,如边缘、亮线及区域轮廓。既然小波变换具有很好的空域及频域局部性,融合的效果就是:对来自同一目标的两个不同传感器所获解的图象A和B,融合前在图像A中若比图像B中显著,融合后图像A中的目标就被保留,图像B中的目标就被忽略;对不同的场景,比如图像A中的目标的外部轮廓比较明显,图像B中目标的内部轮廓比较明显,这种情况,图像A、B中目标的小波变换系数将在不同的分辨率水平上占统治地位,从而在最终的融合图像中,图像A中的外部结构与图像B中的内部结构都被保留。因此通过融合可以实现在单幅图像上的片面的、不完整、不精确的信息得到更一致更精确的体现。最后对组合后的变换系数进行反向小波变换,就可得到融合后的图像。2基于区域的图像增强算法在图像的融合算法中,图像不同,图像的数据表征不同,融合算法也各不相同,目前采用的融合方法主要有[3]:基于像素的代数组合法、统计/数值法以及与颜色有关的技术。但是我们知道图像中的有用特征通常大于1个像素,因此基于像素的选择方法可能不是最适合的,近几年又提出了基于区域的选择方法,比较有代表性的是文献[4]中提出的基于区域的均值选择法,该方法用一M×N的窗口对图像块进行求方差运算,计算结果作为与窗口中心像素对应的一种度量方法,中心像素的选择方法为:如果两幅图像方差在对应位置上的度量值相近,取2者的均值作为输出的新值,否则取较大的值作为输出。文献[5]中提出利用不同的特征选择算子,有方向的计算对应细节图像的局域能量,由局部能量构造匹配度及加权因子,从而对图像进行加权运算。这里以均值、方差、相关等统计参量构造一种新的区域融合算法。以下计算以两幅图像为例,对3幅以上的图像融合算法与此类似,具体步骤如下:首先,利用M×N (一般选M,N为奇数,常用的窗口为3×5或5×5)窗口计算小波分解各子带系数的均值和方差,子带中以(x,y)位置为中心的区域均值与方差分别为mi(x,y) =1M×N∑Mm=1∑Mn=1fi(x+ m -M+12,y+ n -N+12) (2)σ2i(x,y) =1M×N∑Mm=1∑Mn=1(fi(x+ m -M+12,y+ n -N+12)- mi(x,y))2(3)图像1以(x,y)位置为中心与图像2对应区域的协方差为β2(x,y)=1M×N∑Mm=1∑Mn=1(fi(x+m-M+12,y+n-N+12)-m1(x,y))×(f2(x+m-M+12,y+n-N+12)-m2(x,y))(4)构造匹配度ρ及加权系数W:ρ=β2σ1σ2;Wmax=1-12ρ;Wmin=1-Wmax然后,利用下式对两幅图像中的对应子带像素进行融合计算f(x,y)=Wmax·MAX(f1(x,y),f2(x,y))+Wmin·MIN(f1(x,y),f2(x,y)) (5)这里f1(x,y),f2(x,y)是上述对应窗口中心位置的两幅图像的像素灰度值。这样就完成了2j分辨率下的数据融合,最后对融合后的子带系数进行反变换就可得到融合后的图像。需要的话给我你的邮箱,发到你邮箱!

图像融合算法研究论文

医学影像诊断学是医学影像学中的一门重要学科,而医学影像学是临床医学的一个重要分支。下面是我为大家整理的医学影像技术专业 毕业 论文,供大家参考。

《 高职影像专业医学影像物理学的教学探讨 》

摘 要: 根据课程特点、学生现状,我们重视教师素质培养,理清教材层次与学生的关系,运用丰富的 教学 方法 ,变抽象的论述为理论联系实际的形象化教学,提高了医学影像物理学课程的教学质量。

关键词: 高职 医学 影像物理学 教学探讨

近十几年来,大型医学影像设备的迅速发展,极大地提高了诊断治疗水平。随着社会对医学影像专业人才的需要愈加迫切,国内众多本科医学院校都设置了医学影像专业。而随着我国社区医疗的发展,填报高等职业技术学院医学影像专业的学生人数不断增加。以湖北职业技术学院为例,影像专业学生录取人数由每年一个班提高到两至三个班。不论各院校侧重培养高学历医学影像临床诊断专业人才,还是侧重培养高学历医学影像工程技术人才,在专业课程设置过程中,都强调了开设医学影像物理学基础(以下简称影像物理学)这门课程的重要性和必要性。有些本科院校还在临床医学专业开始开设影像物理学为选修课程,目的就是让临床医师具备医学影像的基础理论知识,为将来后续专业课程――医学影像诊断学或医学影像学的开设提供必要的理论基础。

1.高职医学院校影像专业课程设置现状

以湖北职业技术学院为例,高职医学院校影像专业现在招收高中文科和理科学生及中职生。在课程开设上,只在大学一年级开设医学电子学基础这一门理工科课程,相关高等数学知识缺乏,学生的数理基础比较薄弱。医学影像物理学基础是一门交叉学科,又是一门非常重要的专业基础课。教学目的是让学生掌握医学成像理论的物理学基本原理、规律;了解医学成像的物理理论知识;为深刻理解成像过程,评价图像,以及读识图像、挖掘图像蕴藏的生物信息奠定基础。这就需要一定的高等数学、核物理学、量子物理、超声波物理等许多知识来做铺垫。当然更多需要成像技术的相关基础知识。面对这些必要的知识,影像专业高职生在有限的时间、有限的学时里是完成不了的,这是事实。其实,影像物理学是伴随影像专业的建立而诞生的一门新课程,在国内存在尚不足十年。因此,从教材到教学,各校都处于摸索前进的阶段。如何让高职生在无基础的前提下有效学习该门课程,我将自己在几年教学过程中的教学体会写出来,与大家共同探讨。

2.提高教师的专业素质,必须树立专业思想

由于缺乏相关师资力量,目前各院校影像物理学的教学任务大都由物理学教研室的教师承担。但是,物理学和影像物理学两门课程的专业性质差别很大,前者为理科基础课,后者为专业基础课。从事影像物理学教学的教师必须具备一定的医学专业知识,具备较高的专业素质,教学必须树立专业思想,才能将物理学知识和影像学知识有机结合起来,增强学生的学习兴趣,提高该课程的教学质量。因此,授课教师应加强自身专业素质,利用临床进修的机会学习影像知识和实际技术,尽力做好教学工作。

3.教学过程中必须恰当把握知识的深度

影像物理学是先期开设影像专业院校的教学工作者在教学过程中逐步完善而建立的。它是将高等数学知识、物理学知识、成像理论,计算机技术等知识应用于超声成像技术、X-CT成像技术、同位素成像技术、磁共振成像技术中的一门交叉学科。知识的起点很高,学生学习起来有一定的难度,在教学过程中应恰当把握教材知识的深度,讲解需深入浅出,通俗易懂。比如超声场的描述部分,涉及较多的高等数学知识,在教学过程中应注意引导学生注重理解场的分布性质、描述场的量的物理意义,等等,尽量避免学生由于数学知识少而降低对该课程的理解和学习兴趣。磁共振部分,学生需要具备一定的原子核物理、量子力学知识才能准确理解核自旋的能级、跃迁等概念和现象。在教学中应注意搜集一些资料,尽量用较通俗的、经典的、宏观假说进行解释,增强学生对微观世界的感性认识。

4.注意把握影像物理学原理与成像技术、影像设备学有关知识的权重关系

X-CT成像、超声成像、同位素成像、磁共振成像每一部分都有两项主要内容:物理基本原理和成像基本原理。在教学过程中应把主要精力放在讲解物理学基本原理上,这是毫无疑问的,这也是物理专业毕业的教师最容易做到的,但学生的学习兴趣往往集中在成像原理上,对涉及的成像技术、成像设备等知识更表现出浓厚兴趣。虽然成像技术和成像设备在后期专业课程的实践教学中会详细讲解,在这里我们对这部分做简要的介绍,以收到良好的教学效果。这些年来,我校历届学生都表现出对影像物理的极大学习兴趣。这与我们的教学方法有一定的关系。

5.注意提高学生对知识的感性认识

影像物理学各部分知识都是比较抽象的,学生普遍觉得难懂难学。因此,通过各种手段提高学生对知识的感性认识,能对学生的学习起到事半功倍的帮助作用。在教学过程中,我们将陀螺进动实验给学生做演示,讲解原子核中核子的自旋与自旋磁矩的相关知识;借助于声波的传播与反射知识对超声测量实验进行详细讲解;分配一定的学时带领学生到附属医院相关科室参观学习。邀请超声,CT临床诊断教师和技术教师给学生当场讲解仪器的原理、操作方法,以及诊断等,使学生对课堂上学到的知识有一个感性认识,加深理解,收到了很好的效果。

6.实现教材的多层次、立体化

由于该课程属于应用型的知识,学起来难度更大,我们进行了教材的多层次、立体化尝试。课程是教材的基础,教材是课程的载体,教材中要融入现代化的教学技术,实现多样化、配套和协调化。我们的做法是:文字教材与现代多媒体手段紧密结合。

教材体系包括:(1)传统的纸质教材《医学影像物理学》(人民卫生出版社出版);(2)教师授课用的独创的电子教案,其中配以大量的自制和临床实拍图片和自己研发的动画,并提出学生思考的问题;(3)辅助学生自学和研究的学习软件,如《CT与磁共振成像原理》CAI课件(人民卫生电子音像出版社公开出版发行,被列入“十一五”国家重点电子出版物);(4)网页形式课件2部。初步形成了多形态、多用途、多层次的教学资源和多种以教学服务为目的的结构性配套教学出版物的集合。

总之,影像物理学是一门新课,只有不断摸索,不断 总结 经验 ,逐步改进教学方法和手段,才能增强教学效果。通过几年来的努力,一方面学生看到了现在所学的就是将来所用的,提高了学习基础课的兴趣,另一方面学生培养了学习能力,同时对后续课程“医学影像诊断学”的学习奠定了基础。

参考文献:

[1]侯淑莲,李石玉,马新超等.关于医药学院校物理课程的思考[J].大学物理,2005,24,(5):53-56.

[2]包尚联,唐孝威.医学物理研究进展[J].自然科学进展,2006,16,(1):7-13.

[3]童家明,刘成玉,周晓彬等.普通高等学校医药类专业物理理论课教学现状调查[J].大学物理,2005,24,(7):55-59.

[4]侯淑莲.CT与磁共振成像原理[M/CD].北京:人民卫生电子音像出版社,2007.

《 刍议影像融合推动医学影像领域发展 》

内容摘要:科技的进步不仅是带动了工商业的发展,同时也推动了医学发展,计算机技术被广泛用于影像医学中。现在医学上的各种检查仪器越来越精密,功能更加完善,图像信息的存储和传输为医学的研究和诊断提供了更好的依据。医学影像的融合就是影像信息的融合,是借助计算机技术辅助诊断病情的。医学影像的融合是医学影像学新的发展方向,本文对医学影像的融合进行分析,探讨影像融合对医学影像发展的影响和作用。

关键词:医学影像 影像融合 诊断

一、影像融合

医学影像融合其实就是利用计算机技术,将影像信息进行融合。其中包括将图像信息进行数字化处理,再进行数据协同和匹配,得到一个新的影像信息来获得对病情更好的观测,以计算机为辅助手段,使诊断更加准确、具象。

影像融合的发展趋势

影像融合的趋势

医学影像学是近年来发展的比较快的临床学科之一,其中的超声、放射等早就被应用到医学的诊断上,但是,面对不同病人的各种症状,单一的影像检查已经不足以作为诊断的依据。因此,影像融合越来越成为医学中的焦点,人们更希望通过多重的影像检查、比较和分析,使检查结果更准确,更好的辅助临床疾病的治疗。影响融合的发展提高了医学诊断的综合水平,对于推动影像学的发展有重要的意义。而且,医学影像的融合不仅可以对诊断锦上添花,还可以为治疗提供帮助。例如:X线、超声、聚焦和磁共振结合在一起进行治疗。影响融合的发展是势在必行的,而且将推动医学影像学的更新与发展。

影像融合的必要性

1、医学技术的更新与发展需要影响融合

计算机技术被广泛应用于各个领域中,这也包括医学影像学。随着新技术的发展和实施,图像后期处理技术也需要不断的提高,影像的融合技术就是后处理技术的新发展。前后技术的同步才能更好的将影像学的好处发挥出来。

2、影像融合使检查更全面准确

影像学的检查手段是很多的,从B超到射线再到CT等,每项检查都是有针对性的,但是正因为这样又有一定的局限性。每项检查都有单一局限性,只能准确的体现一方面的数据值,不利于诊断病情。影像的融合弥补了这一缺陷。

3、临床诊断需要影像融合

一切的检查手段都是为了最终的临床治疗,影像诊断一样是为临床治疗服务的。影响的融合,集中了多项单一检查的优势,呈现的图像更清晰,更便于医生的判断,使诊断更清晰准确,也就能根据诊断提供更好的治疗方案,辅助临床治疗。

影响融合的方法和技术应用

首先是信息技术的融合。无论是什么样的诊断技术,最后要得到的都是这项技术所能诊断出来的信息。影像的融合首先要实施对信息的融合,图像数据的转换是理解是关键。而图像的转换时将不同检查设备检测的图像信息进行格式的转换和调整,使其更逼真的呈现出检测部位的状态,确保诊断的准确性。

其次是数字化技术的融合。建立图像数据库是比较直观和易于提取信息的。

还有就是计算机技术的应用,这几项技术的融合,使影像融合后的检查更加具体详细。

影像融合的方法:界标 配对 、表 面相 合法、空间力矩配对、交叉相关法。

四、 医学影像融合的临床价值

现代医学已经把用计算机技术对获取的影像信息进行处理的研究成果应用于临床医学的诊断,将各项检查结果通过计算机技术进行分析、处理,将影像融合重新现出清晰度高、高质量的影像。主要有以下几个方面的临床价值:

帮助临床诊断

影像融合后的图像将检查部位的结构和周边组织清楚地呈现出来,通过影像诊断,医生能够更加了解检测部位的组织形态是否发生病变以及病变的程度。很多疾病早期的病变都是不太明显了,一旦没被发现就可能会错过最佳的治疗时机。影像融合后的图像可以通过区域放大将组织的差异标注出来,便于观察和诊断,能够及时的发现病变,减少漏诊的情况。

有助于手术的治疗

影像融合的中,结合了图像重建和三维立体定向技术,这些技术的应用能够清晰的显示出病变部位及其周围组织的状况和空间状态,医生可以根据融合后的图像制定手术方案,并在手术实施过程中提供实时显示,也为术后的观察提供了方便。

有助于医学研究

影像的融合结合了多项检查的优势,提供的影像信息更全面清晰,病理特征更明显,是医学研究中非常有价值的影像学资料,为以后疾病的研究提供更好的依据。

结语:医学影像的融合就是将多项检查的优点,经过一系列计算机技术的融合和处理重新形成新的图像。医学影像的融合是医学影像技术发展的一次伟大的更新,它将各种各种技术综合运用到医学的检查和诊断上,推动了影像学的进一步发展。

参考文献

[1]王静云,李绍林;医学影像图像融合技术的新进展[J];第四军医大学学报;2004年20期

[2]李熙莹;黄镜荣;;图像融合技术研究及其在医学中的应用[A];大珩先生九十华诞文集暨中国光学学会2004年学术大会论文集[C];2004年

[3]吴疆;医学图像融合算法研究[D];西北工业大学;2006年

[4]张孝飞,王强,韦春荣,王至诚,张福北;医学图像融合技术研究综述[J];广西科学;2002年01期

[5]赵敏志;李钢;张仁斌;;图像融合技术现状[A];第六届全国信息获取与处理学术会 议论文 集(3)[C];2008年

[6]康晓东.计算机在医疗方面的最新应用.北京:电子工业出版社,1999,46-70.

有关医学影像技术专业毕业论文推荐:

1. 医学影像毕业论文范文

2. 有关医学影像类毕业论文

3. 医学影像本科毕业论文

4. 医学影像学研究论文

5. 关于医学影像的论文

融合算法fusionalgorithm如:(多传感器单目标位置融合算法)经纬仪引导数据的数据融合可以采用参数估计融合算法,即对8组引导数据,按照某种估计准则函数融合算法fusionalgorithm如:(多传感器单目标位置融合算法)经纬仪引导数据的数据融合可以采用参数估计融合算法,即对8组引导数据,按照某种估计准则函数

这篇博客介绍两篇基于多图像融合的低亮度图片增强算法: 基于多图像融合的低亮度质量评价算法主要考虑融合多幅图片来进行低亮度图片的增强。 由Retinex理论:其中 是亮度分量, 是RGB通道上的反射分量, 是待增强的分量。 首先,使用RGB通道上每个pixel的最大值最为亮度分量的一个估计值。因为图像的亮度分量一般是局部光滑的,所以文章中使用了形态学中的闭环操作来进一步估计亮度分量:公式中除以255是为了将亮度分量限制到了[0,1],文章中选取了disk作为结构元素。 亮度分量通过guided filter来保持the shape of large contours:是中心在 上的窗口。 multi_fusion融合了多幅增强的亮度分量: 最后,权重由以下公式表示:文章中首先将各个亮度分量 通过Laplacian金字塔分解为多个尺度上特征图,将权重 使用高斯金字塔光滑过度的部分。 将第 金字塔层的图像进行融合:融合多个金字塔层的图像: 其中 是上采样操作。 最后增强的图片由下式得到:EFF考虑融合同一场景下不同曝光程度的图片来增强低亮度图片。 为了得到完美曝光的图片,Exposure Fusion框架融合了不同曝光的图片: 其中 是各个颜色通道上的不同曝光率下的图片, 为对应的权重。 由之前基于相机响应模型的低亮度图片增强算法,我们可以得到同一场景下,不同曝光率的图片间的转换公式:在这篇文章中,作者只考虑了两种曝光率的图片,第一种是低亮度下的图片,另一种是低亮度下的图片使用曝光增强后的图片。由于需要将曝光完好的像素赋予更大的权重,所以文章中使用图片的亮度分量作为权重: 其中 用来调节增强的程度 对于亮度分量的求解可参考原文或是之前介绍基于相机响应模型的低亮度图片增强算法的博客。 与之前介绍基于相机响应模型的低亮度图片增强算法的博客中一致:文章中首先排除了原图中曝光较好的像素点: 其中 只包含了曝光不足的像素点。 的亮度部分定义为:则对于曝光率增强后的亮度分量有:将曝光不足的像素点转化为曝光正常的像素点后,可以提供的信息应该变大,所以,这里使用了图片墒最大化来求解曝光比:则由 可得到增强后的图片。

图像二值化方法的研究论文

二值图像 顾名思义 图像中只有两种颜色的信息 通常是黑色和白色 是将普通图像二值化后得到的图像 图像二值化的作用是为了方便提取图像中的信息 二值图像在进行计算机识别时可以增加识别效率比如 需要计算水面悬浮物的数量 就可以将一定面积的水拍成图片后二值化:黑色为水 白色为悬浮物然后通过计算机进行图像扫描 如果是黑色 0 就继续扫描如果是白色 1就改变变量 通过连续算法 得出一个悬浮物如果是彩色的 计算机要计算很久 而二值化的图像则更快得多

图像二值化的目的是最大限度的将图象中感兴趣的部分保留下来,在很多情况下,也是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。这个看似简单的问题,在过去的四十年里受到国内外学者的广泛关注,产生了数以百计的阈值选取方法,但如同其他图像分割算法一样,没有一个现有方法对各种各样的图像都能得到令人满意的结果。本文针对几种经典而常用的二值发放进行了简单的讨论并给出了其 实现。1、P-Tile法Doyle于1962年提出的P-Tile (即P分位数法)可以说是最古老的一种阈值选取方法。该方法根据先验概率来设定阈值,使得二值化后的目标或背景像素比例等于先验概率,该方法简单高效,但是对于先验概率难于估计的图像却无能为力。2、OTSU 算法(大津法)OSTU算法可以说是自适应计算单阈值(用来转换灰度图像为二值图像)的简单高效方法。1978 OTSU年提出的最大类间方差法以其计算简单、稳定有效,一直广为使用。3、迭代法(最佳阀值法)(1). 求出图象的最大灰度值和最小灰度值,分别记为Zl和Zk,令初始阈值为:(2). 根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值Z0和ZB:式中,Z(i,j)是图像上(i,j)点的象素值,N(i,j)是(i,j)点的权值,一般取1。(3). 若TK=TK+1,则所得即为阈值,否则转2,迭代计算。4、一维最大熵阈值法它的思想是统计图像中每一个灰度级出现的概率 ,计算该灰度级的熵 ,假设以灰度级T分割图像,图像中低于T灰度级的像素点构成目标物体(O),高于灰度级T的像素点构成背景(B),那么各个灰度级在本区的分布概率为:O区: i=1,2……,tB区: i=t+1,t+2……L-1上式中的 ,这样对于数字图像中的目标和背景区域的熵分别为:对图像中的每一个灰度级分别求取W=H0 +HB,选取使W最大的灰度级作为分割图像的阈值,这就是一维最大熵阈值图像分割法。

二值图像的作用:图像二值化的作用是为了方便提取图像中的信息,二值图像在进行计算机识别时可以增加识别效率。比如:需要计算水面悬浮物的数量,就可以将一定面积的水拍成图片后二值化。二值图像是指每个 像素不是黑就是白,其灰度值没有中间过渡的图像。二值图像一般用来描述文字或者图形,其优点是占用空间少,缺点是当表示人物、风景的图像时,二值图像只能描述其轮廓,不能描述细节。这时候要用更高的灰度级。二值图像是每个像素只有两个可能值的数字图像。人们经常用单色图像表示二值图像,但是也可以用来表示每个像素只有一个采样值的任何图像,例如灰度图像等。二值图像中所有的像素只能从0和1这两个值中取,因此在MATLAB中,二值图像用一个由0和1组成的二维矩阵表示。这两个可取的值分别对应于关闭和打开,关闭表征该像素处于背景,而打开表征该像素处于前景。以这种方式来操作图像可以更容易识别出图像的结构特征。二值图像操作只返回与二值图像的形式或结构有关的信息,如果希望对其他类型的图像进行同样的操作,则首先要将其转换为二进制的图像格式,可以通过调用MATLAB提供的 im2bw()来实现。二值图像经常出现在数字图像处理中作为图像掩码或者在 图像分割、 二值化和dithering的结果中出现。一些输入输出设备,如激光打印机、传真机、单色计算机显示器等都可以处理二值图像。

问题: 我在提取图像边缘的时候,首先对图像进行灰度变换,之后进行二值处理,最后进行边缘检测得到边缘图像。 但是在查阅资料的过程中我经常发现很多人忽略二值化的步骤,直接进行边缘检测;还有很多人在实现某些功能的时候先进行边缘检测之后再阈值分割,让我感到非常迷惑,这篇文章旨在探求二者的关系。

首先要知道图像二值化和边缘检测的目的。

图像的阈值处理一般使得图像的像素值更单一、图像更简单。阈值可以分为全局阈值和局部阈值,可以是单阈值也可以是多阈值。 图像二值化是设置单阈值,为了将图像中感兴趣的像素分离出来作为前景像素,不感兴趣的部分作为背景像素。

最简单的二值化操作是使用以下函数:(这是全局化的阈值)

上述的二值化处理是设置一个全局阈值,让所有像素值与该阈值比较,下面还可以通过自适应阈值实现图像的二值化处理。 自适应阈值不需要确定一个固定的阈值,根据其对应的自适应方法,通过图像的局部特征自适应的设定阈值,做出二值化处理。 自适应阈值是一种局部阈值,要在图像中确定一个区域,求出该区域内的像素平均值,再与阈值比较

adaptiveMethod - 指定计算阈值的方法。   :阈值取相邻区域的平均值   :阈值取相邻区域的加权和,权重为一个高斯窗口。

thresholdType - 和上面一样 blockSize - 邻域大小(用来计算阈值的区域大小),计算图像的像素区域一般取3×3、5×5、7×7..... C - 常数,阈值等于平均值或者加权平均值减去这个常数。该参数用于微调阈值,可以为负数

还有一种非常多人提及的方法——Otsu’s 二值化,这种方法下次再记录。

要对图像进行边缘检测,首先对图像进行灰度变换,使图像只包含一个通道的信息,然后比较各相邻像素间的亮度差别,亮度产生突变的地方就是边缘像素,将这些边缘像素点连接到一起就形成了边缘图像。 那么首先要知道如何检测出边缘: 边缘有方向和幅值两个要素,通常对图像相邻域像素求取梯度来描述和检测边缘。 为何要求梯度? 图像梯度是对多个方向分别求偏导得到的导数组。比如下图是亮度在x方向上变化,在y方向上没有变化,所以此时只需对x求偏导,该处关于y的偏导为0。

同样图像的亮度在y轴变化时,x方向的偏导为0。

我们知道,当一个函数在某处变化大的时候,它的导数在该处得到极值。

可以看到,图像由亮变暗时函数陡然下降,导数得到极小值,由暗变亮时函数又陡然上升,导数得到极大值,接下来只要找到导数的峰值就行。

这里主要了解Canny边缘检测算法。 Canny算子首先对图像进行平滑滤波,滤除图像的噪声以减少噪声对图像边缘检测的干扰。 下面这两篇文章对Canny算子的介绍非常清晰,在此附上链接以供学习。 在进行边缘检测之前至少要将图像灰度化,因为梯度运算并不能反映色彩的变化差异,所以转换成只有一种颜色通道的灰度图像能够更好地进行边缘检测。

深入了解过图像二值化和边缘检测之后,我认为既可以直接使用灰度图像进行边缘检测,也可以二值化之后再进行边缘检测,二值化的目的是进一步简化灰度图像,使图像中的信息更加纯粹,边缘亮度变化更加明显。如果阈值选的较好还可以滤除不需要的弱边缘,使边缘处理后的图像轮廓更加清晰。

还有一种方法是先进行边缘检测,再二值化,这种情况一般适用于: 想得到二值化图像,但由于原图出现光照不均、前景和背景灰度差别很小等情况,我们不能直接得到完整的目标,这时就可以利用边缘检测对光线变化的不敏感性,先对图像作边缘检测,检测出我们想要进一步研究的目标轮廓,然后再根据只有边缘的图像,求出原图像所有边缘点的像素平均值,将该值作为阈值对原图像进行二值处理,就能很好得获得目标区域,并且目标区域的连通性也很好。

笔者刚刚开始学习图像处理与计算机视觉,可能会出现许多错误,欢迎各位提出改进意见!

融合度方法研究论文

论文原文: A Semantic-based Medical Image Fusion Approach 医学图像融合对临床诊断有着很重要的作用。但是目前存在的医学图像融合方法忽略了图像的语义信息,试融合后的图像难以理解。(本来融合就是要更多的保留不同模态之间的互补信息来辅助诊断的。因此语义信息当让重要了。)在本文中提出了一种基于语义的医学图像融合方法。Fusion W-Net(FW-Net)。大大的减少了语义信息的损失。并且与先进方法一样有较好的视觉效果,在临床应用上有很大潜力。 低成本的融合方法大致采用这样策略:把不同域的图像转换成不同尺度的参数,然后采用人工设计的规则来优化融合他们,但是这些方法忽视了不同模态之间的语义冲突。例如:骨组织在CT中试比较亮的,但是在MR-T2图像中试安的(这是由不同模态图像的成像原理决定的)因此这些存在的方法有如下两个弊端: 1)现存方法忽视语义冲突。从而导致融合图像的于一损失,如,CT中亮的是密度的组织,MR中量的部分代表组织的流动性和磁性。所以不容模态之间图像嗯待亮的部分的语义完全不同。 2)不考虑亮度语义的融合方法会导致某些脑组织边界模糊。在图1 (b)的绿色框架中,我们可以清楚地看到额窦的炎症区域,这也是临床医生关注的重点。但由于图1 (a)对应部分为亮部,融合时额窦边界(c)(d)和(e)变得模糊。 在本文中我们提出了基于语义的融合方法:先提取不同模态的图像的语义特征,然后把他们映射到新的语义空间,然后再新的于一空间生成出融合的医学图像。采用的FW-Ne由两个U-net组成。 两种方式:1)任务中有目标域的情况(目标域是其中一个源域):这种一般是把另一个域的图像融合进这个域。通过像素级或者结构级的回归来实现。2)目标域不在任务中通常训练一个度量来生成图片。 底层保留了细粒度信息,高层保留了语义和高频信息。这再图像融合中是有益的。 1)从源域提取信息,包括结构信息和语义信息 2)把不同域的信息映射到相同的空间, 3)再相同空间内融合重建图像。 自动编码器中编码器用力拍提取特征,解码器用来进行重构,通过最小化生成图像和源图像之间的均方误差(MSE)来进行学习和训练。 编码器和解码器都使用U-Net。第一U-Net用于生成融合图像从两个源域到目标域,第二U-Net用于重建源图像。最后,通过最小化重构误差得到融合后的图像。传统的自编码器框架是完全连接的,因此编码器的矢量输出不能保证与源图像在空间上保持一致,而U-Net采用局部连接结构,使得输出矢量在空间上保持一致,从而得到视觉融合的图像。 前两项是重构的语义损失,个人感觉类似于cycle的损失。只不过cycle的损失还有对抗损失这里没有用到鉴别器。 KL散度的目的是是图像平滑,是图像平滑和显著性之间的权衡。 最后一项是正则化,防止模型过拟合 为了评估语义损失,为每个方法训练一个编码器,再训练过程中用来优化 训练之后采用下式来计算语义 损失 1)在编码器和解码器的每一层都加入了batchnorm 加速收敛,提升效果CT and MR-T2 Q_MI 互信息 QAB/F 衡量边缘信息保留成都 SSIM 结构相似性 Q_D 视觉不同行 SL 语义损失 SSIM一个很高,一个很低。作者得解释是因为融合后得图像比较好的保留了CT得信息,又因为是通过语义相似性约束得,不同模态之间得语义相似性相差很大,所以才一个一个. 红色是钙化得组织。再临床上应该重点关注。所以融合得话这个信息应该保留。所以相比本文方法其他方法都对这部分有了一定得模糊效果。 黄色脑室 黄色箭头指得点再MR中有体现,再融合图中也有体现。说明确实是融合了两个图得信息。 蓝色为头外骨。 思考: 总觉得语义相似性有点怪怪得,但说不出哪里有毛病。

应用视域下翻译理论和实践融合的方式策略论文

在日常学习、工作生活中,许多人都有过写论文的经历,对论文都不陌生吧,论文写作的过程是人们获得直接经验的过程。那么一般论文是怎么写的呢?下面是我帮大家整理的应用视域下翻译理论和实践融合的方式策略论文,仅供参考,希望能够帮助到大家。

摘要:

在改革不断深化的趋势下,生活中用到翻译的机会大幅度增多。翻译理论与实践的发展与生活密切相关,其对实际生活中的翻译行为和理论研究有着重要的促进意义。该文从实际应用的角度,对翻译理论和翻译实践的意义、关系进行深度认知和研究,分析得出翻译理论与实践相结合的有效策略:一是在理论基础进行实践,二是在实践应用中完善理论内容,三是应用由二者发展形成的规律方式。

关键词:

应用;实践;翻译理论;结合方式;

引言:

经过长期的发展,翻译理论与翻译实践的关系已经发生了很大的变化。翻译与实践是相互作用的,但又自成一体。在翻译理论的指导下,翻译实践可以变得更加科学和合理;翻译理论经过实践之后,理论也更加具有指导性和实际作用。当前快速发展的社会经济促进了国与国之间的合作与交流,因为社会的变化而导致出现多国语言的互相渗透,给翻译工作带来了更多的发展机会,同时也带来了更高的标准要求。翻译内容不仅涉及日常工作,还要了解科学技术、文学创作等各方面,这就加大了翻译工作难度。因此,翻译工作必须结合相关的理论知识和实践活动,不断提高翻译水平,从而提高翻译工作的准确性和有效性,积极推动国际之间的社会经济和文化交流。

1、翻译理论及其实践意义

从宏观角度看,翻译理论指的是人们对翻译实践的理性认知,并在实际翻译活动加以归纳和整合,构成一套具有普适性、完整性的观点和概念体系,其中包括对翻译实践的一般性结论和具体评论及建议。翻译理论不仅注重研究翻译范畴内的基础知识,还重视翻译术语的深层次认知和逻辑应用。从微观角度看,翻译理论主要针对特定的语境或情境,运用翻译的目的不一样,面对的受众群体具有差异性。翻译理论对翻译实践有一定的积极意义,具体有以下几点:

、了解和启示意义

翻译理论可以说是一个总结,是对不一样的翻译所涉及的现象或产生的情况和规律进行描述和概括的总结,是能够把包含有语言的各种元素抽象成观众能识别的语言符号和语音语调的过程。到目前为止,没有翻译理论的翻译实践是不存在的。可以说,目标语言系统并不是简单的或没有约束的框架。在翻译过程中,需要一定的理论准则、要求作为准则或了解启发的初始点。

、导向和执行意义

翻译理论是一种理论的总称,其必然具备理论的一般特征,即指导具体的翻译实践活动,解释翻译规律在实践中的具体表现,使翻译行为从一种简单的自我行为上升到可以人们进行学习的学习行为。基于这个层面,翻译理论与翻译实践之间的“冲突”根本上是一种错位,其仍然具备指导和执行价值,不可完全否定。

、规范和矫正意义

翻译理论从宏观上划分范围和性质,使翻译实践有一个可参考的范围,在具体的翻译活动中的规范性得到增强,进而可以快速精准地发现翻译在实际应用过程中的缺陷,并对其实行标准进行调整和纠正,提高翻译的水平。

2、翻译理论与实践之间的关系分析

、二者存在主导关系

翻译理论与翻译实践存在着一种支配性的关系,但这种关系并非一成不变。这二者之间关系出现变化的主要原因是为了保证译文的质量,不仅要符合原作的原意,还要满足当前习惯用法要求。虽然翻译理论可以为人们的真实翻译工作带来更为科学方法理论,或者是帮助人们整理思维框架,但它不能直接控制实践中的语言组合。如果译者根据翻译理论寻找相应的翻译方法,再与自己实际的翻译工作进行结合,在融合了原作的情感和思想基础上进行的翻译势必难以取得预期效果。但如果译者仅仅依靠自己的实际翻译工作来实施翻译,这也只是将原文的内容转化为文字,一样得不到理想中的效果。例如,我们经常看到的翻译作品,其在翻译的时候缺乏对语言结构和文化存在的差异进行考量,尽管翻译的内容都能让人看得懂,但却与我国语言表现形式不相符。我们即便能读懂翻译内容的意思,但很难完全理解原作者的思想与情感。因此,翻译理论可以说是对多次翻译实践的理论概括。在翻译理论和实际操作中,谁处于主导地位必须根据具体的翻译情况来确定。有时是基于翻译理论,有时是基于实践。对具体问题进行具体分析。

、二者均受到词汇影响

语言的表达非常有趣。一样的意思却能够用不同词汇来呈现,但具体采用哪个词汇要根据文本语境来定。特别是对汉语而言,其具有一音多意或一字多音多意的特征,可谓是十分“灵活”的语言。

在实际翻译过程中,翻译理论与翻译实践或多或少都会受到词汇的影响,继而产生一些矛盾。翻译理论的重点是译文要与原文贴合,但在实际应用中受到词汇的差异化影响,翻译词汇与原着词汇要实现完全吻合是无法做到的,甚至出现一定的矛盾冲突。因此,翻译理论与实践需要一个巧妙融合的契点,使得翻译出来的语言或文本得以更合理的呈现,其中包括对词汇、语言顺序等进行的合理搭配。这样既能将原作的风格保留下来,还能提高翻译作品的文学意义。如此,人们不仅可以更深刻地了解作品,还能够欣赏具有国别和文化差异的文学特色。

3、翻译理论与实践结合的方式策略

、基于理论进行实践的方式

基于翻译理论践行翻译实践的方式主要是在实践中运用翻译理论指导实际工作,促使翻译实践在生活、社会发展中得到良好的开展效果。一方面,要充分了解实际工作生活中要应用到翻译的内容,在需要翻译的内容基础上进行翻译理论和方法的认知,形成以理论为基础的翻译实践。在实际应用过程中,翻译存在于生活中各方面,无论是日常生活交流还是社会工作应用,翻译理论及其实际应用方法都具有重要作用。我们只有在了解了翻译理论的基础上,才能更好地开展正确的翻译行为。这就需要我们对多种翻译理论知识有丰富的认知和理解,并能够在了解的基础上正确应用翻译理论,使翻译实践与翻译理论形成理论与实践的统一。另一方面,加强理论结合实际的能力,丰富联系翻译实践的多样化方法。在实际翻译过程中,将翻译理论套用在相适应的翻译内容或实际行为中,有助于提高翻译实践的正确率。翻译理论将翻译实践的具体行为、方式和规则等内容提炼出来,构成一套具备学习、指导的理论机制,使翻译行为有据可依,有法可循。

、在实践应用中完善理论的方式

翻译理论与翻译实践相辅相成,翻译理论来源于翻译实践又指导翻译实践,同时翻译实践又会推动新的翻译理论出现。这就需要我们在翻译过程中,不断完善翻译理论体系,以此形成具有应用价值的翻译理论。“实践是检验真理的唯一标准。”理论之所以具有意义,在于其具有科学、合理的行为理论指导意义。翻译理论与实践的.有效结合离不开实际应用对理论的丰富和推动作用,这是因为翻译理论缺乏实际应用价值则会容易形成纯翻译理论知识,进而降低了理论直接指导实践的作用。翻译理论若只是在理论层次上不断丰富多元化理论内容,而在实际应用中却没有良好的指导意义,就很难在长期的社会发展过程中得到不断的补充和完善,长此以往,就会被社会应用所淘汰。

因此,要积极通过翻译实践不断完善翻译理论体系,使翻译理论与社会生活中的实际应用中得到持续修正和提升。对此,一方面要注重积累翻译实践过程和结果,对翻译实践行为进行深度研究和分析,在相关理论和应用的结合基础上,对翻译理论进行创新思考。另一方面要在实际应用翻译的过程中,保持对新知识、新方法的学习和应用,使还在处于初期研究阶段或没有得到实证的翻译理论实现快速下沉,丰富翻译理论内容。此外,要注重实际应用中的深层次翻译。翻译理论在生活很多领域中被广泛应用,尤其是专业性较强的政治、医疗、经济等这些方面,实际翻译过程中不仅要注重译文的措辞和结构,还要注重其深层意义的表述。这就需要我们注重实际生活中应用翻译理论的语境变化及其所用词汇的实际含义。如“future”在英语中的一般语义是“未来”,但美国俚语中有“未婚妻”的意思;当将其放于经贸领域中,其又能被译成“信托机构、信托资金”等意思。因此,翻译实践必须考虑到具体的语言环境,对词汇或语言在不同的语境环境中的使用有更深层次的了解。以此增强翻译的实际应用能力,从而在多元化、专业化的翻译实践中获得更多深层次的翻译理论,为完善理论体系做好基础。

、以应用为基础形成的规律方式

建立翻译理论与实践结合的规律机制,提升翻译的整体应用价值,促使翻译理论在实际应用过程中有标准、合理的规律引导,以此丰富二者的结合方式。翻译理论与实践的结合规律可以说是二者在理论和实践的融合过程中形成的一个资源共享平台,这个共享平台不仅包括翻译理论规律,还包括翻译在实际应用中的发展规律,例如文学作品中的翻译方式与影视作品的翻译方式就有所不同,这不仅是因为影视作品与文学作品本身就有着明显的差异,还因为在翻译过程中,影视作品的翻译可以根据影视内容或场景进行多种语言优化,而文学作品在这一方面就有较大的限制性。基于翻译对象的不同,所用到的翻译理论和方法也因此有所差异,这就形成了不同的翻译实践需要相应的翻译理论和规律的趋势。

基于此,一方面要以实际应用为出发点,将不同领域或不同方面的翻译实践进行归纳总结和提炼,以此构成以翻译应用为核心的多元化理论体系。例如文学作品翻译方面,可根据文学作品的类型进行细化子项目,如诗歌、散文、小说等。在不同的子项目中进行大量的翻译实践,将具有共同性或一致性的翻译方法或模式提炼成翻译理论,从而构成文学作品方面的翻译规律理论机制。另一方面,对翻译过程中出现的特殊翻译方式或创新应用翻译方法且获得良好效果的翻译实践进行规整和分析,以此形成相对完整的规律体系。通过对常用规律和非常用规律进行总结和分析,不仅可以有效地提高翻译理论在实践中的应用效果,还可以避免落后的翻译方式带来的不良影响。如此,翻译理论与翻译实践相结合的方式方法在体系化的规律指导下,既具有“进入”机制,也具有“退出”机制。促进翻译实践发展在与时俱进的翻译规律驱动下不断得到提升和优化,翻译理论在此基础上与翻译实践也可以实现更好地融合。

4、结束语

翻译理论与实践结合,这是二者不断发展的前提,也是社会实际应用翻译理论的发展要求。尤其是当前国际往来不断增多,翻译作为跨越两国乃至多国之间的交流桥梁,其理论与实际应用要以合理的方式结合充分发挥作用,使交流双方在指定的语言环境中实现最大限度地合理有效沟通,促进双方了解彼此的想法和意图。我们在实际翻译过程中可通过理论指导实际、在实际应用中完善理论内容以及应用翻译规律的方式,不断加深翻译理论与翻译实践的紧密关联,使翻译理论具有更多的实践基础做支撑,提高翻译理论的语用功能和应用性价值。

参考文献

[1]张琳琳,娄德欣.功能主义翻译理论视角下的译入语目的性研究[J].农家参谋,2020(9):190-191.

[2]李莎.关联翻译理论在翻译教学中的应用探究[J].湖北开放职业学院学报,2019,32(23):168-169.

[3]李莎.语用翻译理论在英汉翻译实践中的应用[J].佳木斯职业学院学报,2019(12):168-169.

[4]曹明伦.翻译理论是从哪里来的?——再论翻译理论与翻译实践的关系[J].上海翻译,2019(6):1-7,95.

[5]周领顺.“翻译理论与实践关系的讨论”:回顾与反思[J].上海翻译,2019(6):13-17,95.

[6]傅敬民.我国应用翻译研究:回顾与反思[J].上海大学学报(社会科学版),2019,36(5):93-104.

图像算法研究论文

图像分割是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。我整理了图像分割技术论文,欢迎阅读!

图像分割技术研究

摘要:图像分割是图像处理与计算机视觉的基本问题之一,是图像处理图像分析的关键步骤。本文介绍了基于阈值的分割方法和图像分割的图像分割性能的评价、应用现状;最后总结出图像分割的发展趋势。

关键词:图像分割、阈值、边缘检测、区域分割

中图分类号: 文献标识码: A

1引言

随着图像分割技术研究的深入,其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题,是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的,有很大的针对性和局限性,到目前为止还不存在一个通用的方法,也不存在一个判断分割是否成功的客观标准。因此,对图像分割的研究目前还缺乏一个统一的理论体系,使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation),简单地说就是将一幅数字图像分割成不同的区域,在同一区域内具有在一定的准则下可认为是相同的性质,如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一,它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种:

(1)单阈值法,用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时,选择两峰之间的谷底作为阈值。

(2)双阈值法,用两个阈值区分背景和目标。通过设置两个阈值,以防单阈值设置阈值过高或过低,把目标像素误归为背景像素,或把背景像素误归为目标像素。

(3)多阈值法,当存在照明不均,突发噪声等因素或背景灰度变化较大时,整幅图像不存在合适的单一阈值,单一阈值不能兼顾图像不同区域的具体情况,这时可将图像分块处理,对每一块设一个阈值。

边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有:差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况,其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割,效果较好。

区域生长方法是把一幅图像分成许多小区域开始的,这些初始的小区域可能是小的邻域甚至是单个像素,在每个区域中,通过计算能反映一个物体内像素一致性的特征,作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数,即特征。接下来对相邻区域的所有边界进行考查,如果给定边界两侧的特征值差异明显,那么这个边界很强,反之则弱。强边界允许继续存在,而弱边界被消除,相邻区域被合并。没有可以消除的弱边界时,区域合并过程结束,图像分割也就完成。

结合特定工具的图像分割技术

20世纪80年代末以来,随着一些特殊理论的出现及其成熟,如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等,大量学者致力于将新的概念、新的方法用于图像分割,有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中,将一幅图像比为一个具有不同高度值的地形,高灰度值处被认为是山脊,底灰度值处被认为是山谷,将一滴水从任一点流下,它会朝地势底的地方流动,最终聚于某一局部最底点,最后所有的水滴会分聚在不同的吸引盆地,由此,相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良,能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息,对噪声较敏感。

基于模糊数学的分割算法

目前,模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合,形成一系列的集成模糊分割技术,例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理,使真正的边缘处于较低灰度级,但还有一些不是边缘的像素点的灰度也在较低灰度级中,虽然算法的计算简明,且边缘细腻,但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述,通过计算图像的模糊熵来选取图像的分割阈值,后用阈值法处理图像得到边界。

基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法,它使用参数编码集而不是参数本身,通过模拟进化,以适者生存的策略搜索函数的解空间,它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作,它唯一需要的信息是适应值,通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索,且可以降低搜索空间维数,降低算法对模板初始位置的敏感,计算时间也大为减少。其缺点是容易收敛于局部最优。

基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力,适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题,因而也适合解决比较复杂的图像分割问题。原则上讲,大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚,只有多层前馈NN,多层误差反传(BP)NN,自组织NN,Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割,输入层神经元的数目取决于输入特征数,而输出层神经元的数目等同于分类的数目。

图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法,有关图像分割方法和文献很多,新方法不断产生,这些方法有的只对特定的情形有效,有的综合了几种方法,放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法,这种方法将图像欲分割成的几个区域各以一个不同的标号来表示,用一定的方式对图像中的每一个像素赋以标号,标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法,基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割,由于新的数学工具的引入,纹理分割技术取得了一些进展,张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法,直接建立在先验知识的基础上,使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容:一是研究各分割算法在不同情况下的表现,掌握如何选择和控制其参数设置,以适应不同需要。二是分析多个分割算法在分割同一图像时的性能,比较优劣,以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能,而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣,由于缺乏可靠理论依据,并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的,不同的评价方法只能反映分割算法性能的某一性能。另一方面,每一种分割算法的性能是由多种因素决定的,因此,有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用,图像分割技术呈现出以下的发展趋势:(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦,等译.北京:电子工业出版社,2003

[2] 章毓晋.图像分割[M].北京:科学出版社,2001.

[3] 李弼程,彭天强,彭波等.智能图像处理技术[M].北京:电子工业出版社,2004.

[4] 杨晖,曲秀杰.图像分割方法综述[J].电脑开发与应用。2005,18(3):21-23.

点击下页还有更多>>>图像分割技术论文

数字图像处理方面了解的了。

数字图像压缩技术的研究及进展摘要:数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法:JPEG、JPEG2000、分形图像压缩和小波变换图像压缩,总结了它们的优缺点及发展前景。然后简介了任意形状可视对象编码算法的研究现状,并指出此算法是一种产生高压缩比的图像压缩算法。关键词:JPEG;JPEG2000;分形图像压缩;小波变换;任意形状可视对象编码一 引 言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了[1]。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。二 JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。1.JPEG压缩原理及特点 JPEG算法中首先对图像进行分块处理,一般分成互不重叠的 大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好图像质量。缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;(2)系数进行量化,是有损压缩;(3)压缩比不高,小于50。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的。2. JPEG压缩的研究状况及其前景 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年来提出了不少改进方法,最有效的是下面的两种方法:(1)DCT零树编码 DCT零树编码把 DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比 EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。(2)层式DCT零树编码 此算法对图像作 的DCT变换,将低频 块集中起来,做 反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。三 JEPG2000压缩 JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示。编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作。2.JPEG2000压缩的前景 JPEG2000标准适用于各种图像的压缩编码。其应用领域将包括Internet、传真、打印、遥感、移动通信、医疗、数字图书馆和电子商务等。JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。四 小波变换图像压缩1.小波变换图像压缩原理小波变换用于图像编码的基本思想就是把图像根据Mallat塔式快速小波变换算法进行多分辨率分解。其具体过程为:首先对图像进行多级小波分解,然后对每层的小波系数进行量化,再对量化后的系数进行编码。小波图像压缩是当前图像压缩的热点之一,已经形成了基于小波变换的国际压缩标准,如MPEG-4标准,及如上所述的JPEG2000标准 。2.小波变换图像压缩的发展现状及前景 目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。(1)EZW编码器 1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。(2)SPIHT编码器 由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。(3)EBCOT编码器优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。五 分形图像压缩 1988年,Barnsley通过实验证明分形图像压缩可以得到比经典图像编码技术高几个数量级的压缩比。1990年,Barnsley的学生提出局部迭代函数系统理论后,使分形用于图像压缩在计算机上自动实现成为可能。1. 分形图像压缩的原理 分形压缩主要利用自相似的特点,通过迭代函数系统(Iterated Function System, IFS)实现。其理论基础是迭代函数系统定理和拼贴定理。 分形图像压缩把原始图像分割成若干个子图像,然后每一个子图像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像。2.几种主要分形图像编码技术 随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。(1)尺码编码方法 尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度 随着图像各个组成部分复杂性的不同而改变。(2)迭代函数系统方法 迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。(3)A-E-Jacquin的分形方案 A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。3.分形图像压缩的前景 虽然分形图像压缩在图像压缩领域还不占主导地位,但是分形图像压缩既考虑局部与局部,又考虑局部与整体的相关性,适合于自相似或自仿射的图像压缩,而自然界中存在大量的自相似或自仿射的几何形状,因此它的适用范围很广。六 其它压缩算法 除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~ [13]。(1)形状自适应DCT(SA-DCT)算法 SA-DCT把一个任意形状可视对象分成 的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应Gilge DCT[10][11]变换的有效变换,但它比Gilge DCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。(2)Egger方法 Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。(3)形状自适应离散小波变换(SA-DWT) Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。 在今后的工作中,可以充分地利用人类视觉系统对图像边缘部分较敏感的特性,尝试将图像中感兴趣的对象分割出来,对其边缘部分、内部纹理部分和对象之外的背景部分按不同的压缩比进行压缩,这样可以使压缩图像达到更大的压缩比,更加便于传输。七 总结 图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。参考文献:[1] 田青. 图像压缩技术[J]. 警察技术, 2002, (1):30-31.[2] 张海燕, 王东木等. 图像压缩技术[J]. 系统仿真学报, 2002, 14(7):831-835.[3] 张宗平, 刘贵忠. 基于小波的视频图像压缩研究进展[J]. 电子学报, 2002, 30(6):883-889.[4] 周宁, 汤晓军, 徐维朴. JPEG2000图像压缩标准及其关键算法[J]. 现代电子技术, 2002, (12):1-5.[5] 吴永辉, 俞建新. JPEG2000图像压缩算法概述及网络应用前景[J]. 计算机工程, 2003, 29(3):7-10.[6] J M Shaprio. Embedded image coding using zerotree of wavelet coefficients[J]. IEEE Trans. on Signal Processing, 1993, 41(12): 3445-3462.[7] A Said, W A Pearlman. A new fast and efficient image codec based on set partitioning in hierarchical trees[J]. IEEE Trans. on Circuits and Systems for Video Tech. 1996, 6(3): 243-250.[8] D Taubman. High performance scalable image compression with EBCOT[J]. IEEE Transactions on Image Processing, 2000, 9(7): 1158–1170.[9] 徐林静, 孟利民, 朱建军. 小波与分行在图像压缩中的比较及应用. 中国有线电视, 2003, 03/04:26-29.[10] M Gilge, T Engelhardt, R Mehlan. Coding of arbitrarily shaped image segments based on a generalized orthogonal transform[J]. Signal Processing: Image Commun., 1989, 1(10): 153–180.[11] T Sikora, B Makai. Shape-adaptive DCT for generic coding of video[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(1): 59–62.[12] T Sikora, S Bauer, B Makai. Efficiency of shape-adaptive 2-D transforms for coding of arbitrarily shaped image segments[J]. IEEE Trans. Circuits Syst. Video Technol., 1995, 5(3): 254–258.[13]邓家先 康耀红 编著 《信息论与编码》

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

相关百科

热门百科

首页
发表服务