基于聚类的图像分割方法研究论文

图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。我整理了图像分割技术论文，欢迎阅读!

图像分割技术研究

摘要：图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。本文介绍了基于阈值的分割方法和图像分割的图像分割性能的评价、应用现状;最后总结出图像分割的发展趋势。

关键词：图像分割、阈值、边缘检测、区域分割

中图分类号：文献标识码： A

1引言

随着图像分割技术研究的深入，其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题，是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的，有很大的针对性和局限性，到目前为止还不存在一个通用的方法，也不存在一个判断分割是否成功的客观标准。因此，对图像分割的研究目前还缺乏一个统一的理论体系，使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation)，简单地说就是将一幅数字图像分割成不同的区域，在同一区域内具有在一定的准则下可认为是相同的性质，如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一，它是用一个或几个阈值将图像的灰度级分为几个部分，认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种：

(1)单阈值法，用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时，选择两峰之间的谷底作为阈值。

(2)双阈值法，用两个阈值区分背景和目标。通过设置两个阈值，以防单阈值设置阈值过高或过低，把目标像素误归为背景像素，或把背景像素误归为目标像素。

(3)多阈值法，当存在照明不均，突发噪声等因素或背景灰度变化较大时，整幅图像不存在合适的单一阈值，单一阈值不能兼顾图像不同区域的具体情况，这时可将图像分块处理，对每一块设一个阈值。

边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有：差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况，其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割，效果较好。

区域生长方法是把一幅图像分成许多小区域开始的，这些初始的小区域可能是小的邻域甚至是单个像素，在每个区域中，通过计算能反映一个物体内像素一致性的特征，作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数，即特征。接下来对相邻区域的所有边界进行考查，如果给定边界两侧的特征值差异明显，那么这个边界很强，反之则弱。强边界允许继续存在，而弱边界被消除，相邻区域被合并。没有可以消除的弱边界时，区域合并过程结束，图像分割也就完成。

结合特定工具的图像分割技术

20世纪80年代末以来，随着一些特殊理论的出现及其成熟，如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等，大量学者致力于将新的概念、新的方法用于图像分割，有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中，将一幅图像比为一个具有不同高度值的地形，高灰度值处被认为是山脊，底灰度值处被认为是山谷，将一滴水从任一点流下，它会朝地势底的地方流动，最终聚于某一局部最底点，最后所有的水滴会分聚在不同的吸引盆地，由此，相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良，能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息，对噪声较敏感。

基于模糊数学的分割算法

目前，模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合，形成一系列的集成模糊分割技术，例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理，使真正的边缘处于较低灰度级，但还有一些不是边缘的像素点的灰度也在较低灰度级中，虽然算法的计算简明，且边缘细腻，但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述，通过计算图像的模糊熵来选取图像的分割阈值，后用阈值法处理图像得到边界。

基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法，它使用参数编码集而不是参数本身，通过模拟进化，以适者生存的策略搜索函数的解空间，它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作，它唯一需要的信息是适应值，通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索，且可以降低搜索空间维数，降低算法对模板初始位置的敏感，计算时间也大为减少。其缺点是容易收敛于局部最优。

基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力，适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题，因而也适合解决比较复杂的图像分割问题。原则上讲，大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚，只有多层前馈NN，多层误差反传(BP)NN，自组织NN，Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割，输入层神经元的数目取决于输入特征数，而输出层神经元的数目等同于分类的数目。

图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法，有关图像分割方法和文献很多，新方法不断产生，这些方法有的只对特定的情形有效，有的综合了几种方法，放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法，这种方法将图像欲分割成的几个区域各以一个不同的标号来表示，用一定的方式对图像中的每一个像素赋以标号，标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法，基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割，由于新的数学工具的引入，纹理分割技术取得了一些进展，张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法，直接建立在先验知识的基础上，使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容：一是研究各分割算法在不同情况下的表现，掌握如何选择和控制其参数设置，以适应不同需要。二是分析多个分割算法在分割同一图像时的性能，比较优劣，以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能，而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣，由于缺乏可靠理论依据，并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的，不同的评价方法只能反映分割算法性能的某一性能。另一方面，每一种分割算法的性能是由多种因素决定的，因此，有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用，图像分割技术呈现出以下的发展趋势：(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦，等译.北京：电子工业出版社，2003

[2] 章毓晋.图像分割[M].北京：科学出版社，2001.

[3] 李弼程，彭天强，彭波等.智能图像处理技术[M].北京：电子工业出版社，2004.

[4] 杨晖，曲秀杰.图像分割方法综述[J].电脑开发与应用。2005，18(3)：21-23.

点击下页还有更多>>>图像分割技术论文

简要说一下：图像分割基本原理：根据图像的组成结构和应用需求将图像划分为若干个互不相交的子区域的过程。这些子区域四某种意义下具有共同属性的像素的连通集合。常用方法有：1）以区域为对象进行分割，以相似性原则作为分割的依据，即可根据图像的灰度、色彩、变换关系等方面的特征相似来划分图像的子区域，并将各像素划归到相应物体或区域的像素聚类方法，即区域法；2）以物体边界为对象进行分割，通过直接确定区域间的边界来实现分割；3）先检测边缘像素，再将边缘像素连接起来构成边界形成分割。具体的阈值分割：阈值分割方法分为以下3类:1) 全局阈值:T=T[p(x,y)〕，即仅根据f(x,y)来选取阈值，阈值仅与各个图像像素的本身性质有关。2) 局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。3) 动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标，图像像素的本身性质和局部区域性质相关。全局阈值对整幅图像仅设置一个分割阈值，通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像，并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果，但存在几个缺点:1) 每幅子图像的尺寸不能太小，否则统计出的结果无意义。2) 每幅图像的分割是任意的，如果有一幅子图像正好落在目标区域或背景区域，而根据统计结果对其进行分割，也许会产生更差的结果。3) 局部阈值法对每一幅子图像都要进行统计，速度慢，难以适应实时性的要求。全局阈值分割方法在图像处理中应用比较多，它在整幅图像内采用固定的阈值分割图像。考虑到全局阈值分割方法应用的广泛性，本文所着重讨论的就是全局阈值分割方法中的直方图双峰法和基于遗传算法的最大类间方差法。在本节中，将重点讨论灰度直方图双峰法，最大类间方差法以及基于遗传算法的最大类间方差法留待下章做继续深入地讨论。参详书目当然是《数字图像处理》，及网上的一些有用文档；工具：MATLAB或VC++

问题一：聚类分析的意义是什么科技名词定义中文名称：聚类分析英文名称：cluster *** ysis 定义1：按照某种距离算法对数据点分类。应用学科：地理学（一级学科）；数量地理学（二级学科）定义2：把观测或变量按一定规则分成组或类的数学分析方法。应用学科：生态学（一级学科）；数学生态学（二级学工）聚类分析指将物理或抽象对象的 *** 分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域，包括数学，计算机科学，统计学，生物学和经济学。在不同的应用领域，很多聚类技术都得到了发展，这些技术方法被用作描述数据，衡量不同数据源间的相似性，以及把数据源分类到不同的簇中。问题二：数据挖掘，聚类分析算法研究的目的和意义是什么！ 15分图像分割基本原理：根据图像的组成结构和应用需求将图像划分为若干个互不相交的子区域的过程。这些子区域四某种意义下具有共同属性的像素的连通 *** 。常用方法有： 1）以区域为对象进行分割，以相似性原则作为分割的依据，即可根据图像的灰度、色彩、变换关系等方面的特征相似来划分图像的子区域，并将各像素划归到相应物体或区域的像素聚类方法，即区域法； 2）以物体边界为对象进行分割，通过直接确定区域间的边界来实现分割； 3）先检测边缘像素，再将边缘像素连接起来构成边界形成分割。具体的阈值分割：阈值分割方法分为以下3类: 1) 全局阈值:T=T[p(x,y)〕，即仅根据f(x,y)来选取阈值，阈值仅与各个图像像素的本身性质有关。 2) 局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。 3) 动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标，图像像素的本身性质和局部区域性质相关。全局阈值对整幅图像仅设置一个分割阈值，通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像，并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果，但存在几个缺点: 1) 每幅子图像的尺寸不能太小，否则统计出的结果无意义。 2) 每幅图像的分割是任意的，如果有一幅子图像正好落在目标区域或背景区域，而根据统计结果对其进行分割，也许会产生更差的结果。 3) 局部阈值法对每一幅子图像都要进行统计，速度慢，难以适应实时性的要求。全局阈值分割方法在图像处理中应用比较多，它在整幅图像内采用固定的阈值分割图像。考虑到全局阈值分割方法应用的广泛性，本文所着重讨论的就是全局阈值分割方法中的直方图双峰法和基于遗传算法的最大类间方差法。在本节中，将重点讨论灰度直方图双峰法，最大类间方差法以及基于遗传算法的最大类间方差法留待下章做继续深入地讨论。参详《数字图像处理》工具：MATLAB或VC++ 问题三：聚类分析方法有什么好处 5分聚类分析：将个体（样品）或者对象（变量）按相似程度（距离远近）划分类别，使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。其主要依据是聚到同一个数据集中的样本应该彼此相似，而属于不同组的样本应该足够不相似。常用聚类方法：系统聚类法，K-均值法，模糊聚类法，有序样品的聚类，分解法，加入法。注意事项： 1. 系统聚类法可对变量或者记录进行分类，K-均值法只能对记录进行分类； 2. K-均值法要求分析人员事先知道样品分为多少类； 3. 对变量的多元正态性，方差齐性等要求较高。应用领域：细分市场，消费行为划分，设计抽样方案等优点：聚类分析模型的优点就是直观，结论形式简明。缺点：在样本量较大时，要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映珐试间内在联系的指标，而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系，但事物之间却无任何内在联系，此时，如果根据距离或相似系数得出聚类分析的结果，显然是不适当的，但是，聚类分析模型本身却无法识别这类错误。问题四：聚类分析的结果分成几类，但是这几类有什么关系呢,这几类有什么含义。 5分这个要看你是面对什么问题了，如：用聚类做财务舞弊，则会有以下几类：正常财务报表、虚增利润舞弊财务报表、关联交易财务舞弊报表等问题五：SPSS新手求问聚类分析聚类分析主要作用是把一些数据分成未知的几类这样理解对吗？系统聚类的建议买本spss的教程，可以更加系统的学习。要是写论文的话，可以帮忙数据 he 分析。问题六：主成分分析法和聚类分析法的区别问题七：如何评价spss系统聚类分析结果？用方差分析来判定聚类结果好坏，类与类之间是否差异性显著，呵呵~~ 问题八：聚类分析主要解决什么类型的实际问题主要解决实现不知道类别标签的样本集的分类问题.聚类其实也是实现分类的功能.聚类和分类的区别：分类是用知道类别标签的样本集去训练一个分类器,然后用该分类器对其他未知类别的样本进行归类,由于训练分类器用到了知道类别的样本,所以属于有导师学习；聚类是完全不知道各个样本的类别,按照一定的聚类度量准则直接进行聚类,所以属于无导师的学习. 聚类可以用在图像处理,模式识别,客户信息分析,金融分析,医学等很多领域.用模糊聚类进行图像分割就是一个非常典型的应

图像分割算法的研究论文

图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。我整理了图像分割技术论文，欢迎阅读!

图像分割技术研究

摘要：图像分割是图像处理与计算机视觉的基本问题之一，是图像处理图像分析的关键步骤。本文介绍了基于阈值的分割方法和图像分割的图像分割性能的评价、应用现状;最后总结出图像分割的发展趋势。

关键词：图像分割、阈值、边缘检测、区域分割

中图分类号：文献标识码： A

1引言

随着图像分割技术研究的深入，其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题，是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的，有很大的针对性和局限性，到目前为止还不存在一个通用的方法，也不存在一个判断分割是否成功的客观标准。因此，对图像分割的研究目前还缺乏一个统一的理论体系，使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation)，简单地说就是将一幅数字图像分割成不同的区域，在同一区域内具有在一定的准则下可认为是相同的性质，如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一，它是用一个或几个阈值将图像的灰度级分为几个部分，认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种：

(1)单阈值法，用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时，选择两峰之间的谷底作为阈值。

(2)双阈值法，用两个阈值区分背景和目标。通过设置两个阈值，以防单阈值设置阈值过高或过低，把目标像素误归为背景像素，或把背景像素误归为目标像素。

(3)多阈值法，当存在照明不均，突发噪声等因素或背景灰度变化较大时，整幅图像不存在合适的单一阈值，单一阈值不能兼顾图像不同区域的具体情况，这时可将图像分块处理，对每一块设一个阈值。

边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有：差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况，其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割，效果较好。

区域生长方法是把一幅图像分成许多小区域开始的，这些初始的小区域可能是小的邻域甚至是单个像素，在每个区域中，通过计算能反映一个物体内像素一致性的特征，作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数，即特征。接下来对相邻区域的所有边界进行考查，如果给定边界两侧的特征值差异明显，那么这个边界很强，反之则弱。强边界允许继续存在，而弱边界被消除，相邻区域被合并。没有可以消除的弱边界时，区域合并过程结束，图像分割也就完成。

结合特定工具的图像分割技术

20世纪80年代末以来，随着一些特殊理论的出现及其成熟，如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等，大量学者致力于将新的概念、新的方法用于图像分割，有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中，将一幅图像比为一个具有不同高度值的地形，高灰度值处被认为是山脊，底灰度值处被认为是山谷，将一滴水从任一点流下，它会朝地势底的地方流动，最终聚于某一局部最底点，最后所有的水滴会分聚在不同的吸引盆地，由此，相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良，能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息，对噪声较敏感。

基于模糊数学的分割算法

目前，模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合，形成一系列的集成模糊分割技术，例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理，使真正的边缘处于较低灰度级，但还有一些不是边缘的像素点的灰度也在较低灰度级中，虽然算法的计算简明，且边缘细腻，但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述，通过计算图像的模糊熵来选取图像的分割阈值，后用阈值法处理图像得到边界。

基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法，它使用参数编码集而不是参数本身，通过模拟进化，以适者生存的策略搜索函数的解空间，它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作，它唯一需要的信息是适应值，通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索，且可以降低搜索空间维数，降低算法对模板初始位置的敏感，计算时间也大为减少。其缺点是容易收敛于局部最优。

基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力，适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题，因而也适合解决比较复杂的图像分割问题。原则上讲，大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚，只有多层前馈NN，多层误差反传(BP)NN，自组织NN，Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割，输入层神经元的数目取决于输入特征数，而输出层神经元的数目等同于分类的数目。

图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法，有关图像分割方法和文献很多，新方法不断产生，这些方法有的只对特定的情形有效，有的综合了几种方法，放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法，这种方法将图像欲分割成的几个区域各以一个不同的标号来表示，用一定的方式对图像中的每一个像素赋以标号，标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法，基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割，由于新的数学工具的引入，纹理分割技术取得了一些进展，张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法，直接建立在先验知识的基础上，使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容：一是研究各分割算法在不同情况下的表现，掌握如何选择和控制其参数设置，以适应不同需要。二是分析多个分割算法在分割同一图像时的性能，比较优劣，以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能，而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣，由于缺乏可靠理论依据，并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的，不同的评价方法只能反映分割算法性能的某一性能。另一方面，每一种分割算法的性能是由多种因素决定的，因此，有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用，图像分割技术呈现出以下的发展趋势：(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦，等译.北京：电子工业出版社，2003

[2] 章毓晋.图像分割[M].北京：科学出版社，2001.

[3] 李弼程，彭天强，彭波等.智能图像处理技术[M].北京：电子工业出版社，2004.

[4] 杨晖，曲秀杰.图像分割方法综述[J].电脑开发与应用。2005，18(3)：21-23.

点击下页还有更多>>>图像分割技术论文

论文阅读笔记：图像分割方法deeplab以及Hole算法解析deeplab发表在ICLR2015上。论文下载地址：方法概述deeplab方法分为两步走，第一步仍然采用了FCN得到coarsescoremap并插值到原图像大小，然后第二步借用fullyconnectedCRF对从FCN得到的分割结果进行细节上的refine。下面这张图很清楚地展示了整个结构：然后这张图展示了CRF处理前后的效果对比，可以看出用了CRF以后，细节确实改善了很多：deeplab对FCN更加优雅的处理方式在第一步中，deeplab仍然采用了FCN来得到scoremap,并且也是在VGG网络上进行fine-tuning。但是在得到scoremap的处理方式上，要比原FCN处理的优雅很多。还记得CVPR2015的FCN中是怎么得到一个更加dense的scoremap的吗？是一张500x500的输入图像，直接在第一个卷积层上conv1_1来了一个100的大padding。最终在fc7层勉强得到一个16x16的scoremap。虽然处理上稍显粗糙，但是毕竟人家是第一次将图像分割在CNN上搞成end-to-end，并且在当时performance是state-of-the-art，也很理解。deeplab摒弃了这种做法，取而代之的是对VGG的网络结构上做了小改动：将VGG网络的pool4和pool5层的stride由原来的2改为了1。就是这样一个改动，使得vgg网络总的stride由原来的32变成8，进而使得在输入图像为514x514，正常的padding时，fc7能得到67x67的scoremap,要比FCN确实要dense很多很多。但是这种改变网络结果的做法也带来了一个问题：stride改变以后，如果想继续利用vggmodel进行finetuning，会导致后面filter作用的区域发生改变，换句话说就是感受野发生变化。这个问题在下图(a)(b)中通过花括号体现出来了:Hole算法于是乎，作者想出了一招，来解决两个看似有点矛盾的问题：既想利用已经训练好的模型进行fine-tuning，又想改变网络结构得到更加dense的scoremap.这个解决办法就是采用Hole算法。如下图(a)(b)所示，在以往的卷积或者pooling中，一个filter中相邻的权重作用在featuremap上的位置都是物理上连续的。如下图(c)所示，为了保证感受野不发生变化，某一层的stride由2变为1以后，后面的层需要采用hole算法，具体来讲就是将连续的连接关系是根据holesize大小变成skip连接的（图(c)为了显示方便直接画在本层上了）。不要被(c)中的padding为2吓着了，其实2个padding不会同时和一个filter相连。pool4的stride由2变为1，则紧接着的conv5_1,conv5_2和conv5_3中holesize为2。接着pool5由2变为1,则后面的fc6中holesize为4。代码主要是im2col(前传)和col2im(反传)中做了改动(增加了hole_w,hole_h)，这里只贴cpu的用于理解：

具体指的什么？是原理啊还是编程实现？

svm图像分割研究生论文

可以学术研究的人都知道一个著名的短语Publish or perish。就是说，研究人员发表文章是硬道理，只有快速而持续在某些专业领域发表自己的研究成果才能在学术界占领高地，并且让自己走得更远。而无论大家如何评价学术论文发表对科学和社会的贡献，学术圈实质上的游戏规则一直没有太大改变：对研究人员来说发表论文是硬通货，是他们获得职位、争取资源、赢得荣誉的重要途经和手段。目前杂志数量爆发式增长，研究人员在发表论文的时候自然有了更多的选择，但同时也给学术的评估带来了不小的麻烦，于是乎评估人员只好依赖于期刊的质量指标来评定研究质量。比如汤普森的影响因子就是为了将这个复杂而微妙的判定简化为一个数字，当然这也是目前业内使用广泛的指标。理论上影响因子似乎是期刊所发表研究的质量，但这一假设目前却越来越受到质疑。学术圈的人都深切体会到一篇文章能否在某个期刊终发表出来，除了科学质量方面的因素外还有其他一些很重要的因素。比如我们一直在告诫学生，一篇稿件在写作风格上、突出重点上和表达上些微的差别就可能影响杂志的接收情况。那么，这究竟只是老道的论文作者的感觉，还是不同期刊上文章的表达真的存在着这样那样的差别呢?如果这些差别真的存在，那么是否就表明影响因子真的与科学质量以外的东西有关呢，而作者是否可以通过改善一些相对简单的写作技巧，以此来提高他们在高影响因子期刊上发表论文的机会呢?在竞争激烈的学术圈中，年轻的研究人员和学生们必须尽可能地发表更多的论文，也希望大限度地争取在好的刊物上发表文章的机会，那么我们应该怎么做呢?美国南伊利诺斯大学的Brady Neiles及其同事在近一期的Bulletin of the Ecological Society of America上撰文分析了不同影响因子期刊中发表的论文，他指出：在竞争激烈的环境下，作者如果要让他们的稿件脱颖而出，改善写作的风格可能是一个有效的手段。而有力的科学写作手段也可看作是某种程度的推销和讲故事，作者必须找到如何创造性地讲故事并清晰地表达这些发现的重要性。

这篇Multi-Branch Hierarchical Segmentation 文章来自上海交通大学仿脑计算与机器智能研究中心（简称BCMI），来自CVPR 2015，是一篇用 segmentation 来做 proposal 的论文，该文是在selective search原型的基础上进行了进一步区域聚合方法的探索。 Segment based object proposal的方法的主要思想是，将分割好的图像区域进行组合来得到目标区域。这存在一个问题：上一步区域组合出错会导致下一步错误，这种single-way merge segmentation region的方法是有缺陷的。所以此篇文章采用muti-branch分支的方法来扩大搜索范围，以达到改进精度的目的。通过对分割区域空间搜索来得到目标区域的方式，单纯使用贪心策略是不可取的。此篇文章对分割区域的组合采用了一个原则：包含了多种颜色和纹理区域的复杂目标需要使用不同的组合策略来完成分割区域组合。这篇文章的主要思路就是将多种组合策略进行组合搜索，来改善selective search方法的精度。此篇文章研究的内容主要由多种分割区域组合策略和分割区域搜索两部分组成。 (1)Learning complementary merging strategies 论文将区域组合的过程抽象为线性分类器，并通过改变每次训练样本的权值来训练分类器（类似Boosting过程）。但与Boosting不同的是，论文提出的区域组合分类器不是将多个弱分类器组合成强分类器，而是通过分类器之间的错误修改来形成新的分类器。 (2) Multi-staged branching 通过上面的区域组合分类器，可以对图像分割区域进行搜索，将一个贪心聚合的步骤分成了多个。论文主要通过树形组织来增加分割区域的组合搜索空间，并用区域组合结果来训练SVM分类器。文章采用树型分支的方式来组织不同的区域组合策略，同一个分支下的分割区域组合策略方法相同。假设区域聚合树的高度为T，树的每个非叶子节点的度为K，则最底层可以得到KT个区域聚合结果，总共可以得到个proposal窗口，其中λ表示每次区域聚合增加的零散区域数量，N为最开始图像拥有的分割区域数量。则可以使用λ和N来控制最后的proposal数量。其中生成每个分支的过程实际上还是贪心聚合的方法，但对这个过程进行了分层操作。上一点描述了如何进行分支操作，接下来是如何使用图像分割区域聚合树来生成proposal的过程，主要是如何设计分割区域分类器。为使得图像分割区域聚合树不同分支上的proposal分类模型相同，文中使用了binary linear classifier（二元线性分类器）来对分割区域进行分类。即将属于同一物体的不同区域作为正例，将属于不同的物体的不同的区域作为反例作为训练。进而得到相应的SVM分类器。实验的原始图像数据来自PASCAL VOC2007，初始的图像分割图像算法和图像区域特征完全与selective search相同，这篇文章主要在区域聚合算法上面进行了改进。进行对比的算法有selective search (SS), geodesic object proposals (GOP), global and local search (GLS), edge boxes (EB) 和 binarized normed gradients(BING)。实验结果对比如下所示：在对比中，文章提出的方法(Ours)与Selective Search (SS)差别并不太大。在低proposal数量情况下Edge Box和Selective Search的结果要好于文章提出的方法；在高proposal数量情况下，文章提出的方法结果稍微好一点。上表是几种方法加R-CNN在PASCAL VOC2007识别结果对比，文章中并没有注明对比情况下的IoU参数。从表中看出，就检索精度上，文章提出的算法与Selective Search并没有太大的区别，文章提出的算法改进很有限。这篇文章的主要思想是对Selective Search方法就分割区域聚合过程进行改进，文章使用了多层树形聚合方法，将之前的单贪心聚合分为多个贪心聚合流程，并使用SVM进行区域分类。文章使用的树形区域聚合方法确实增大了分割区域聚合的搜索空间，但从单个过程来看还是贪心聚合的方式，所以文章对Selective Search的改进程度很小，主要提供了一种新的分割区域聚合的思路。从实验对比结果来看，文章提出的方法只在低proposal数量情况下稍微优于Selective Search，但文章提出的方法使用的空间复杂度远大于Selective Search，而且文章提出的方法增加了计算proposal的时间。 Uijlings, Jasper RR, et al. "Selective search for object recognition." International journal of computer vision (2013): 154-171.

论文地址： V-Net 是另一种版本的3D U-Net。它与U-Net的区别在于： 1、3D图像分割end2ent模型（基于3D卷积），用于MRI前列腺容积医学图像分割。2、新的目标函数，基于Dice coefficient。3、数据扩充方法：random non-linear transformations和histogram matching（直方图匹配）。4、加入残差学习提升收敛。（1）网络结构其网络结构主要特点是3D卷积，引入残差模块和U-Net的框架，网络结构如图：整个网络分为压缩路径和非压缩路径，也就是缩小和扩大feature maps，每个stage将特征缩小一半，也就是128-128-64-32-16-8，通道上为1-16-32-64-128-256。每个stage加入残差学习以加速收敛。图中的圆圈加交叉代表卷积核为5*5*5，stride为1的卷积，可知padding为2*2*2就可以保持特征大小不变。每个stage的末尾使用卷积核为2*2*2，stride为2的卷积，特征大小减小一半（把2x2 max-pooling替换成了2x2 conv.）。整个网络都是使用keiming等人提出的PReLU非线性单元。网络末尾加一个1*1*1的卷积，处理成与输入一样大小的数据，然后接一个softmax。（2）损失函数由于前景比较小，在学习过程中不容易被学习到，因此重新定义了Dice coefficient损失函数。两个二进制的矩阵的dice相似系数为：使用这个函数能避免类别不平衡。

图像分割算法的本科毕业论文

通过遥感变化信息检测方法对两时相遥感影像进行处理分析后，得到 “变化信息”影像，同时为了便于后续震害信息的识别，需要把这些变化信息从复杂的环境背景中提取出来，得到一个仅包含变化信息的二值影像，这里就需要用到图像分割 ( ImageSegmentation ) 技术。图像分割包括手动分割和自动分割两种，手动分割是指操作者利用相关的经验进行小图斑的合并、提取和取舍，但是对于大区域遥感影像来说，手工操作工作量大、效率低、速度慢、周期长、容易漏掉小图斑，并且分割图斑的边界容易受到操作者的主观控制，对精度的影响也较大，所以本研究中的图像分割一般指的是自动分割。

退化废弃地遥感信息提取研究

从 20 世纪 70 年代起，图像分割方法一直受到各国学者的关注，至今已经提出了很多种分割方法，FuK. S. ( 1981) 将分割方法分成阈值分割、边缘分割和区域分割，实际上区域分割包含了阈值分割。蔡殉、朱波 ( 2002) 则将图像分割方法分成更多的类别，包括阈值分割、彩色分割、基于模糊集法、深度分割、像素分割、区域增长法，其中彩色分割、深度分割和像素分割都属于阈值分割。

由于现今遥感变化信息检测还处于像元级别 ( 钟家强，2005) ，通过不同检测方法，对灰度、彩色影像进行处理变换，使得变化信息的灰度 ( 像素值) 和色彩信息得到加强，通常表现出灰白色 ( 图 4 － 8、图 4 － 9) 和亮绿色 ( 图 4 － 11) ，与周围地物的色标不协调，可以通过确定相关的变化阈值把变化区域分割出来。但是由于变化信息受到太阳辐射、大气干扰、传感器参数、空间分辨率、光谱分辨率以及季节差异等因素影响，变化图斑的灰度有时在一定的范围内波动，增加了变化信息精确分割的难度，这使得变化阈值的确定显得尤为重要。

( 一) 变化影像特征分析

通过多时相遥感变化信息检测方法得到的灰度或彩色影像通常具有以下特征: ① 影像中光谱特征复杂，包含的地物类型众多，但是变化信息和背景环境的光谱性质不一致。② 灰度影像的变换信息图斑一般分布在灰度轴的两端 ( 就是较亮的区域) ，不过有时也可能位于暗端，极少数情况下也可能位于两者之间，这要根据具体的遥感数据和采用何种检测方法来定; 彩色影像变化信息图斑一般为亮绿色，是否能够和周围地物类型明显区分要根据实际情况而定。③ 变化信息图斑内部的灰度值比较均匀，但是会在一定范围内波动，所以图像分割时很容易丢失细小的图斑。④ 变化信息图斑之间灰度特征比较相似 ( 一致) ，但是纹理特征的差别通常较明显，因为变化信息的图斑可能属于不同的地物类型，所以通常不能用纹理信息来分割变化信息图斑。⑤ 由于非人为控制的因素，影像中不可避免地存在一些噪声信息，这些噪声信息一般表现在与变化信息图斑接近的小图斑( 图 4 － 9 表现得特别明显) ，所以分割的时候要区分哪些是变化信息图斑，哪些是噪声图斑。⑥ 对于不同的环境和区域，变化信息图斑是服从随机分布的，有的地方稀疏，有的地方密集。

( 二) 单阈值区域分割法

单阈值区域分割是一种简单有效的图像分割方法，其用一个阈值将变化图像的灰度级分为两个部分: 变化与未变化。其最大特点是计算简单，在重视运算效率的应用场合 ( 例如用于硬件实现) 得到了广泛应用 ( 冯德俊，2004) 。一般是利用图像的灰度直方图来确定分割阈值。在计算分割阈值时，常在去除噪声的基础上将灰度直方图包络成一条曲线，如果图像上有多个特征区域，其直方图就会出现多个峰值，每个峰值对应一个特征区域，而谷底值点就为分割阈值，用以划分不同的特征区域。

复杂图像的目标和背景的灰度值时常有部分交错，为了在分割时使这种错误分割的概率最小，需要寻找出最优的分割阈值，所以单阈值区域分割法也叫最优阈值法，意指能够使分割误差最小。图像的灰度直方图可以看成是像元灰度值的概率分布密度函数，假设一幅图像仅含有目标和背景两个主要的灰度值区域，那么其直方图就表示对应目标和背景两个单峰值的概率分布密度函数之和，如果已知密度函数的形式，就可以计算出使误差最小的最优阈值。其计算原理如下:

假设一幅含有高斯噪声的图像，其背景和目标的直方图(概率密度函数)分别为pb(z)和po(z)，那么整个图像的混合概率密度p(z)为(章毓晋，2001):

退化废弃地遥感信息提取研究

式中:σb和σo分别为背景和目标均值的均方差;μb和μo分别为背景和目标的平均灰度值;pb和po分别为背景和目标区域灰度的先验概率，二者之和为1。如果μb＜μo，需要确定阈值T，将小于阈值的分割作为背景，大于阈值的分割作为目标，假设将目标像元错误地划分为背景以及把背景错误地划分为目标的概率分别为Eb(T)和Eo(T)，则总的误差为两者之和E(T)。为了使该误差最小，将总误差对T求导数，并令导数为零，得到

退化废弃地遥感信息提取研究

将该式代入式(4－3)，可得二项式

退化废弃地遥感信息提取研究

求解该二项式得到最优阈值

退化废弃地遥感信息提取研究

最优阈值T的选取原理如图4－12所示，其原理可以概括为:将经过平滑去噪后的直方图看成一条曲线h(x)，最优阈值T必须满足以下两个条件:

退化废弃地遥感信息提取研究

图4－12 最优阈值选取原理

设原始图像 f( x，y) 的灰度值范围为 G =［0，L －1］，用最优单阈值法把图像分成两类，最优分割阈值为 T ( 0 ＜ T ＜ L －1) ，分割后生成的二值影像为 g( x，y) :

退化废弃地遥感信息提取研究

本研究在 EＲDAS 软件下利用空间建模语言 ( SML) 实现了单阈值 ( 最优阈值) 法，分别分析了图 4 －8、图 4 －9 和图 4 －11 变化影像的直方图分布情况 ( 图 4 －13) ，并进行了最优阈值区域分割，把得到的三幅二值变化信息影像取合集，即把三幅影像相加，保留所有大于 1 的像素点，最后得到变化区域二值影像，如图 4 －14 所示。

图 4 －13 三幅变化影像的直方图曲线

图 4 －14 单阈值法提取的变化信息二值影像( 白色区域为发生变化的区域)

图 4 －15 双阈值模糊识别法计算流程

(三)双阈值模糊识别分割法

由于单阈值区域分割法只有一个全局阈值参与影像分割，然而影像受到大气、噪声、光照以及背景灰度变化的共同影响，导致了变化信息的灰度值总是在一定范围内波动，常常出现变化信息和噪声以及其他地物类别交错的现象。在这种情况下，单阈值区域分割难以满足精度的要求，如何区分出其中的变化信息?本研究提出了双阈值模糊识别分割法，其流程如图4－15所示。

利用变化图像的灰度直方图计算得到两个阈值T1和T2，并且T1＜T2，然后利用双阈值法对变化图像进行分割(DaneKottkeetal.，1989、1998)，将图像f(x，y)分割为三个类别:背景、不确定类、变化信息:

退化废弃地遥感信息提取研究

对其中不确定的像元保留其灰度值不变，利用模糊识别算子构建目标函数，分别计算出该像元属于两种不同类别(背景和变化信息)的模糊隶属度，通过比较两种隶属度的大小判断其归属(把它归类到隶属度大的那一类当中)，划分到背景与变化信息当中，直到完成所有不确定像元的划分，即完成了整个分割过程。

1.双阈值T1和T2的计算

核心阈值T1的计算按照公式4－5的单阈值(最优阈值法)区域分割法得到。核心阈值T2则是利用灰度直方图中大于T1阈值的像元灰度求平均值得到。

设影像的灰度值在0到255之间(8维图像)，利用离散积分的原理来计算灰度的均值。如果利用单阈值法计算出来的最优阈值为T1，那么核心阈值T2的计算公式如下:

退化废弃地遥感信息提取研究

式中:ni表示变化图像中灰度为i的像元出现的个数。

2.模糊识别算法

模糊识别算法的基本思想如下(李希灿等，2003、2008):

首先将样本集规格化，就是把样本集的特征值规格化到0到1之间，设样本特征值y规格化为x，样本集n个样本划分为C个类别，则模糊识别矩阵为

退化废弃地遥感信息提取研究

式中:Uhj为样本j归属于第h类的相对隶属度，h=1，2，…，C，且应当满足以下条件:

退化废弃地遥感信息提取研究

设C个类别的特征值为标准指数或模糊聚类中心指标，则C个类别的中心指标向量为:

退化废弃地遥感信息提取研究

式中:Sh为第h类的中心指标，0≤Sh≤1且h=1，2，…，c，为了求解最优模糊识别矩阵U和模糊最优中心指标S，建立目标函数(李希灿，1998):

退化废弃地遥感信息提取研究

式4－14的意义是:样本集对于全体类别的加权广义海明距离平方和为最小。显然，在不分类别(h=1，Uhj=1)的情况下，该公式变为通常的最小二乘最优准则。在式4－14的目标函数下，计算出最优模糊划分的隶属度和中心指标向量:

退化废弃地遥感信息提取研究

式中:u*hj为样本j隶属于h类的隶属度。

3.分割归类

通过构造的目标函数(隶属度函数)，分别计算出每个像素点属于“目标”(变化信息)和“背景”(非变化信息)的隶属度，并把它分入到隶属度大的那一类当中，从而完成图像分割的过程。

图4－16 双阈值模糊识别分割法二值影像

(白色区域为变化信息)

通过在EＲDAS下利用空间建模语言(SML)实现该分割算法，分别将图4－8、图4－9和图4－11变化图像作为输入对象，进行双阈值模糊识别分割，得到的二值变化图像取合集最终结果如图4－16所示。从图4－16中可以看出，双阈值模糊识别分割法能够在一定程度上消除单阈值区域分割法中混杂在变化信息中的离散噪声和个别地物类型，使变化信息更加准确、集中，从而提高了分割的精度。实践证明，双阈值模糊识别分割法有着坚实的理论基础，并且在实际变化信息的分割中能够取得很好的效果，是一种可行、可靠的图像分割自动算法。

我能帮你写的。要有全局观念，从整体出发去检查每一部分在论文中所占的地位和作用。看看各部分的比例分配是否恰当，篇幅的长短是否合适，每一部分能否为中心论点服务。比如有一篇论文论述企业深化改革与稳定是辩证统一的，作者以浙江××市某企业为例，说只要干部在改革中以身作则，与职工同甘共苦，可以取得多数职工的理解。从全局观念分折，我们就可以发现这里只讲了企业如何改革才能稳定，没有论述通过深化改革，转换企业经营机制，提高了企业经济效益，职工收入增加，最终达到社会稳定。(二)从中心论点出发，决定材料的取舍，把与主题无关或关系不大的材料毫不可惜地舍弃，尽管这些材料是煞费苦心费了不少劳动搜集来的。有所失，才能有所得。一块毛料寸寸宝贵，舍不得剪裁去，也就缝制不成合身的衣服。为了成衣，必须剪裁去不需要的部分。所以，我们必须时刻牢记材料只是为形成自己论文的论点服务的，离开了这一点，无论是多少好的材料都必须舍得抛弃。

图像处理是利用计算机对图像信息进行加工以满足人的视觉心理或者应用需求的行为，应用广泛，多用于测绘学、大气科学、天文学、美图、使图像提高辨识等。学术堂在这里为大家整理了一些图像处理本科毕业论文题目，希望对你有用。1、基于模糊分析的图像处理方法及其在无损检测中的应用研究2、数字图像处理与识别系统的开发3、关于数字图像处理在运动目标检测和医学检验中若干应用的研究4、基于ARM和DSP的嵌入式实时图像处理系统设计与研究5、基于图像处理技术的齿轮参数测量研究6、图像处理技术在玻璃缺陷检测中的应用研究7、图像处理技术在机械零件检测系统中的应用8、基于MATLAB的X光图像处理方法9、基于图像处理技术的自动报靶系统研究10、多小波变换及其在数字图像处理中的应用11、基于图像处理的检测系统的研究与设计12、基于DSP的图像处理系统的设计13、医学超声图像处理研究14、基于DSP的视频图像处理系统设计15、基于FPGA的图像处理算法的研究与硬件设计

数字图像处理方面了解的了。

遥感图像分类方法比较研究论文

常用的遥感数据的专题分类方法有多种，从分类判别决策方法的角度可以分为统计分类器、神经网络分类器、专家系统分类器等；从是否需要训练数据方面，又可以分为监督分类器和非监督分类器。

一、统计分类方法

统计分类方法分为非监督分类方法和监督分类方法。非监督分类方法不需要通过选取已知类别的像元进行分类器训练，而监督分类方法则需要选取一定数量的已知类别的像元对分类器进行训练，以估计分类器中的参数。非监督分类方法不需要任何先验知识，也不会因训练样本选取而引入认为误差，但非监督分类得到的自然类别常常和研究感兴趣的类别不匹配。相应地，监督分类一般需要预先定义分类类别，训练数据的选取可能会缺少代表性，但也可能在训练过程中发现严重的分类错误。

1.非监督分类器

非监督分类方法一般为聚类算法。最常用的聚类非监督分类方法是 K-均值（K-Means Algorithm）聚类方法（Duda and Hart，1973）和迭代自组织数据分析算法（ISODATA）。其算法描述可见于一般的统计模式识别文献中。

一般通过简单的聚类方法得到的分类结果精度较低，因此很少单独使用聚类方法进行遥感数据专题分类。但是，通过对遥感数据进行聚类分析，可以初步了解各类别的分布，获取最大似然监督分类中各类别的先验概率。聚类分析最终的类别的均值矢量和协方差矩阵可以用于最大似然分类过程（Schowengerdt，1997）。

2.监督分类器

监督分类器是遥感数据专题分类中最常用的一种分类器。和非监督分类器相比，监督分类器需要选取一定数量的训练数据对分类器进行训练，估计分类器中的关键参数，然后用训练后的分类器将像元划分到各类别。监督分类过程一般包括定义分类类别、选择训练数据、训练分类器和最终像元分类四个步骤（Richards，1997）。每一步都对最终分类的不确定性有显著影响。

监督分类器又分为参数分类器和非参数分类器两种。参数分类器要求待分类数据满足一定的概率分布，而非参数分类器对数据的概率分布没有要求。

遥感数据分类中常用的分类器有最大似然分类器、最小距离分类器、马氏距离分类器、K-最近邻分类器（K-Nearest neighborhood classifier，K-NN）以及平行六面体分类器（parallelepiped classifier）。最大似然、最小距离和马氏距离分类器在第三章已经详细介绍。这里简要介绍 K-NN 分类器和平行六面体分类器。

K-NN分类器是一种非参数分类器。该分类器的决策规则是：将像元划分到在特征空间中与其特征矢量最近的训练数据特征矢量所代表的类别（Schowengerdt，1997）。当分类器中 K=1时，称为1-NN分类器，这时以离待分类像元最近的训练数据的类别作为该像元的类别；当 K ＞1 时，以待分类像元的 K 个最近的训练数据中像元数量最多的类别作为该像元的类别，也可以计算待分类像元与其 K 个近邻像元特征矢量的欧氏距离的倒数作为权重，以权重值最大的训练数据的类别作为待分类像元的类别。Hardin，（1994）对 K-NN分类器进行了深入的讨论。

平行六面体分类方法是一个简单的非参数分类算法。该方法通过计算训练数据各波段直方图的上限和下限确定各类别像元亮度值的范围。对每一类别来说，其每个波段的上下限一起就形成了一个多维的盒子（box）或平行六面体（parallelepiped）。因此 M 个类别就有M 个平行六面体。当待分类像元的亮度值落在某一类别的平行六面体内时，该像元就被划分为该平行六面体代表的类别。平行六面体分类器可以用图5-1中两波段的遥感数据分类问题来表示。图中的椭圆表示从训练数据估计的各类别亮度值分布，矩形表示各类别的亮度值范围。像元的亮度落在哪个类别的亮度范围内，就被划分为哪个类别。

图5-1 平行六面体分类方法示意图

3.统计分类器的评价

各种统计分类器在遥感数据分类中的表现各不相同，这既与分类算法有关，又与数据的统计分布特征、训练样本的选取等因素有关。

非监督聚类算法对分类数据的统计特征没有要求，但由于非监督分类方法没有考虑任何先验知识，一般分类精度比较低。更多情况下，聚类分析被作为非监督分类前的一个探索性分析，用于了解分类数据中各类别的分布和统计特征，为监督分类中类别定义、训练数据的选取以及最终的分类过程提供先验知识。在实际应用中，一般用监督分类方法进行遥感数据分类。

最大似然分类方法是遥感数据分类中最常用的分类方法。最大似然分类属于参数分类方法。在有足够多的训练样本、一定的类别先验概率分布的知识，且数据接近正态分布的条件下，最大似然分类被认为是分类精度最高的分类方法。但是当训练数据较少时，均值和协方差参数估计的偏差会严重影响分类精度。Swain and Davis（1978）认为，在N维光谱空间的最大似然分类中，每一类别的训练数据样本至少应该达到10×N个，在可能的条件下，最好能达到100×N以上。而且，在许多情况下，遥感数据的统计分布不满足正态分布的假设，也难以确定各类别的先验概率。

最小距离分类器可以认为是在不考虑协方差矩阵时的最大似然分类方法。当训练样本较少时，对均值的估计精度一般要高于对协方差矩阵的估计。因此，在有限的训练样本条件下，可以只估计训练样本的均值而不计算协方差矩阵。这样最大似然算法就退化为最小距离算法。由于没有考虑数据的协方差，类别的概率分布是对称的，而且各类别的光谱特征分布的方差被认为是相等的。很显然，当有足够训练样本保证协方差矩阵的精确估计时，最大似然分类结果精度要高于最小距离精度。然而，在训练数据较少时，最小距离分类精度可能比最大似然分类精度高（Richards，1993）。而且最小距离算法对数据概率分布特征没有要求。

马氏距离分类器可以认为是在各类别的协方差矩阵相等时的最大似然分类。由于假定各类别的协方差矩阵相等，和最大似然方法相比，它丢失了各类别之间协方差矩阵的差异的信息，但和最小距离法相比较，它通过协方差矩阵保持了一定的方向灵敏性（Richards，1993）。因此，马氏距离分类器可以认为是介于最大似然和最小距离分类器之间的一种分类器。与最大似然分类一样，马氏距离分类器要求数据服从正态分布。

K-NN分类器的一个主要问题是需要很大的训练数据集以保证分类算法收敛（Devijver and Kittler，1982）。K-NN分类器的另一个问题是，训练样本选取的误差对分类结果有很大的影响（Cortijo and Blanca，1997）。同时，K-NN分类器的计算复杂性随着最近邻范围的扩大而增加。但由于 K-NN分类器考虑了像元邻域上的空间关系，和其他光谱分类器相比，分类结果中“椒盐现象”较少。

平行六面体分类方法的优点在于简单，运算速度快，且不依赖于任何概率分布要求。它的缺陷在于：首先，落在所有类别亮度值范围之外的像元只能被分类为未知类别；其次，落在各类别亮度范围重叠区域内的像元难以区分其类别（如图5-1所示）。

各种统计分类方法的特点可以总结为表5-1。

二、神经网络分类器

神经网络用于遥感数据分类的最大优势在于它平等地对待多源输入数据的能力，即使这些输入数据具有完全不同的统计分布，但是由于神经网络内部各层大量的神经元之间连接的权重是不透明的，因此用户难以控制（Austin，Harding and Kanellopoulos et al.，1997）。

神经网络遥感数据分类被认为是遥感数据分类的热点研究领域之一（Wilkinson，1996；Kimes，1998）。神经网络分类器也可分为监督分类器和非监督分类器两种。由于神经网络分类器对分类数据的统计分布没有任何要求，因此神经网络分类器属于非参数分类器。

遥感数据分类中最常用的神经网络是多层感知器模型（multi-layer percep-tron，MLP）。该模型的网络结构如图5-2所示。该网络包括三层：输入层、隐层和输出层。输入层主要作为输入数据和神经网络输入界面，其本身没有处理功能；隐层和输出层的处理能力包含在各个结点中。输入的结构一般为待分类数据的特征矢量，一般情况下，为训练像元的多光谱矢量，每个结点代表一个光谱波段。当然，输入结点也可以为像元的空间上下文信息（如纹理）等，或多时段的光谱矢量（Paola and Schowengerdt，1995）。

表5-1 各种统计分类器比较

图5-2 多层感知器神经网络结构

对于隐层和输出层的结点来说，其处理过程是一个激励函数（activation function）。假设激励函数为f（S），对隐层结点来说，有：

遥感信息的不确定性研究

其中，pi为隐层结点的输入；hj为隐层结点的输出；w为联接各层神经之间的权重。

对输出层来说，有如下关系：

遥感信息的不确定性研究

其中，hj为输出层的输入；ok为输出层的输出。

激励函数一般表达为：

遥感信息的不确定性研究

确定了网络结构后，就要对网络进行训练，使网络具有根据新的输入数据预测输出结果的能力。最常用的是后向传播训练算法（Back-Propagation）。这一算法将训练数据从输入层进入网络，随机产生各结点连接权重，按式（5-1）（5-2）和（5-3）中的公式进行计算，将网络输出与预期的结果（训练数据的类别）相比较并计算误差。这个误差被后向传播的网络并用于调整结点间的连接权重。调整连接权重的方法一般为delta规则（Rumelhart，et al.，1986）：

遥感信息的不确定性研究

其中，η为学习率（learning rate）；δk为误差变化率；α为动量参数。

将这样的数据的前向和误差后向传播过程不断迭代，直到网络误差减小到预设的水平，网络训练结束。这时就可以将待分类数据输入神经网络进行分类。

除了多层感知器神经网络模型，其他结构的网络模型也被用于遥感数据分类。例如，Kohonen自组织网络被广泛用于遥感数据的非监督聚类分析（Yoshida et al.，1994；Schaale et al.，1995）；自适应共振理论（Adaptive Resonance Theory）网络（Silva，S and Caetano，）、模糊ART图（Fuzzy ART Maps）（Fischer， and Gopal，S，1997）、径向基函数（骆剑承，1999）等也被用于遥感数据分类。

许多因素影响神经网络的遥感数据分类精度。Foody and Arora（1997）认为神经网络结构、遥感数据的维数以及训练数据的大小是影响神经网络分类的重要因素。

神经网络结构，特别是网络的层数和各层神经元的数量是神经网络设计最关键的问题。网络结构不但影响分类精度，而且对网络训练时间有直接影响（Kavzoglu and Mather，1999）。对用于遥感数据分类的神经网络来说，由于输入层和输出层的神经元数目分别由遥感数据的特征维数和总的类别数决定的，因此网络结构的设计主要解决隐层的数目和隐层的神经元数目。一般过于复杂的网络结构在刻画训练数据方面较好，但分类精度较低，即“过度拟合”现象（over-fit）。而过于简单的网络结构由于不能很好的学习训练数据中的模式，因此分类精度低。

网络结构一般是通过实验的方法来确定。Hirose等（1991）提出了一种方法。该方法从一个小的网络结构开始训练，每次网络训练陷入局部最优时，增加一个隐层神经元，然后再训练，如此反复，直到网络训练收敛。这种方法可能导致网络结构过于复杂。一种解决办法是每当认为网络收敛时，减去最近一次加入的神经元，直到网络不再收敛，那么最后一次收敛的网络被认为是最优结构。这种方法的缺点是非常耗时。“剪枝法”（pruning）是另一种确定神经网络结构的方法。和Hirose等（1991）的方法不同，“剪枝法”从一个很大的网络结构开始，然后逐步去掉认为多余的神经元（Sietsma and Dow，1988）。从一个大的网络开始的优点是，网络学习速度快，对初始条件和学习参数不敏感。“剪枝”过程不断重复，直到网络不再收敛时，最后一次收敛的网络被认为最优（Castellano，Fanelli and Pelillo，1997）。

神经网络训练需要训练数据样本的多少随不同的网络结构、类别的多少等因素变化。但是，基本要求是训练数据能够充分描述代表性的类别。Foody等（1995）认为训练数据的大小对遥感分类精度有显著影响，但和统计分类器相比，神经网络的训练数据可以比较少。

分类变量的数据维对分类精度的影响是遥感数据分类中的普遍问题。许多研究表明，一般类别之间的可分性和最终的分类精度会随着数据维数的增大而增高，达到某一点后，分类精度会随数据维的继续增大而降低（Shahshahani and Landgrebe，1994）。这就是有名的Hughes 现象。一般需要通过特征选择去掉信息相关性高的波段或通过主成分分析方法去掉冗余信息。分类数据的维数对神经网络分类的精度同样有明显影响（Battiti，1994），但Hughes 现象没有传统统计分类器中严重（Foody and Arora，1997）。

Kanellopoulos（1997）通过长期的实践认为一个有效的ANN模型应考虑以下几点：合适的神经网络结构、优化学习算法、输入数据的预处理、避免振荡、采用混合分类方法。其中混合模型包括多种ANN模型的混合、ANN与传统分类器的混合、ANN与知识处理器的混合等。

三、其他分类器

除了上述统计分类器和神经网络分类器，还有多种分类器被用于遥感图像分类。例如模糊分类器，它是针对地面类别变化连续而没有明显边界情况下的一种分类器。它通过模糊推理机制确定像元属于每一个类别的模糊隶属度。一般的模糊分类器有模糊C均值聚类法、监督模糊分类方法（Wang，1990）、混合像元模型（Foody and Cox，1994；Settle and Drake，1993）以及各种人工神经网络方法等（Kanellopoulos et al.，1992；Paola and Schowengerdt，1995）。由于模糊分类的结果是像元属于每个类别的模糊隶属度，因此也称其为“软分类器”，而将传统的分类方法称为“硬分类器”。

另一类是上下文分类器（contextual classifier），它是一种综合考虑图像光谱和空间特征的分类器。一般的光谱分类器只是考虑像元的光谱特征。但是，在遥感图像中，相邻的像元之间一般具有空间自相关性。空间自相关程度强的像元一般更可能属于同一个类别。同时考虑像元的光谱特征和空间特征可以提高图像分类精度，并可以减少分类结果中的“椒盐现象”。当类别之间的光谱空间具有重叠时，这种现象会更明显（Cortijo et al.，1995）。这种“椒盐现象”可以通过分类的后处理滤波消除，也可以通过在分类过程中加入代表像元邻域关系的信息解决。

在分类过程中可以通过不同方式加入上下文信息。一是在分类特征中加入图像纹理信息；另一种是图像分割技术，包括区域增长/合并常用算法（Ketting and Landgrebe，1976）、边缘检测方法、马尔可夫随机场方法。Rignot and Chellappa（1992）用马尔可夫随机场方法进行SAR图像分类，取得了很好的效果，Paul Smits（1997）提出了保持边缘细节的马尔可夫随机场方法，并用于SAR图像的分类；Crawford（1998）将层次分类方法和马尔可夫随机场方法结合进行SAR图像分类，得到了更高的精度；Cortijo（1997）用非参数光谱分类对遥感图像分类，然后用ICM算法对初始分类进行上下文校正。

给你推荐一篇不错的文章，里面对遥感影像分类的方法有详细介绍，希望对你有用。

一、实验目的

通过使用ENVI的六种主要的遥感监督分类器——平行六面体分类、最小距离分类、马氏距离分类、最大似然分类、神经网络分类和支持向量机分类的命令，加深对遥感监督分类原理的理解，了解其技术实现过程，初步掌握其ENVI功能命令的基本使用操作。

二、实验内容

①桂林市TM 遥感影像平行六面体分类；②桂林市TM 遥感影像最小距离分类；③桂林市TM 遥感影像马氏距离分类；④桂林市TM 遥感影像最大似然分类；⑤桂林市TM 遥感影像神经网络分类；⑥桂林市TM 遥感影像支持向量机分类；⑦对6种分类结果进行比较分析。

三、实验要求

①平行六面体、最小距离、马氏距离、最大似然、神经网络和支持向量机六种分类方法在理论上比较复杂，为取得好的实验效果，要求实验前事先预习其原理，从理论上理解并掌握它们的特点和异同。②确定分类处理方法训练样本需要用到的已知地质资料，提前准备。③编写实验报告。④由于同时做六种分类处理工作量较大，可以根据实际课时情况选择做其中部分。最小距离分类为必须做的方法。

四、技术条件

①微型计算机；②灌阳地区QuickBird全色波段遥感数据；③ENVI软件；④Photoshop软件（以上）和ACDSee软件（以上）。

五、实验步骤

遥感影像监督分类可以分为四个过程：样本选择、执行监督分类、评价分类结果和分类后处理。具体操作步骤如下。

（一）定义训练

1.样本选择

（1）在ENVI主菜单中，选择“File>Open Image File”，打开灌阳地区QuickBird全色波段遥感数据，Band3、4、1合成RGB并使之显示在“Display”中，通过分析图像，选择耕地、林地、居民地和水体四种地物样本。

图17-1 ROI工具对话框

（2）在主图像窗口中，选择“Overlay>Region of Interest”，打开“ROI Tool”对话框，如图17-1所示。

（3）在“ROI Tool”对话框中，选择“Window”选项，可以在“Image”、“Scroll”或者“Zoom”窗口中绘制感兴趣区；在“ROI Name”字段输入样本的名称；在“Color”字段中，单击右键选择颜色。

（4）在“ROI Tool”对话框中，选择“ROI Type > Polygon”，在“Image”、“Scroll”或者“Zoom”窗口中绘制感兴趣区。

（5）完成一类感兴趣区的绘制后，在“ROI Tool”对话框中，选择【New Region】按钮，新建另一类样本种类，重复上述操作。

2.评价训练样本

在ROI对话框中，选择“Option>Compute ROI Separability”，打开待分类影像文件，选择所有定义的样本类型，可以计算样本的可分离性，如图17-2所示，表示各个样本类型之间的可分离性，用Jeffries-Matusita距离和转换分离度（Transformed Divergence）来表示。ENVI为每一个感兴趣区组合计算Jeffries-Matusita距离和Transformed Divergence，在对话框底部，根据可分离性值的大小，从小到大列出感兴趣区组合。这两个参数的值在0～之间，大于说明样本之间可分离性好，属于合格样本；小于，需要重新选择样本；小于1，考虑将两类样本合成一类样本。

图17-2 样本可分离性计算报表

（二）执行监督分类

在ENVI主菜单中选择“Classificatoin>Supervisred＞分类器类型”，可以根据分类的复杂度、精度需求等选择分类器。

1.平行六面体分类器

平行六面体用一条简单的判定规则对多波谱数据进行分类。判定边界在图像数据空间中形成了一个N维平行六面体。平行六面体的维数由来自每一种选择的分类平均值的标准差的阈值确定。如果像元值位于N 个被分类波段的低阈值与高阈值之间，则它归属于这一类。如果像元值落在多个类里，那么ENVI将这一像元归到最后一个匹配的类里。没有落在平行六面体的任何一类里的区域被称为无类别的。操作步骤如下：

（1）在ENVl主菜单栏中选择“Classification>Supervised>Parallelepiped”，在分类输入文件对话框中选择待分类遥感影像，打开“Parallelepiped Parameters”对话框，如图17-3所示。

图17-3 平行六面体分类器参数设置对话框

（2） Select Classes from Regions：点击【Select All Items】按钮，选择所有的训练样本。

（3） Set Max stdev from Mean：设置标准差阈值。有三种类型：不设置标准差阈值（None）、为所有类别设置一个标准差阈值（Single Value）和分别为每种类别设置一个标准差阈值（Multiple Values）。

（4）选择“Single Value”，在“Max stdev from Mean”文本框里输入标准差阈值。

（5）点击【Preview】按钮，可以预览分类结果。

（6）选择分类结果的输出路径及文件名。

（7）设置“Output Rule Images”：是否选择规则图像数据。

（8）设置完上述参数后，点击【OK】按钮执行分类处理。

2.最小距离分类器

最小距离分类用到每一个终端单元的均值矢量，计算每一个未知像元到每一类均值矢量的欧几里德距离。所有像元都被归为最近的一类，除非限定了标准差和距离的极限（这时，会出现一些像元因不满足选择的标准，而成为“无类别”），操作步骤如下：

（1）在ENVI主菜单栏中选择“Classification>Supervised>Minimum Distance”，在分类输入文件对话框中选择待分类遥感影像，打开“Minimum Distance”对话框，如图174所示。

图17-4 最小距离分类器参数设置对话框

（2） Select classes from Regions：点击【Select All Items】按钮，选择所有的训练样本。

（3） Set Max stdev from Mean：设置标准差阈值。有3种类型：不设置标准差阈值（None）、为所有类别设置一个标准差阈值（Single Value）和分别为每种类别设置一个标准差阈值（Multiple Values）。

（4）选择“Single Value”，在“Max stdev from Mean”文本框里输入标准差阈值。

（5） Set Max Distances Error：设置允许的最大距离误差，距离大于该值的像元将不被分入该类，如果不满足所有类别的最大距离误差，将会被归为未分类类型中，有3种类型：不设置最大距离误差（None）、为所有类别设置一个最大距离误差（Single Value）和分别为每种类别设置一个最大距离误差（Multiple Values）。

（6）点击【Preview】按钮，可以预览分类结果。

（7）选择分类结果的输出路径及文件名。

（8）设置“Output Rule Images”：是否选择规则图像数据。

（9）设置完上述参数后，点击【OK】按钮执行分类处理。

.3 马氏距离分类器

马氏距离分类是一个方向灵敏的距离分类器，分类时用到了统计。它与最大似然分类有些类似，但是假定所有类的协方差相等，所以是一种较快的方法。所有像元都被归到最临近的ROI类，除非用户限定了一个距离阈值（这时，如果一些像元不在阈值内，就会被划为无类别），操作步骤如下：

（1）在ENVI主菜单栏中选择“Classification>Supervised>Mahalanobis Distance”，在分类输入文件对话框中选择待分类遥感影像，打开“Mahalanobis Distance”对话框，如图17-5所示。

（2） Select Classes from Regions：点击【Select All Items】按钮，选择所有的训练样本。

图17-5 马氏距离分类器参数设置对话框

（3） Set Max Distances Error：设置允许的最大距离误差，距离大于该值的像元将不被分入该类，如果不满足所有类别的最大距离误差，将会被归为未分类类型中，有3种类型：不设置最大距离误差（None）、为所有类别设置一个最大距离误差（Single Value）和分别为每种类别设置一个最大距离误差（Multiple Values）。

（4）点击【Preview】按钮，可以预览分类结果。

（5）选择分类结果的输出路径及文件名。

（6）设置“Output Rule Images”：是否选择规则图像数据。

（7）设置完上述参数后，点击【OK】按钮执行分类处理。

4.最大似然分类器

最大似然分类假定每个波段每一类统计呈均匀分布，并计算给定像元属于一特定类别的可能性。除非选择一个可能性阈值，所有像元都将参与分类。每一个像元被归到可能性最大的那一类里。操作步骤如下：

（1）在ENVI主菜单栏中选择“Classification>Supervised>Maximum Likelihood”，在分类输入文件对话框中选择待分类遥感影像，打开“Maximum Likelihood Parameters”对话框，如图17-6所示。

（2） Select Classes from Regio：n点s击【Select All Items】按钮，选择所有的训练样本。

图17-6 最大似然分类器参数设置对话框

（3）Set Probability Threshold：设置似然度的阈值，有3种类型：不设置最大似然度阈值（None）、为所有类别设置一个最大似然度阈值（Single Value）和分别为每种类别设置一个最大似然度阈值（Multiple Values），如果选择Single Value，则在Probability Threshold文本框中输入一个0～1的值。

（4） Data Scale Factor：输入一个数据比例系数，这个比例系数是一个比值系数，用于将整形反射率或者辐射率数据转换为浮点型数据。例如，对于没有经过辐射定标的8bit数据，设定比例系数为255。

（5）点击【Preview】按钮可以预览分类结果。

（6）选择分类结果的输出路径及文件名。

（7）设置“Output Rule Images”：是否选择规则图像数据。

（8）设置完上述参数后，点击【OK】按钮执行分类处理。

5.神经网络分类器

用计算机模拟入脑的结构，用许多小的处理单元模拟生物的神经元，用算法实现人脑的识别、记忆、思考过程应用于图像分类，操作步骤如下：

（1）在ENVI主菜单栏中选择“Classificantion>Supervised>Neural Net”，在分类输入文件对话框中选择待分类遥感影像，打开“Neural Net Parameters”对话框，如图17-7所示。

（2）Select Classes from Regions：点击【Select All Items】按钮，选择所有的训练样本。

图17-7 神经网络分类器参数设置对话框

（3） Activation：选择活化函数，包括对数（Logistic）和双曲线（Hyperbolic）。

（4） Training Threshold Contnbution：输入训练贡献阈值（0～1）。该参数决定了与活化节点级别相关的内部权重的贡献量，它用于调节节点内部权重的变化。训练算法交互式地调整节点间的权重和节点阈值，从而使输出层和响应误差达到最小。将该参数设置为0将不会调整节点的内部权重。适当调整节点的内部权重可以生成一幅较好的分类图像，但是如果设置的权重过大，对分类结果会产生不良影响。

（5） Training Rate：设置权重调节速度（0～1）。参数值越大则使得训练速度越快，但也增加摆动或者使训练结果不收敛。

（6） Training Momentum：设置权重调节动量（0～1）。该值大于0时，在“Training Rate”文本框中输入较大值不会引起摆动。该值越大，训练的步幅越大。该参数的作用是促使权重沿当前方向改变。

（7）Training RMS Exit Criterai：指定RMS误差为何值时训练应该停止。RMS误差值在训练过程中将显示在图表中，当该值小于输入值时，即使还没有达到迭代次数，训练也会停止，然后开始进行分类。

（8） Number of Hidden Layers：输入所用隐藏层的数量。要进行线性分类，输入值为0；进行非线性分类，输入值应该大于或者等于1。

（9） Number of Training Iterations：输入用于训练的迭代次数。

（10） Min Output Activation Threshold：输入一个最小输出活化阈值。如果被分类像元的活化值小于该阈值，在输出的分类中该像元将被归入未分类中。

（11）选择分类结果的输出路径及文件名。

（12）设置“Output Rule Images”：是否选择规则图像数据。

（13）设置完上述参数后，点击【OK】按钮执行分类处理。

6.支持向量机分类器

支持向量机分类（SVM）是一种建立在统计学习理论基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量，由此构造出分类器，可以将类与类之间的间隔最大化，因而有较好的推广性和较高的分类准确率，操作步骤如下：

（1）在ENVl主菜单栏中选择“Classification>Supervised>SupportVec tor Machine”，在分类输入文件对话框中选择待分类遥感影像，打开“Support Vector Machine Classification Parameters”对话框，如图17-8所示。

图17-8 支持向量机分类器参数设置对话框

（2） Select Classes From Regions：点击【Select All Items】按钮，选择所有的训练样本。

（3） Kemel Type下拉列表中的选项有：Linear、Polynomial、Radial Basis Function和Sigmoid。

若选择Polynomial，需要设置一个核心多项式（Degere of Kernel Polynomial）的次数用于SVM，最小值为1，最大值为6；使用向量机规则需要为Kernel指定“this Bias”，默认值为1；“Gamma in Kernel Function”参数设置为大于0的浮点型数据，默认值为输入图像波段数的倒数。

若选择“Radial Basis Function”，需设置“Gamma in Kernel Function”参数为大于0的浮点型数据，默认值为输入图像波段数的倒数。

若选择Sigmoid，需使用向量机规则需要为Kernel指定“this Bias”，默认值为1；设置“Gamma in Kernel Function”参数为大于0的浮点型数据，默认值为输入图像波段数的倒数。

（4） Penalty Parameter：为大于0的浮点型数据，这个参数控制了样本错误与分类刚性延伸之间的平衡，默认值为100。

（5）Pyramid Levels：设置分级处理等级，用于SVM训练和分类处理过程，如果这个值为0，将以原始分辨率处理，最大值随图像的大小改变。

（6） Pyramid Reclassification Threshold（0～1）：当Pyramid Levels值大于0时，需要设置这个重分类阈值。

（7） Classification Probability Threshold（0～1）：为分类设置概率阈值，如果一个像素计算得到所有的规则概率小于该值，该像素将不被分类。

（8）选择分类结果的输出路径及文件名。

（9）设置“Output Rule Images”：是否选择规则图像数据。

（10）设置完上述参数后，点击【OK】按钮执行分类处理。

（三）评价分类结果

在执行监督分类后，需要对分类结果进行评价，本次实验采用使用地表真实感兴趣区来计算混淆矩阵（Confusion Matrices）方法进行分类结果评价，操作步骤如下。

1.建立地表真实感兴趣区

可以在高分辨率图像上，通过目视解译获取各个分类的地表真实感兴趣区；也可以通过野外实地调查，根据调查数据生成地表真实感兴趣区，获取方法同“（一）定义训练”，为了同训练样本区别，我们使用“植被、城镇、河流、农田”作为地表真实感兴趣区名称。

2.计算混淆矩阵

（1）打开定义验证样本的文件（即灌阳地区QuickBird全色波段）以及图像分类结果，使之显示在“Available Band”列表中。

（2）在ENVI主菜单栏中选择“Basic>Region of Interest>Restore Saved ROI File”，打开地表真实感兴趣区文件。

（3）在ENVI主菜单栏中选择“Basic>Region of Interest>Restore ROIs via Map”，打开“Reconcile ROIs via Map”对话框（图179），选择相应的地表真实感兴趣区，点击【OK】按钮。

（4）在“Select Source File where ROI was Drawn”对话框中，选择定义验证样本的文件（即灌阳地区 QuickBird 全色波段），点击【OK】按钮。

（5）在“Select Destination File to Reconcile ROIs to”对话框中，选择匹配目标文件，也就是分类结果图像。

（6）在主菜单中选择“Classification>Post Classification> Confusion Matrix> Using Ground Truth ROIs”。

图17-9“Reconcile ROIs via Map”对话框

（7）在“Classification Input File”对话框中，选择分类结果图像。地表真实感兴趣区将被自动加载到“Match Classes Parameters”对话框中。

（8）在“Match Classes Parameters”对话框中，选择所要匹配的名称，然后点击【Add Combination】按钮，将地表真实感兴趣区与最终分类结果相匹配，类别之间的匹配将显示在对话框底部的列表中，如图17-10所示，点击【OK】按钮输出混淆矩阵。

图17-10“Match Classse Parameters”对话框

（9）在混淆矩阵输出窗口的“Confusion Matrix Parameters”对话框中，选择像素（Pixels）和百分比（Percent），如图17-11所示。

（10）点击【OK】按钮，输出混淆矩阵，在输出的混淆矩阵报表中，包含了总体分类精度、Kappa系数、混淆矩阵等几项评价指标。

图17-11 混淆矩阵输出对话框

（四）分类后处理

一般情况下，使用上述分类方法得到的结果难于达到最终应用的目的，所以对获取的分类结果需要进行一些处理，才能得到最终理想的分类结果。

图17-12 编辑分类名称和颜色

1.更改分类颜色、名称

（1）打开分类结果，并使之显示在“Display”窗口中。

（2）在分类结果主图像窗口中，选择“Tools>Color Mapping>Class Color Mapping”，打开“Class Color Mapping”对话框，如图17-12所示。

（3）从“Selected Classes”列表中选择需要修改的类别，改变其颜色或者名称。

（4）完成对需要修改类别的颜色、名称的修改后，选择“Options>Save Changes”保存修改内容。

（5）选择“File>Cancel”，关闭“Class Color Mapping”对话框。

2.聚类处理

分类结果中不可避免的会产生一些面积很小的图斑，从实际应用角度有必要对这些小图斑进行剔除或重新分类。目前，常用的方法有Majority/Minority分析、聚类处理和过滤处理，本次实验选择聚类处理方法对邻近的类似分类区聚类并合并。

聚类处理首先将被选的分类用一个扩大操作合并到一起，然后用参数对话框中指定了大小的变换核对分类图像进行侵蚀操作，具体操作步骤如下：

在ENVI主菜单栏中选择“Classification> Post Classification> Clump Classes”，在“Classification Input File”对话框中，选择分类结果图像，单击【OK】按钮，打开“Clump Parameters”对话框，如图17-13所示。Clump Parameters对话框参数设置如下。

（1）选择分类类别（Select Classes）：单击【Select All Items】按钮选择所有类别；

（2）输入形态学算子大小（Rows和Cols）：默认为3,3;

（3）选择输出路径及文件名，单击【OK】按钮，完成聚类处理。

3.分类统计

分类统计可以基于分类结果计算相关输入文件的统计信息，包括类别中的像元数、最大值、最小值、平均值以及类中每个波段的标准差等，还可以记录每类的直方图以及计算协方差矩阵、相关矩阵、特征值和特征向量，并显示所有分类的总结记录。

（1）在ENVI主菜单栏中，选择“Classification> Post Classification > Class Statistics”，在“Classification Input File”对话框中，选择分类结果图像，单击【OK】按钮。

（2）在“Statistics Input File”对话框中，选择一个用于计算统计信息的输入文件，点击【OK】按钮，打开“Class Selection”对话框（图17-14），在“Select Classes”列表中，选择想计算统计的类别名称，点击【OK】按钮，打开“Compute Statistics Parameters”对话框（图17-15），选择需要的统计项，包括以下统计类型。

图17-13 “Clump Parameters”对话框

图17-14 选择分类对话框

基本统计（Basic Stats）：包括所有波段的最小值、最大值、均值和标准差，若该文件为多波段，还包括特征值。

直方图统计（Histograms）：生成一个关于频率分布的统计直方图。

协方差统计（Covariance）：包括协方差矩阵和相关矩阵以及特征值和特征向量。

（3）输出结果的方式包括3种：可以输出到屏幕显示、生成统计文件（.sta）和生成文本文件，其中生成的统计文件可以通过“Classification>Post Classification>View Statistics File”命令打开，选择输出路径及文件名，单击【OK】按钮，完成分类统计。

4.分类结果转矢量

（1）在ENVI主菜单栏中，选择“Classification>Post Classification>Classification to Vector”，在“Rasterto VectorInput Band”对话框中，选择分类结果图像，单击【OK】按钮，打开“Raster to Vector Parameters”对话框，如图17-16所示。

（2）选择需要被转换成矢量文件的类别，在“Output”标签中，使用箭头切换按钮选择“Single Layer”，把所有分类都输出到一个矢量层中；或者选择“One Layer per Class”，将每个所选分类输出到单独的矢量层。

（3）选择输出路径及文件名，单击【OK】按钮，完成分类结果转矢量文件。

图17-15 计算统计参数设置对话框

图17-16 栅格转为矢量参数设置

完成遥感影像监督分类后，分别利用平行六面体、最小距离、马氏距离、最大似然、神经网络和支持向量机这六种分类器对灌阳地区QuickBird遥感影像进行监督分类处理，利用混淆矩阵对六种分类结果进行评价，得出总体分类精度和Kappa系数。比较六种分类结果，用WORD文件记录，取名为《灌阳地区QuickBird遥感影像六种监督分类方法分类结果评价》，存入自己的工作文件夹。

六、实验报告

（1）简述实验过程。

（2）回答问题：①根据实验操作步骤及各步骤之间的关系，分析所做的监督分类方法在模型设计思想或算法上的共同特点。②通过目视解译，定性比较所获得的监督分类图像的图像识别效果优缺点。

实验报告格式见附录一。

首页

> 学术期刊知识库

基于聚类的图像分割方法研究论文