摘 要:摘要:本文主要介绍了一种改进的图像分割算法并将它运用到图像检索中。首先介绍了K均值聚类算法的原理,然后介绍了本文是如何改进K均值聚类算法在图像分割中的应用,并通过实验比较改进算法与其它分割算法的分割效果。
关键词:关键词:图像分割 K均值
中图分类号:TP301.6 文献标识码:A 文章编号:
1.引言
所谓图像分割,就是把图像按需要分成一些有意义的区域。这些区域互不相交,每个区域都有各自的特性。图像分割是图像处理和机器视觉的重要的组成部分,也是图像发展的瓶颈之一。图像分割技术可分为两大类:模型驱动分割和数据驱动分割。
模型驱动分割是按照某种模型的参数来进行分割,是建立在先验知识的基础上,主要有基于统计形状模型的图像分割和基于可变形模板的图像分割等。基于统计形状模型的主要思想是,首先提取出目标物体的轮廓点集,用矩阵的形式表示;然后用点分布模型(PDM)对轮廓点集进行描述,构造出目标物体的先验模型;最后采用灰度匹配的方法,将得到的先验模型与物体的实际轮廓进行反复的迭代比较,不断修改先验模型,使其与实际物体的轮廓逐步吻合。数据驱动分割则是直接对当前的图像数据进行操作,不依赖于先验知识,所以应用比较广泛,主要有三类:基于边缘检测的分割、基于区域的分割和边缘与区域相结合的分割等。基于边缘检测的分割,其基本思想是,先检测出图像的边缘点,再用某种策略连接这些边缘点构成轮廓,该轮廓就是分割出的区域。
2. K均值聚类算法原理
K均值聚类算法最早是由J.B. Mac Queen在1967年提出的,到现在仍是应用广泛的聚类分析方法之一,它用于图像分割具有直观、快速、易于实现的特点。K均值聚类算法的实质是对图像的颜色进行量化。其基本思想是:首先从数据集中随机的选取 个点作为初始的聚类中心,然后计算每个数据点到聚类中心的距离,将该数据点归类到距离它最近的那个聚类中心所在的类中,完成一次聚类。计算一次聚类结束后每个类中所有数据集的平均值,将这个平均值作为新的聚类中心进行再一次的聚类。如此对各个数据进行反复的迭代运算,不断更新聚类中心,直到满足收敛条件,不再有新的元素被重新分配为止,结束聚类。
用 均值聚类算法进行图像分割时的算法步骤为:
(1)首先选择适当的分类数目和初始聚类中心,有两种选择方法,一种是随机选取,这种随机的选取方法没有任何针对性,需要迭代的次数多,计算量较大;另一种是根据某种准则选取,如在图像分割中可以结合图像本身的特点进行选取。
3 . 改进的K均值聚类算法
(1) 颜色空间的选取
彩色图像的分割需要在特定的颜色空间内进行,选择不同的颜色空间,就会产生不同的分割效果。在2.2.1节中介绍了几个常用的颜色空间,并对各个颜色空间进行了分析。由比较分析得出,HSV空间最适合本算法,所以选择HSV空间进行分割。
(2) 初始聚类中心和分类数目的选择
由之前对K均值聚类算法原理的分析可知,在进行聚类之前首先要选取分类的数目和初始的聚类中心。传统的K均值聚类算法通常采用随机选取的方法,这样的选取方法的缺点是没有结合图像本身的特点,这种随机性造成要经过很多次的迭代运算才能找到真正的聚类中心,计算量大,而且聚类效果不理想。本文提出的算法改进了传统算法中随机选取的原则,用H、S、V三个分量的直方图来确定分类数和初始聚类中心。
本算法中选取直方图中的峰值点个数作为分类的数目,并用图像直方图中峰值处所对应的像素点作为初始的聚类中心,然后依次迭代,直至算出最后的聚类中心,再进行像素点的分类,直到完成聚类。以两个分量为例,其H分量的直方图中明显的峰值处有两个,其对应的像素点分别为0.26和0.95,因此将分类数目取为2,初始的聚类中心就设为0.26和0.95。在V分量的直方图中,比较明显的峰值处有三个,但考虑到第一个峰值和第二个峰值相隔很近,而且要与H分量的分类数目保持一致,所以也将分类数目选为2,将两个峰值处所对应的像素点0.22和0.75作为初始聚类中心。这样选取聚类中心进行K均值聚类,大大减少了计算量,也使聚类的结果更理想。
(3) 改进算法的实现步骤
改进的K均值聚类的分割算法具体步骤如下:
参考文献:
[1 周雪梅, 郭启强. 基于颜色和形状特征的图像检索方法[J]. 计算机与数字工程, 2009, 37(5): 130-132.
[2] 孙君顶, 毋小省. 基于分块主色和形状特征的彩色图像检索[J]. 光电工程, 2006, 33(12): 85-90.
[3] 孙君顶, 武学东, 周利华. 基于颜色和形状的图像检索[J]. 计算机科学, 2004, 31(5): 180-183.
[4] 欧阳军林, 夏利民. 基于二值信息的颜色和形状特征的图像检索[J]. 小型微型计算机系统, 2007, 28(7): 1262-1266.
[5] Bo Gun Park, Kyoung Mu Lee, Sang UK Lee.Color-Based Image Retrieval Modified Hausdorff Distance[J]. 2008.
[6]贲志伟, 赵勋杰. 基于改进的K均值聚类算法提取彩色图像有意义区域[J]. 计算机应用与软件, 2010, 27(9): 11-13.