摘 要 随着信息技术的发展,基于内容的图像检索技术已经成为一个研究热点。文章提出了一种颜色和纹理相结合的图像检索算法。首先在rgb颜色空间中对已经分割好的图像块求其三个通道的颜色平均值,进行离散余弦变换后取其低频分量作为颜色特征。用边缘直方图提取其纹理特征。最后综合利用这两个特征进行图像检索。实验结果表明,本文的算法具有较好的检索效果,有效地提高了检索的查准率和查全率。
关键词 rgb颜色空间;颜色平均值;二维离散余弦变换;边缘直方图;纹理特征
1 引言
近年来由于互联网络的快速发展,数字信息正海量的增长。传统的以文本的查询方式远远满足不了人们的要求,因此,基于内容的图像检索越来越受到人们的关注,成为了研究的热点。在基于内容的图像检索中,颜色和纹理是人们使用的最为频繁的视觉特征。人们单一的对颜色或者纹理特征提出了各种各样的算法,但是一种特征的方法只能表达图像的部分属性,往往满足不了人们的视觉需求。因此本文提出了一种综合利用颜色和纹理的图像检索算法。实验表明,综合颜色和纹理这两种特征可以得到比使用单一特征进行图像检索更好的效果。
2 利用颜色特征进行检索
2.1 提取颜色特征
在国际标准mpeg-7中建议了一种描述符颜色布局
[1],它表达了颜色的空间分布信息。www.133229.coM在颜色布局描述符中,对分割好的8×8的图像取每一块图像的颜色平均值,形成一个颜色平均值矩阵,然后对其用二维离散余弦进行变换,取低频分量作为颜色特征。考虑到本文所选的测试图片都是bmp图片,以及减少计算量,提高检索速度的因素,本文的颜色布局描述符
[2,3]的提取方法如下:
(1)将整幅图像分成4×4块,计算每一块中所有象素rgb三个颜色通道的颜色平均值,并以此作为该块的代表颜色(主颜色)。
(2)将各块的颜色平均值进行离散余弦变换(dct),得到dct系数矩阵。dct是一种分离的变换,是国际静止图像压缩标准jpeg的基础。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化。因此,在一般检索中可以利用部分dct系数作为特征向量。
(3)对dct系数矩阵进行之字形扫描和量化,得到dct系数。
(4)对于r、g、b三个通道,分别从dct系数中取出4个低频分量,形成12个参数,共同构成该图像的颜色特征向量。
2.2 相似度计算
国际标准mpeg-7中建议的颜色布局描述符在匹配时使用欧式距离公式,因此在本算法中匹配时也使用欧式距离公式,即为:
其中,各个分量的w为权重,r
i,g
i,b
i分别为各个分量的第i(i=0,1,2,3)个dct系数。
3 利用纹理特征进行检索
3.1 提取纹理特征
在国际标准mpeg-7中建议了一种纹理特征描述符——边缘直方图
[1]。边缘直方图是基于图像边缘的统计特征,能较好地反映目标的边缘和纹理特征,而且运算速度较高
[4]。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍一下提取的具体步骤:
(1)将bmp图像转换成灰度图。每个象素的灰度值可以根据rgb颜色分量按下列公式计算得到: 。
(2)将整幅图像分成4×4块。
(3)分别对16块1/16子图像进行sobel边缘算子运算,得到边缘图像。
(4)统计子图像中的边缘直方图,该直方图包括4个直方条。(横轴为0,1,2,3四个边缘方向,纵轴为该方向上的象素数占子图像总的象素数的比率)
(5)将16个子图像的直方条综合起来,得到包括64个直方条的整幅图像的边缘直方图。
下面介绍用sobel算子
[5]提取图像边缘的具体算法:
首先介绍一下sobel算子中用到的4个核模板:
(1)将图像中的象素点的灰度值分别与以上四个方向的核模板相乘。
(2)比较四个乘积数值,取最大的那个数值,作为该象素点的新的灰度值。
(3)取适当的阈值t,若新的灰度值≥t,则认为该象素点为边缘点。
通过以上算法提取出图像的边缘。
3.2 相似度计算
仍然采用欧式距离公式作为相似度的计算公式,如下:
其中;q
i,d
i为图像q,d在边缘直方图中对应的第i个直方条的值。
4 利用综合特征进行检索
对于以上三幅图像,假设它们是原图像的1/4图像(其余3/4图像与此1/4图像相同),如果按照本文中的利用颜色特征进行检索,那么将得出完全相似的结论,但是实际上这三幅图像给人的感觉是完全不同的。因此说单一的依靠提取一种特征来进行检索,得出的结果往往是不尽如人意的。在本文中,利用颜色布局描述符结合了颜色特征和空间关系的特点;利用边缘直方图作为纹理特征弥补了颜色特征缺乏空间分布信息的不足,考虑到图像中的边缘多对应目标的边界或轮廓,边缘直方图描述符在一定程度上还反映了图像中目标的形状信息。
因此这两种特征描述符达到了不同特征的优势互补的效果,而且,这两种特征在提取的过程中都归一化到了[0,1]区间,可以综合在一起进行图像检索。设颜色特征的权重为wc,纹理特征权重为wt,并且wc+wt=1,则综合特征的相似度计算公式为:
5 实验结果及结论
本文验证的系统的开发平台为microsft windows xp操作系统,赛扬2.0g的cpu,1g的内存。开发工具为vc++6.0。本文的实验图库为从标准测试图像库corel图像库中选取的由海滩、恐龙、大象、马、花等组成的102幅图片。表1、表2给出这几类图片的查准率和查全率。
表1 六类图片的查准率
利用颜
色特征
利用纹
理特征
利用综
合特征
海滩
0.583
0.500
0.833
恐龙
0.500
1.000
1.000
大象
0.417
0.333
0.583
马
0.583
0.833
1.000
雪景
0.167
0.250
0.333
花
0.500
0.667
0.833
表2 六类图片的查全率
利用颜
色特征
利用纹
理特征
利用综
合特征
海滩
0.350
0.300
0.500
恐龙
0.300
0.600
0.600
大象
0.250
0.150
0.350
马
0.583
0.833
1.000
雪景
0.100
0.150
0.250
花
0.300
0.400
0.500
从表1、表2中的数据可以看出,利用综合特征进行图像检索得到的查准率和查全率都要高于使用任何一种单一的方法进行图像检索得到的查准率和查全率。通过以上的实验结果图片和结果数据可以看出本文中综合利用颜色和纹理特征进行图像检索的效果比使用单一特征进行检索的效果更好,更符合人的视觉要求。因此,本文提出的综合颜色和纹理特征进行图像检索的方法是有效的,有意义的方法。
参考文献
[1]章毓晋.基于内容的视觉信息检索[m].北京:科学出版社.2003
[2]郑楚君,杨志勇,何惠玲,常鸿森.dct压缩域中图像颜色布局描述符的提取[j]. 计算机工程与应用,2005,35:167-168
[3]顾红飞,张佑生,江巨浪.基于颜色布局的压缩图像检索研究[j].合肥工业大学学报(自然科学版),2006,29(1):1-4
[4]f malgouyres,f guichard.edge direction preserving image zooming:a mathematical and numerical analysis[j]. siam journal on numerical analysis,2001,39(1):1369-1390
[5]刘彩.一种改进的sobel图像边缘检测算法[j].贵州工业大学学报(自然科学版),2004,33(5):77-79