摘 要 人脸图像矩阵的奇异值特征反映了图像的本质属性,我们就可以利用它来进行分类识别。但是通过实验发现,奇异值特征本身却包含很少的对分类有用的信息,基于此本文提出一种新的基于投影变换的奇异特征抽取方法,通过在实验发现此方法能大大改善识别效果。
基于奇异值特征的人脸识别方法是由Hong[1]首先提出来的。他们将人脸特征分为视觉特征、统计特征、变换系数特征以及代数特征四类,代数特征反映了图像的本质属性。因为图像本身的灰度分布描述了图像的内在信息,所以可以将图像作为矩阵看待,进行各种代数和矩阵变换后提取的代数特征是人脸的表征。
奇异值分解是求解最小二乘问题的一种有效工具,在数据压缩、图像处理以及模式识别等方面得到了广泛应用,为提取人脸代数特征提供了一种有效的手段。奇异值分解定理及其特性可描述
定理1.1(奇异值分解定理,SVD) 若(不失一般性,设m≤n ), ,则存在两个正交矩阵和 以及对角阵:, 。
使得:
(式1.1)
其中 为AAT,ATA的特征值, 分别为AAT,ATA对应 的特征矢量。
将所有奇异值按从大到小排列所得到的向量 即为图像的奇异值特征向量,文献[1]中最早将奇异值特征应用于人脸识别,建立了基于Sammon最佳鉴别平面的Bayes分类模型,实验中,采用9张人脸照片建立的统计模型完全正确的识别了这9张照片,但当识别不同时期的照片时,只获得了57%的识别率,洪子泉将其归因于训练样本的不足。
因为对于任意图像矩阵A,它的奇异值分解是唯一的,所以当所有的奇异值按从大到小排列时,该图像的奇异值特征也是唯一的,于是奇异值特征可以作为描述灰度矩阵的一种数值特征。该特征具有如下性质[1]:稳定性、位移不变性、奇异值特征与对应图像亮度成比例变化、旋转不变性、转置不变性。
2 基于广义投影变换的奇异值特征提取
本节将基于奇异值分解和投影的方法提取图像一种新的代数特征。
首先取定一幅标准脸像,它的像素亮度所代表的矩阵为 A∈对其进行奇异值分解: , ,不失一般性设 m≤n,矩阵 A 也可以如下表示: 。将样本 B 投影至 A 确定的 得投影系数 ,这样将这些系数排列成一列向量 ,δ 称为 B 关于 A 的投影特征向量。
定理2:设 ,是矩阵 C 奇异值分解后的正交矩阵,若
则有:
证明:
=
定理2说明当图像有扰动时,本文提出的样本A,B 向标准脸像 C 奇异值分解后的正交矩阵投影得到的投影特征的变化小于图像扰动的Frobenius范数,所以此特征具有较好的稳定性。
通过上面叙述可知,图像矩阵 B 向 A 所确定的空间上投影可表示为:
= (式1.2)
矩阵 B 关于 A 的投影特征向量 ,实质上就是矩阵 的对角线元素。
3 基于奇异值特征的人脸识别
设人脸识别任务中训练样本集为,i 表示类别,j 表示每一个人所包含的人脸图片个数,不失一般性设m≤n 。
第一步:定义所有训练样本的平均脸 ,
对其进行奇异值分解: ,得到正交矩阵UM 和VM 。
第二步:将每个样本投影到正交矩阵UM,VM 上可得:
=
第三步:不失一般性假设 m≤n,所以提取 Sij的对角线元素排列成一列向量 δij:, δij作为测试样本的特征就是本文提出的基于投影变换的奇异值特征。
第四步:将测试样本 投影至平均脸 M 奇异值分解后得到的正交矩阵,得到相应的投影特征:
第五步:根据训练样本与测试样本的特征采用相应的分类器进行分类识别。
4 实验结果及分析
本文实验采用标准的ORL人脸库、Yale人脸库进行实验。在 ORL 人脸库中,有 400 幅分辨率为 92*112,具有不同表情、不同姿势、稍许倾斜(不超过20度)、稍许遮掩(眼镜)以及不同光照的人脸,具体为 40 个人,每人有10幅不同的人脸图片。Yale 库中包含165张分别代表不同表情、遮掩和光照条件下的正面像,对应为15个人,每人11幅,其分辨率为320*243。
本实验对 ORL人脸库和Yale人脸库,首先均任选其中4幅图像进行训练,6幅图像作为测试样本集。因此,在ORL人脸库上共有160幅训练样本,240 幅测试样本;在Yale 库上有60幅训练样本及90 幅测试样本。实验反复进行30次,最终的识别率为30次结果的均值。
特征提取以后本实验采用最小距离和最近邻分类器对提取的特征进行分类。最近邻分类器(NNC,Nearest Neighbour Classifier)的分类规则就是将不同类的所有样本都作为代表点,通过与这些代表点的比较来确定待识别样本的所属类别,也就是将测试样本分到空间距离最小的训练样本所属的类别,在本实验中:若 ,δqp 是与δtest 最近的第 q类中的第 p个样本,所以将 δtest分为第 q类。
最小中值距离分类器(NCC,Nearest Centroid Classifier)的分类规则是对属于同一类的训练样本投影后的特征向量进行求平均,即 ,然后计算 δtest与每一类投影特征向量的平均值之间的距离: , 为与测试样本 wq最近的类别均值向量,所以将δtest 分为第 q类。
本文的实验根据洪子泉[1]提出的奇异值特征与本文提出的投影变换的特征向量进行比较,发现本文提出的特征提取方法要好于文献[1]提出的方法。具体的实验识别率见表2.1和表2.2所示。括号中表示特征提取后向量的维数。
表2.1 ORL人脸库上的识别率
奇异值特征(92)
本文提出的投影特征(92)
NCC
21.33%
79.17%
NNC
57.5%
86.51%
表2.2 Yale人脸库上的识别率
奇异值特征(176)
本文提出的投影特征(176)
NCC
31.42%
77.78%
NNC
60.87%
85.22%
通过实验发现,采用本文提出的投影特征向量的方法所获得的识别率要远远优于传统的基于奇异值特征的方法,其原因可归结为:图像的奇异值特征是人脸图像在不同子空间上的表征,仅仅采用奇异值特征进行识别的方法则完全损失了包含在两个正交矩阵中的更为重要的有用信息;而本文提出的投影特征向量结合了奇异值分解后两个正交矩阵的信息,因此,与传统的奇异值特征相比,它包含了更多的识别信息,因此可以获得更好的识别效果。
5 小结
图像的奇异值特征作为一种代数特征,具有许多理想的性质,已经被广泛的用于人脸识别研究当中。奇异值特征所包含的信息不足以进行有效的人脸识别,更多的有效的信息包含在分解后的两个正交矩阵中。本章针对这个问题提出了一种基于投影变换的特征提取方法,通过实验结果表明这种特征提取方法的有效性。
参考文献
1 Hong Z Q. Algebraic feature extraction of image recognition. Pattern recognition, 1991,24(3): 211-219
2 洪子泉, 杨静宇. 基于奇异值特征和统计模型的人脸识别算法. 计算机研究与发展,1994, 31(3): 60-65
3 程云鹏.矩阵论.第2版.西安:西北工业大学出版社,2003
4 王蕴红, 谭铁牛, 朱勇. 基于奇异值分解和数据融合的脸像鉴别. 计算机学报, 2000,23(6): 649-653
5 Tian Y, Tan T N, Wang Y H, Fang Y C. Do singular values contain adequate information for recognition? Pattern Recognition, 2003, 36(3): 649-655