基于光谱重排的光谱特征提取方法
首先,针对光谱吸收特征受噪声影响较大的问题,对数据进行最小噪声分量正变换,消除噪声后,再将最小噪声分量特征空间的数据变换回原数据空间,即最小噪声分量反变换;然后针对单个吸收不稳定、光照等对光谱幅值影响较大等问题,提出在连续去除的基础上,利用所有吸收特征并将光谱吸收特征按吸收深度由强至弱重排,从而实现稳定、可靠的光谱特征提取。
(1)最小噪声分量变换
在实际应用中,地物光谱吸收特征对噪声敏感,因此,在进行特征提取之前,研究中引入了最小噪声分量变换(Minimum Noise Fraction,MNF),去除噪声对特征提取影响的同时去除数据相关性。
MNF变换是Green等人在主成分分析理论的基础上改进得到的。通常被用来去除数据中的噪声成分,同时确定高光谱数据的本征维数,从而减少后续处理的运算量。
该方法以噪声协方差的估计矩阵为基础,调整噪声的取值并去除其波段间的相关性。在结果数据中噪声的方差为1,并且在波段间无相关性。假设高光谱数据X=[x1,x2,…,xm]T可以表示为
X = Z + N ()
式中:矩阵Z,N分别是理想信号和噪声矩阵,且彼此不相关;第i 波段的噪声分量定义为NFi = ,信噪比定义为SNRi= 。
∑X,∑Z和∑N分别为可观测信号、理想信号及噪声的协方差矩阵,并且有
∑X =∑XZ +∑N ()
假设F为∑N的白化矩阵,∑N的特征值矩阵为 =diag(λN1,λN2,…,λNp),其中p为波段数,则有
高光谱遥感技术原理及矿产与能源勘查应用
高光谱遥感技术原理及矿产与能源勘查应用
式中:I为单位矩阵,矩阵 由∑N的特征向量组成,且满足 。
假设∑w=F T∑X F为噪声白化之后的观测数据的协方差矩阵,∑w矩阵特征值组成的对角矩阵为 =d i a g(λw1 ,λw2 ,…,λwp),对矩阵∑w作主成分变换,可以得到由矩阵∑w特征向量组成的 ,使得
高光谱遥感技术原理及矿产与能源勘查应用
于是得到最小噪声分量变换矩阵:
高光谱遥感技术原理及矿产与能源勘查应用
由式()得观测信号最小噪声分量变换后的矩阵为
T = MTX ()
经过式()变换之后,可观测信号各个波段间彼此不相关,且各个波段按信噪比由大到小排列 。即按变换后数据T的特征值排列,较大的特征值对应信号为主的图像,接近于1的特征值代表噪声占主导的图像。在变换之后,通常可以直接利用T进行数据后续处理,但是Cheriyadat和Bruce等人证明,主成分变换完全依赖于数据整体的协方差,当类内方差占据类间方差的主体时,主成分变换倾向于将数据向不利于分类的方向投影。可见,MNF变换与主成分变换具有相同的特点,因此,研究中提出的算法在利用MNF之后,利用最小噪声分量反变换将数据转换回光谱空间,这样可以最大限度地保证数据的可分性。
(2)光谱重排
不同地物的光谱信息是不相同的,因此,高光谱遥感提供的地物精细的光谱信息可以直接作为特征提取与目标识别的依据,比如利用红边、绿峰、NDVI等特征可以提取植被。但当不同地物之间的光谱在形状、幅值、变化趋势等指标大致相同的时候(即光谱特征相似),提取区分不同地物显著特征是非常困难的,即地物之间的不相关性均匀地分布在各个波段;此外,由于单个光谱吸收特征容易受到光照条件、大气等影响使得提取的光谱特征参量不稳定。因此,针对以上问题,研究中提出了基于光谱重排的特征提取方法,根据光谱吸收深度的由强到弱排列,剩余的没有吸收特征波段则按波长由小到大排列。
光谱重排的实现过程如下:
1)通过不同阶数的微分值确定的光谱弯曲点、最大最小光谱反射率及其波长位置,计算连续统去除后目标光谱的吸收位置λM 及其反射率值ρM、吸收深度H、吸收左右肩(ρL,ρR)及其反射值(λL,λR),并且吸收深度H的计算公式如下:
H = d × ρL +(1-d)× ρR-ρM ()
d =(λL-λM)/(λR-λL) ()
2)将目标光谱按照吸收深度H由强至弱进行排列,若无吸收特征,则按波长由小到大进行排列;
3)以目标光谱为基谱,将图像数据光谱按照目标光谱重排后的波长进行排序。
该方法有效地利用了高光谱遥感数据提供的地物所有吸收特征,增加了特征提取的稳定性和可靠性;并且通过大量的实验发现,任何两种不同地物的光谱通过光谱重排之后,区分不同地物的显著特征更加明显,增加了类别间的可分性。
(3)算法实现
基于光谱重排的抗噪声光谱特征提取方法的实现流程如图所示。该方法中为了消除噪声对光谱吸收特征参数提取的影响,引入了MNF变换;为了有效抑制由于光照条件、传感器等因素产生的光谱幅值变化对光谱特征提取的影响,引入了连续统去除操作;为了克服单一特征不稳定、不同地物光谱特征相似等问题,提出了光谱重排的方法。
(4)实验分析
为了验证上述研究中方法的有效性和可行性,采用AVIRIS航空高光谱数据进行实验分析,并利用光谱之间的光谱角进行可分性的定量化分析。
实验数据为1995年7月在美国内华达州Cuprite矿区AVIRIS航空高光谱数据,并且使用ATREM方法校正得到了地表反射率,波段范围为1990~2480nm,空间分辨率20m,光谱分辨率10nm,数据大小为255 × 350 × 50。
图 光谱特征提取方法实现流程
该研究区域的矿物分布图如图(a)所示,从数据中提取高岭石光谱曲线如图(b)所示,光谱重排后的光谱如图(c)所示。高岭石、明矾石、布丁石及热液硅石特征提取前的光谱比较如图(a)所示,以高岭石光谱为基谱,光谱重排后四种矿物的光谱特征如图(b)(图中的光谱曲线纵坐标做了平移处理)所示。利用光谱角的方法进行四种矿物光谱重排前后可分性的比较,结果如表和表所示。
图 高岭石矿物光谱比较
图 四种矿物光谱比较
表 原始光谱数据四种矿物的可分性
表 重排后光谱数据四种矿物的可分性
由图和图可以看出,经光谱重排后,高岭石矿物光谱吸收特征按吸收深度的强弱进行了重新排列,较好的显现了高光谱所有吸收特征及主次吸收特征的变化;并且明矾石与高岭石矿物在2200 nm的光谱特征由于吸收宽度等不同而能将二者较好的区分。由图与表可以看出,经过光谱重排后,高岭石与其他三种矿物的可分性均存在不同程度的增大,特别是,高岭石与明矾石的可分性从增加为;为后续矿物识别与分类等处理奠定了良好的基础。
图 SAM方法矿物识别结果
为了进一步验证该方法的性能,进行了利用该方法以及基于SAM方法的矿物识别结果比对分析。利用原始光谱进行光谱角匹配识别的结果如图所示。利用基于光谱重排的抗噪声特征提取方法得到的数据进行矿物识别,结果如图 所示。可以看出,两种方法均能实现四种主要蚀变矿物的识别,但是,采用原始光谱进行识别的结果中存在着一定程度的矿物混淆,并且布丁石的识别结果混淆尤其明显;而在研究方法中进行特征提取基础上得到的矿物识别结果矿物混淆明显降低,取得了较好的识别结果,证明了上述研究中提出的方法的优越性能。
图 基于光谱重排特征提取方法矿物识别结果
吸收波长加权匹配方法
光谱曲线往往包含了许多由噪声引入的无效特征,利用同类地物光谱特征求交,实现了有效吸收波长、吸收深度的提取;常用的SAFP匹配方法中,只有参考光谱和测试光谱的特征在相同的波长位置时,两条光谱才被判为相同,匹配准则比较苛刻,导致由于噪声等因素影响光谱特征而无法匹配,吸收波长加权匹配法利用偏移加权矩阵实现了吸收波长的容偏匹配,大大增加了匹配的准确性,降低了外界因素对吸收参量特征的影响。
对同类地物光谱曲线特征求交,得出识别地物的有效特征;地物光谱的诊断吸收特征总是出现在特定的波段上,在某些情况下会有局部的偏移;对吸收特征的中心波长进行匹配,并容许一定程度的波段偏移,容许程度用偏移加权矩阵来度量,能够对地物光谱实现精确的识别。考虑到实际应用噪声及系统误差引入的干扰,用吸收深度对单个中心波长进行加权,吸收深度小的吸收特征对整体相似度的贡献小,吸收深度大的吸收特征对整体相似度的贡献大,这样一定程度上抑制了无法去除的非有效特征的影响。
(1)吸收波长加权匹配的实现
有效吸收特征的精确提取和容偏匹配实现流程如图所示,具体包含以下几个步骤:
1)对参考光谱连续统去除。利用导数法确定各吸收特征的中心位置和左右肩对应的波长后,利用下列公式提取吸收特征中心波长和吸收深度:
高光谱遥感技术原理及矿产与能源勘查应用
式中: 和 分别为吸收左肩端、右肩端、吸收谷点的反射率和波长位置;d= 为吸收的对称性参数。
没有标准参考光谱时,参考光谱通过训练样本得到。通过上述方法提取各条参考光谱的吸收中心波长和吸收深度后,对所有训练样本的吸收特征参数求交,方法如下:
光谱A和B的所有吸收特征为feature_a,feature_b,A的第i个波段上存在特征,对feature_b计算:
judge = Weight·feature_b([i-BandOffset:i + BandOffset]) ()
如果,judge>0 ,则光谱A的第i个波段上的特征为有效特征。
得到参考光谱共有的有效特征,此处需要记录的是有效特征的位置和吸收深度的大小,保存在向量EffFeatureIndex和Depth中。
2)提取未知光谱所有吸收位置和对应的吸收深度特征,记录在FeaturePos和FeatureDepth;
图 中心波长加权匹配流程图
未知光谱特征与参考光谱有效特征按位匹配,匹配方法包含两个参数,容许波段偏移数BandOffset和偏移加权矩阵Weight。
3)找到参考光谱第i个特征位置,生成特征检验区间:
TestIndex =(i-BandOffset):(i + BandOffset) ()
计算特征检验值:
TestValue = Weight·FeatureDepth(TestIndex) ()
TestValue不为0 ,则说明未知光谱对应位置存在有效特征,反之则不存在,未知光谱中的识别特征所在波段记录在向量EffIndex中。
4)重复3)的过程,直到对未知光谱的所有有效特征进行了检测,未知光谱中识别特征存在的波段记录在向量EffIndex中。
5)对吸收位置用吸收深度加权匹配,匹配度的计算公式如下:
高光谱遥感技术原理及矿产与能源勘查应用
6)根据匹配度degree的值判断未知光谱与参考光谱的近似程度,阈值Thresh手动选择,根据经验,在用吸收深度加权的匹配方法中,Thresh=就能获得较高的识别率。
用吸收深度加权对吸收特征中心波长进行容偏匹配的关键在于:有效吸收特征的准确提取和偏移加权矩阵Weight或容许波段偏移数目BandOffset的选择,反射率曲线所有吸收特征的精确提取是前提,偏移加权矩阵的确定需要根据对像光谱的采样间隔来确定,Weight的分量的个数为2 × BandOffset+1;并且有效特征提取和特征识别过程使用的偏移加权矩阵Weight可以不同,光谱采样间隔较大时,可以选择Weight的各个分量服从高斯分布。
(2)基于USGS光谱库数据的实验与结果分析
图(a)为USGS矿物光谱库中六条绿泥石连续统去除后反射率曲线;波段偏移参数BandOffset=1,对应的容偏矩阵Weight=[1,1,1];即两条光谱的特征相差一个波段以下认为该特征为有效特征;绿泥石的有效特征见图(b),用方框标记出了吸收谷的波长位置;图(c)给出了利用吸收波长加权匹配方法得到的绿泥石有效特征;图(d)给出了绿泥石和阳起石反射率光谱。
图 有效特征提取
匹配加权矩阵Weight=[1,1,1]表示容许两端偏移,Weight=[,1,]表示不容许偏移;两情况对应的相似度见表和表。对比表和表的相似度值可以看出,容许波段偏移后,绿泥石光谱间的相似度明显变大。利用图(c)的有效特征对图(d)所示的阳起石和绿泥石光谱进行Weight=[1,1,1]匹配,近似度见表,用绿泥石的有效光谱能有效的识别出绿泥石光谱与阳起石光谱的差异。
表 绿泥石光谱识别Weight=[1,1,1]
表 绿泥石光谱识别Weight=[,1,]
表 阳起石和绿泥石识别Weight=[1,1,1]
(3)基于AVIRIS数据的实验与结果分析
利用内华达州Cuprite矿区的AVIRIS数据进行基于吸收波长加权提取方法实现矿物匹配识别研究。利用的矿物端元光谱如图所示,识别结果如图所示。
从地质图(a)与结果图比较可以看出,该方法对具有明显光谱吸收特征的明矾石和高岭石矿物具有较高精度的识别效果,但是对于吸收特征较宽、较浅的白云母和布丁石的识别效果则较差。
图 算法中用到的端元光谱
图 基于吸收波长加权特征提取的矿物匹配识别结果