一方面,高光谱分辨率的成像光谱遥感技术是对多光谱遥感技术的继承、发展和创新,因此,绝大部分多光谱遥感数据处理分析方法,仍然可用于高光谱数据;另一方面,成像光谱技术具有与多光谱技术不一样的技术特点,即高光谱分辨率、超多波段(波段<1000,通常为100~200个左右)和甚高光谱(Ultra Spectral)分辨率(波段>1000,主要用于探测大气化学成分)的海量数据。因此,常规多光谱数据处理方法不适合于成像光谱数据的定量分析,于是成像光谱数据处理和分析技术应运而生。在成像光谱数据处理和分析方法中,关键性的技术问题是地物光谱重建,光谱特征的量化及提取,混合像元的分解和定量分析及模型识别。
光谱重建技术
按照不同的模型及算法,从成像光谱数据中把地物的光谱特性反演出来的过程就是地物光谱重建技术。根据不同的工作情况及条件,采取不同反演模型来重建地物光谱,是实现成像光谱数据遥感定量化分析的第一步。若对其不进行反演,则没有一个统一物理量进行对比。目前,光谱反演模型大体可分为三大类型:基于大气传输理论的大气传输模型,基于统计分析的统计模型以及基于地面地物同步观测的经验回归模型。
基于大气传输理论的模型
该模型实质上就是用理论模型消除大气中气体分子、水蒸气、气溶胶及尘埃等分子颗粒对地反射辐射能量吸收与散射以及大气程辐射效应,并将其还原成地物的反射辐射光谱。这是一种比较复杂的同时必须进行地物光谱及大气参量测量的绝对反射率生成方法,也就是对成像光谱数据进行绝对辐射标定的再反演。在这一反演过程中,关键是建立大气传输的模型。自1960年,Chndrasekhar提出了辐射传输理论以来,相继发展了许多方法,如Ordinate方法和Variational方法等来解决辐射传输问题。目前,常见的大气传输模型有5 S(the Simulation of the Satellite Signal in the Solar Spectrum)、6S(the Second Simulation of the Satellite Signal in the Solar Spectrum)、LOWTRAN 7及MODTRAN(Teillet,.,1989;Vermote,E.,Tanṙen,D.,Deuże, al.,1994,1996;Bo⁃Cai Gao, and ,1997;, and ,2001)。其中,6S模型是由法国Tanré等人研究开发的,是目前世界上发展比较完善的大气辐射校正模型算法之一。该算法既能合理地处理大气散射、吸收,又能产生连续光谱,避免在光谱反演中较大的定量误差。它还充分利用了分析表达式和预选大气模式,使计算时间大大缩短。许多遥感专家使用此模式进行地物光谱反演后认为,该模型较其他模型计算精度高。不足之处是必须开展试验区典型地物光谱反射率观测以及大气环境参量实测,如:大气光学厚度、温度、气压、水蒸气含量、大气分布状况等。相对来说,尽管LOWT⁃RAN 7和MODTRAN模型计算精度低一些,但它不需要地面实测典型地物的反射率。这些模型一般用于对传感器选定标定场,开展数据绝对辐射标定。
基于统计分析的模型
该模型的建立是在分析不同地物光谱遥感信息在不同光谱波段的传输特点基础上,利用计算机对典型地物的光谱特性进行统计分析后,得到的地物光谱特性反演模型。对成像光谱数据进行地物光谱反演常用模型有平滑域反射率模型 FFR(Flat Field Reflectance)(Goetz and Srivastava,1985;Conel,1985;Crowley at al.,1988;Rast et al.,1991),内在平均相对反射率模型IARR(Internal Average Relative Reflectance)(Kruse et al.,1985;Kruse,1988;Mackin and Munday,1988;Zamoudio and Atkinson 1990),对数剩余模型LRC(Logarithm Residual Correction)(Green,.,1985;Gower,.,1992)。在这3种模型中,FFR模型是在图像上选取光谱和地貌特征都均匀平滑(平滑性是指地物无光谱吸收谱带,光谱曲线平直)的地物平均值,来消除大气辐射衰减和仪器的零响应;White模型是根据整幅图像的平均光谱曲线平均值对图像归一化处理,然后计算每个像元光谱曲线与平均光谱曲线的比值,也就是地物光谱特性;LRC模型是经Lyon和Lanze修正后,对太阳辐射衰减、大气效应及地形影响都有所消除。Green和Graige提出的对数剩余纠正公式如下:
lg(Rij)=lg(DNij)-lg(aveDNi)+lg(DNi)+lg(DNg)(2-3-1)
这里Rij是第i波段、第j个像元的剩余值;DNij是第i波段、第j个像元的亮度值;DNi是第i波段所有像元数据的平均值;DNj是第j像元在所有波段上数据的均值;DNg是所有波段及所有像元的均值。该方法完全基于图像本身特征,不需要野外地物光谱测量。在前两种模型中,FFR模型优于IARR模型,它克服了IARR模型因受像福强吸收特征的影响而出现的假反射峰的弱点,而且计算量较小。
经验线性回归模型
利用该方法重建地物光谱技术实质就是通过开展典型地物的同步反射率观测,根据成像光谱数据DN值与地面实测地物反射率值,经最小二乘法求出回归方程Rij=Aj·DNij+Bj(这里Aj,Bj是传感器第j波段的线性回归系数),然后,根据此方程反演地物的反射光谱。这种模型的数学和物理意义明确,方法简便,运算量少,应用广泛(Roberts et al.,1985;Conel et al.,1988;Elvidge,1988;Green et al.,1988;Kruse et al.,1990;Zamoudio and Atkinson 1990)。例如:美国JPL的Abrams利用该模型在美国Nevada州的Cuprite矿区进行矿物学填图;美国科罗拉多大学的Zamudio等人,利用该模型在美国 Nevada 州东部进行矿物识别和岩相分析;日本Pasco公司的Mochizuki,利用该模型在美国Navada州进行蚀变矿物的反射光谱研究等。该模型的不足之处是要开展野外地物光谱观测,成本比较高,回归精度的高低依赖于对野外概实测的精度。
除上述这些典型光谱重建模型之外,还有 UA RT Code,JPL Code,连续内插波段比算法(CIBR),背景法等模型(De Jong,1998)。
岩矿光谱特征的量化、提取,定量分析及识别模型
成像光谱数据经过光谱重建模型处理后,获得了地物的光谱特征谱线。不同地物光谱具有不同的诊断特征谱带,如吸收谱带,特征谱线的微积分变化,波形变化等等。如何有效地开展地物特征定量分析和识别地物,首先要弄清楚如何去量化及提取地物的光谱特征。因此,开展基于地物特征谱的量化提取是十分必要的。
地物光谱特征度量、提取与匹配识别模型
(1)就地物光谱特征(这里指地物反射辐射光谱)而言,不外乎两大类型:吸收谱带(或反射谷)和光谱曲线的斜率变化(含波形变化)。针对这两类光谱特征的形态、结构,分别采取不同的度量方式。目前,对吸收谱带的分析度量方法是外壳系数法,它通过把光谱曲线归一化后去测量吸收谱带的波长位置(position)、吸收深度(depth)、吸收宽度(FWHM)和对称性(sym⁃metry)(Lyon et al.,1985;,,1993)。这种外壳系数法可以由外壳凸形曲线与光谱之比来表示,也可以由外壳值去减相应波长上的光谱反射率值来求得。由于吸收峰的非对称性,采用RBD方法难以准确描述其特征。连续插值小组段算法(CIBR,Continuun interpolated band algorithm)(De Jong,1998)和光谱吸收指数图像(SAI,spectral absorption index image)(王晋年等,1996)与相对吸收深度图方法类似,但引入了对称度因子,使其对吸收特征的描述更为合理。除了这些测量参数外,对植被光谱有多种度量参量,如植被、绿度指数等等。对于光谱曲线斜率变化的特征,表征和提取的方法有基于地物光谱的总体波形特征度量,如傅里叶变换的波形分析方法是利用有限级次的谐波振幅和初位相度量地物波谱特征;基于切比雪夫多项函数的波形分析是利用多项式函数对地物光谱曲线进行拟合,提取有限项的系数来表示或组合特征,或用其比值来表示地物光谱波形特征的参量;基于波形相似性(总体或分段)分析的光谱角度量;还有光谱曲线特征的微分度量、积分度量及二值度量等等。当然,对吸收谱带及斜率特征度量还可以用统计特征量去表征度量,如均值、方差、协方差矩阵、特征值、特征向量、特征因子及组内离差等。
(2)光谱匹配识别模型不同于多光谱的模式识别,它是根据光谱特征度量参数来进行匹配识别的,是成像光谱数据处理分析的特色之一。这种特色模型在处理过程中往往是采用可视化的交互式的图像与光谱、光谱与标准光谱形式进行的。目前,光谱匹配识别模型有:编码匹配识别法(均值编码匹配法,坡向编码匹配法,比值编码匹配法L吸收峰编码匹配法、波形匹配法和光谱角匹配法等等。在这些匹配识别模型中,编码匹配基本上都是按二值(0和1)进行编码、匹配与识别的;吸收特征编码匹配是根据外壳系数法归一化后,对每个特征的吸收深度与波长位置进行编码;波形匹配包括相似度、傅里叶变换参量,切比雪夫等方法。近几年发展起来的小波变换分析在成像光谱数据分析处理中应用相当多,尤其是对原始信号按不同小波尺度,分解成不同的小波进行波形分析,突出低频弱信息,有利于信息增强,比如用小波变换进行图形图像插值、融合及混合像元分解等。
成像光谱数据的定量分析及识别模型
定量化分析及识别模型化是当今遥感技术的发展方向之一,应用于成像光谱数据处理。定量化分析与识别模型,除了不断完善和改进已有基于统计分析的定量化及识别模型(如:改进的主成分分析、最佳波段组合、改模型最大似然法、基于决策边界特征矩阵的变换和正交子空间投影),其他学科的新思想、新方法也在不断地引人遥感数据分析和理解之中,如人工智能的专家系统,模糊逻辑映射,证据推理、神经网络、分形和分维等。
人工智能专家系统技术是目前比较流行的信息处理技术,尤其对比较复杂问题的解决有独到之处,Gotting和Lyon在1986年就已建立的光谱信息专家识别系统用于分析实验室和野外光谱,它是结合已有的地物光谱特征知识,由专家确定判别规则决策树(Decision Tree)以达到识别地物或地物类别目的。决策树这一基于知识的判别准则层次是建立专家系统成败的关键。通过这个系统进行编码匹配,他们成功地从大量的实验室光谱中识别出11种矿物。1993年,美国地球空间研究中心(CSES)和美国环境科学研究所的和研制了基于知识的成像光谱地质制图专家系统。选定各种特征在识别过程中的作用并赋予相应的权值,或根据专家对判别知识和经验建立判别准则进行识别。
目前,神经网络模型在遥感地物分析和识别方面备受青睐,有着广泛的应用(Golen Giser,1996;Giles, al.,1995;郭小方,1998;王润生等,2000)。由于神经网络分类规则对训练样本的数量及分布特征没有特定要求,因而可以在特征空间形成非线性判别边界,并且还有一定的抗噪声、抗干扰和自适应能力,适用于大数据量的分类研究,最为常用的分类准则是后向传播(BP)网络模型。
目前,从成像光谱遥感数据分析与识别的各种新理论、新方法的引入来看,大多数模型的研究和应用还是一种尝试,在如何将模型与成像光谱数据相结合的研究方面,分析不够深入。
混合像元分解模型
由于空间分辨率不高的原因,在图像像元内会出现不同成分(end member)的地物,即混合像元。不同的地物具有不同光谱特征,因此需要通过混合光谱分解技术来提高识别精度。混合像元问题是遥感技术的研究难点和热点。由于成像光谱技术的光谱分辨率已从微米(μm)提高到纳米级(nm),因此,其混合像元分析、分解及其模型研究就显得更为重要。
目前,开展高光谱遥感混合像元研究的方法技术,首先从实验着手,进行地物混合光谱的测试、分析、数字模拟、分解模型开发研究,然后将其外推到遥感图像上,进行典型地物混合像元分析,主要包括空-地同步观测获取典型地物(或可通过人工布标)数据,经模型分析后,对混合像元的地物进行分解,或混合光谱模拟合成。在实验室里,通过对不同矿物光谱混合含量测试发现,不透明矿物或暗色矿物,其光谱按比例混合到其他矿物中,混合的反射率急剧下降,而不是逐渐下降,说明其混合光谱与其混合的端员矿物光谱是非线性关系(磁铁矿和橄榄石)。当两种矿物的色调相近时,实验测试的混合光谱与线性模型合成的混合光谱都呈线性逐渐变化,说明混合光谱可以按线性模型分解端员矿物光谱,如橄榄石和紫苏辉石,且吸收谱带的波长位置也是逐渐从一个波长位置逐渐过渡到另一波长位置。不仅如此,还发现在可见光、近红外这一波长上,低成分端员混合时呈线性趋势,当成分增加时,线性关系剧烈变成非线性关系。在这三种情况中,第一种非线性关系是由于组合混合光谱的端员成分之间互相作用、互相影响后光谱被光谱仪检测到;第二种线性关系是由于各端员成分之间无互相影响作用,各自独立地反射电磁波能量贡献于混合光谱;第三种情况是两种关系都存在,二者之间存在临界条件(边界条件)。目前,有关此方面的研究极少。根据这些分析,混合像元分解模型大体分为线性模型和非线性模型。在遥感混合像元中,绝大多数反射率相似的地物,可以用线性模型来分解端员成分,如:土壤与植被、不同含水量的耕地、岩石露头与草地、荒地等等。在一幅图像中,事先知道有N种端员(地物种类),并且也知道各种端员的光谱反射率,那么就可以用线性模型:
成像光谱岩矿识别方法技术研究和影响因素分析
这里DNc是波段C上混合像元的DN值或反射率;Fi是第i种端员在混合像元中所占比例(或权系数);DNi,c是C波段上第i种端员的DN值(或反射率);Ec是C波段上拟合误差。对每个像元都按照最小二乘法解方程,进行分解。在图像中,端员的DN值(或反射率值)要么可以从训练区取值,要么在地面实测。端员成分的确定过程实质上是一个迭代过程,迭代结果使M个波段上总误差ε最小(且N≤M)。
成像光谱岩矿识别方法技术研究和影响因素分析
求得版中各种端员成分之后,就可以定量或半定量地对端员丰度制作丰度等专题图件。
用非线性模型开展混合像元分解不多见,但已有这方面的研究,如模糊分割模型(Jin Ⅱkim,1996),概率鹏模型,几何光学模型(Charles Ichoku,1996)及基于神经网络模型的混合像元分解(王喜鹏,张养贞等,1998)等等。
目前开发的模型有:
——光谱吸收指数模型SAI(王晋年,童庆禧等,1996):
SAI=∑fiSAIi,∑fi=1,fi>0 (2-3-4)
——高斯模型法MGM:该模型是基于矿物和岩石的反射、吸收光谱性质模拟反射光谱的各种模拟方法。它是一种确定性的而不是统计性的方法。高斯改进模型MGM 是近几年在分析反射光谱的基础上发展起来的分析技术(Cloutis,1989,Veverka, al.,2000)。
m(x)=S*exp(-(xn-μn)2/2σ2), (2-3-5)
通常取n=-1。
光谱识别与分类技术(Spectral Classification):主要是利用地物高光谱特征的量化参数,结合其在图像空间上分布进行提取有利的信息,达到分类的目的。主要的分类方法有:
——最大似然法MLC:
g(x)=-ln|∑i|+(x-mi)t∑i-1(x-mi),(2-3-6)
——人工神经网络技术ANN:一般采用前馈网络模型,即第一隐层的节点输入等于输入层诸节点输出的加权和。迭代的次数以系统的平均误差为最小时为准。
成像光谱岩矿识别方法技术研究和影响因素分析
——光谱角制图法SAM(Spectral Angle Mapper):该方法是通过计算测试样本光谱矢量(像元光谱)与参考光谱矢量(训练的端员样品光谱,或标准光谱库的光谱),在n维空间(n波段)上的角度来确定它们两者的相似度。一般两矢量之间的角度越小,两光谱向量越相似,进而可识别两种地物为同类,否则视为异类。数学模型是:
成像光谱岩矿识别方法技术研究和影响因素分析
这里i=1,2,3,……,n,n为波段数。
——光谱维特征提取法(Spectral Dimension Feature Extraction):在高光谱遥感分类中,使用该方法对多波段、高相关、数据冗余度高的数据进行降维处理。相关的有统计方法,如主成分、典型变量及改进的PCA法等。
——光学模型(Optical Modeling):除了前述的数据分析及模型外,植被因其特有反射性质,还有独特分析模型(光学模型)。该模型主要利用高光谱遥感数据预测或估计植被的多种生物物理、化学参量,如叶面指数LAI、总生物量、覆盖度等;叶绿素、水分、N、P、K含量等。该模型也属于经验性的统计模型方法。一般性通用模型为:
S=f(λ;θs,Φs;θv,Φv;С), (2-3-9)
这里S为预测的生物物理、化学参数;λ是波长;θs,Φs,θv,Φv是入射光和传感器探测几何位置参数,C是描述植被冠层为特性参数。依靠法的模型有叶子光学性质光谱模型PROSPECT,叶子的任意斜散射模型SAIL,即生化参量反演的LIBERTY模型等。
高光谱在植被应用中除了生物、化学参量的反演分析外,还注重利用植被光谱特性谱线的蓝边、反射峰、黄边、红光吸收谷、红边、近红外反射高原区等变化及数据的归一化、对数、微分等变换,来监测植被的长势及病虫害,进行森林识别、分类、制图(Clark,.,.,1984)。
光谱数据应用处理分析软件
通过开展岩矿高光谱特性测试分析和成像光谱方法技术及应用分析研究,已发展并开发了如下数据处与分析软件:
光谱数据库及分析软件(400~2500φ)
国外:美国地质调查所USGS和JPL的标准矿物光谱库(含机载光谱)及光谱分析管理软件SPAM,IRIS,日本地调所的岩石矿物光谱库等(;;Kruse F A et )。
国内:中国科学院安徽光学研究所、中国科学院遥感应用研究所、原地质矿产部航空物探遥感中心等科研单位都已建自己的光谱库(王润生等,2000)。
图像处理分析软件
目前国内外常用的光谱图像处理分析软件有:Erdas、PCI、ENVI等。其中PCI和ENVI都有高光谱分析处理功能(ENVI User’s Guide.,2000)。此外,还有像Tetricorder(Clark,.,,,2003)。国内通过高光谱遥感方法技术及示范应用研究,中国科学院遥感应用研究所、国土资源部航空物探遥感中心相继建立了成像光谱数据分析处理系统,如:HIPAS,ISDPS等。