遥感图像目标检测论文

森林资源调查中SPOT5遥感图像处理方法探讨王照利、黄生、张敏中、马胜利（国家林业局西北林业规划设计院，遥感计算中心，西安710048）本文发表于＜陕西林业科技＞2005 No.1 P.27-29,55摘要：目前，多光谱、高空间分辨率的SPOT5卫星遥感数据被广泛应用到森林资源调查中。本文结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的处理和信息提取。探讨性地提出了适应于森林资源调查的SPOT5遥感数据处理方法。关键词：SPOT5 遥感数据，森林资源调查、数据处理DISCUSSION ON SPOT5 IMAGE DATA PROCESSING FOR FOREST INVENTORYWang Zhaoli, Huangsheng,Zhangminzhong,Ma Shengli(Northwest Institute for Forest Inventory, Planning &Design, Xi’an China 710048)Abstract: Now days, high spatial resolution and multispectral SPOT5 image data are widely applied in forest inventory in China. Based on the characteristics of SPOT5 image and requirements of forest inventory, this paper discusses the processing procedures of ordering image data, ortho-rectification, image bands composition and image data fusion. The complete steps of image processing for forest inventory are given.Key words: SPOT5 image data，forest inventory, data processing前言卫星遥感影像具有空间宏观性、视角广、多分辨率（光谱和空间）、多时相、周期性、信息量丰富等特点，所以卫星遥感影像既可以提供森林资源的宏观空间分布信息又能提供局部的详细信息以及随时间、空间变化的信息等[1]。目前在林业领域卫星遥感数据被广泛的应用于不同尺度层次的森林资源调查、资源监测、病虫害、火灾监测等方面。2002年5月法国SPOT地球观测卫星系列之5号卫星（即SPOT5星）发射。SPOT5遥感数据的多光谱波段空间分辨率为10米（短波红外空间分辨率为20米），但全色波段空间分辨率达到2.5米。SPOT5遥感数据的高空间分辨率和多光谱分辨率为森林资源调查提供了丰富的、可靠的、高精度的基础数据源。从性价比分析，在其他高分辨率遥感数据目前比较昂贵的状况下，SPOT5遥感数据比较适宜应用于大面积的森林资源调查，可大幅度的森林调查的减少外业工作量、提高工作效率。在我国SPOT5卫星数据已被大量地应用于森林资源调查工作中，尤其，是在森林资源“二类”调查中被作基本的森林资源信息源提取各类信息。针对于将多光谱分辨率和高空间分辨率的SPOT5遥感数据应用于森林资源调查的数据处理技术和方法鲜有报道。本文总结工作实践，结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的订购、正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的基本处理方法。1．SPOT5卫星遥感数据特点SPOT卫星系统采用线性阵列传感器和推扫式扫描技术，具有旋转式平面镜可以进行倾斜观察获得倾斜图像和立体像对。采用与太阳同步的近极地的椭圆形轨道，轨道高度约832Km，轨道倾角98.7o ，每天绕地球14圈多，重复覆盖周期26天[2]。由于有倾斜观测功能，使重复覆盖周期减少到2-3天。SPOT5卫星载有2台高分辨率几何成像仪（HRG）、1台高分辨率立体成像装置（HRS）和1台宽视域植被探测仪（VGT）。高分辨率几何成像仪的波段选择是总结了多年的研究成果，认为HRG的波段设置（见表1）足以取得辨别作物和植被类型的最佳效果。本文主要探讨HRG高空间分辨率数据的处理。2．SPOT5数据的处理方法和过程SPOT5数据处理工作流程：2.1 遥感数据的订购订购数据时，用户需向数据代理商提供购买区域的四个角的大地坐标或者数据的景号（PATH/ROW）。特别应该注意数据订购时间和用户拿到数据之间有时间差，间隔时间长短因用户的要求、天气、卫星重复覆盖周期而异。相对于其他卫星数据，比较有利的一面是SPOT5卫星装置有旋转式平面镜可以进行倾斜观察，用户可向代理商申请红色编程提前得到调查区域的遥感数据，但要支付编程费。对于遥感数据的时相、云量、入射角、阴影量、是否购买高空间分辨率的全色波段等用户根据自己具体的工作需要向代理商提出限制要求。根据我们对SPOT5遥感数据的使用，对于森林资源调查，北方9，10月份和11月初的遥感影像比较适宜。代理商向用户提供经过处理的不同级别的影像产品，在森林资源调查中建议购买SPOT1A级产品，用户可根据自己的工作需要进行处理，同时也可减少费用。2.2 基础数据准备大比例尺地形图和高精度DEM是进行SPOT5遥感数据高精度正射校正必需的基础地理数据。建议购买1：10000地形图和1：25000数字高程模型（DEM）。将1：1万地形图扫描，扫描分辨率设置为300DPI。将扫描好的地形图进行几何精纠正，纠正精度控制在0.3毫米内。从测绘部门购买的1：1万地形图为北京54坐标系3度分带高斯克吕格投影，而1：2.5万DEM为北京54坐标系6度分带投影。在数据准备时，将校正好的1：1万地形图通过换带转换转成和DEM一致的6度分带投影。对于没有1：1万地形图的地区，建议使用差分GPS接收机采集地面控制点。2.3几何正射校正正射校正过程应用了法国SPOT公司发行的GEOIMAGE软件。GEOIMAGE软件有针对SPOT5卫星数据开发的SPOT5物理模型。模型模块自动读取DEM信息。SPOT 物理模型可读取卫星在获取遥感数据的瞬间状态参数，这些参数存贮在数据的头文件中[3]。卫星状态参数包括：卫星成像瞬间的经纬度、高度、倾角等。卫星状态参数能够帮助提高几何校正的精度。以校正好的1：1万地形图为基准，在影像图上找出和地形图上地物相匹配的明显地物作为地面控制点。在进行正射校正时，应先进行全色波段数据校正，然后以校正好的全色波段数据为基准进行多光谱数据校正。以全色波段数据为基准校正多光谱波段就比较容易校正，且能提高两者的匹配精度。地面控制点应分布均匀，影像的边缘部分布要有控制点分布，同时在不同的高程范围最好都有控制点。地面控制点的数量因地形地貌的复杂程度而定，根据我们的经验，一景60KmX60Km的SPOT5数据，一般地势平缓的地区20个左右控制点即可达到满意的结果，在高山区25个左右控制点就可使正射校正精度满足要求。重采样方法采用双线性内插法。2.4 辐射校正用户购买的SPOT5的各级数据，数据提供商已经根据卫星的记录参数对遥感数据做了辐射校正，即消除了传感器自身引起的、大气辐射引起的辐射噪声。若果影像存在薄雾或地形高差较大引起的辐射误差情况，用户应进一步进行辐射校正处理。薄雾的简单消除原理是基于近红外波段不受大气辐射影响，清澈的水体或死阴影区的数值应为零。从各波段数据中减去近红外波段的水体或阴影的不为零值。地形起伏引起的辐射误差校正公式: f (x,y)=g(x,y)/cosa，g(x,y)为坡度为a的倾斜面上的地物影像；f (x,y)为校正后的影像。由于坡度因子参与校正所以需要DEM支持。2.5 波段组合根据SPOT5数据波谱特征（表1），各波段分别记录反映了植被的不同特征方面：B4（SWIR）短波红外反映植物和土壤的含水量，利于植被水分状况和长势分析；B3（NIR）近红外波段对植被类别、密度、生长力、病虫害等的变化敏感；B2（RED）红光波段对植被的覆盖度、植被的生长状况敏感；B1（VIS）可见光波段对植物的叶绿素和叶绿素浓度敏感。经过比较分析和实际应用发现SPOT5的B3、B4、B2波段组合对植被类型的识别要优于B3、B2和B1的组合。但由于B4波段的空间分辨率为20米，使B342组合对植被空间几何细节表达没有B321组合清晰，例如林缘界线信息表达方面B321要优于B342。2.6 影像数据融合对于购买有高空间分辨率全色波段数据的用户，进行数据融合是必不可少的。影像数据融合能够综合不同波段、不同空间分辨率数据（层）的特征，融合后的数据具有更丰富、更可靠的信息[4]。根据影像数据融合的水平阶段，影像融合分为：像元级、特征级和决策级三个层次。为了最大限度的从SPOT5遥感数据中提取森林植被信息，应进行像元级的数据融合，将2.5米的全色波段和10米多光谱数据进行融合。融合得到的新数据既具有全色波段数据的高空间分辨率特征又具有多光谱特征。像元级数据融合的方法多种多样，根据数据融合的目的，即最大限度的突显森林植被信息，应选取B4、B3、B2和PAN波段，根据我们的试验Brovey 融合算法方法比较理想：2.7遥感影像地图将融合好的数据按Rfused、Gfused、Bfused组合，叠加上行政界线、公里格网、坐标、比例尺等辅助信息，按1：1万地形图分幅生成1：1万纸质图作为外业手图。3. 结果和讨论3.1 几何精度利用SPOT5物理模型，采用1：1万地形图和2.5万DEM ，经过正射校正处理，可使影像的几何精度控制在2个像元内（<10米）,达到1：1万制图标准要求。为以遥感影像为基础信息源提取林分调查因子、区划林班界线生成大比例尺的林相图、森林分布图提供了几何精度保障。3.2 波段选择对于没有全色波段的情况，SPOT5数据的B342组合有利于森林植被类型的识别。在应用遥感技术进行森林资源调查区划中，林分类型信息提取是最为重要的环节，所以B342波段组合是小班区划和外业手图的最佳组合。3.3 融合效果融合数据技术使SPOT5遥感影像既具有全色波段的高空间分辨率又拥有多光谱数据的光谱分辨率，丰富了遥感影像的信息量。采用Brovey算法使SPOT5遥感影像从色彩、纹理等方面增强了影像的可判读性，提高了小班因子正判率和林分小班的区划精度。参考文献1．周成虎，杨晓梅，骆剑承等.《遥感影像地学理解与分析》，科学出版社，北京，2001，3-4.2．赵英时.《遥感应用分析原理与方法》，科学出版社，北京，2001.88-903．北京视宝卫星图像有限公司.《专业制图工作室GEOIMAGE用户指南》，2004，68-70.4．Christine Pohl. Geometric Aspects of Multisensor Image Fusion for Topographic Map Updating in The Humid Tropics, ITC Publication, 1996,51-52.21世纪遥感与GIS的发展来源：李德仁时间： 2005-08-11-23:09 浏览次数: 7921世纪遥感与GIS的发展李德仁（武汉大学测绘遥感信息工程国家重点实验室，武汉市珞瑜路129号，430079）摘要：在20世纪，人类的一大进步是实现了太空对地观测，即可以从空中和太空对人类赖以生存的地球通过非接触传感器的遥感进行观测，并将所得到的数据和信息存储在计算机网络上，为人类社会的可持续发展服务。在短短的30年中，遥感和GIS作为一个边缘交叉学科已发展成为一门科学、技术和经济实体。本文深入地论述了21世纪中遥感的6大发展趋势和GIS的5个发展特征。关键词：发展趋势；航空航天遥感；地理信息系统；对地观测中图法分类号：P208；P237.9随着计算机技术、空间技术和信息技术的发展，人类实现了从空中和太空来观测和感知人类赖以生存的地球的理想，并能将所感知到的结果通过计算机网络在全球流通，为人类的生存、繁荣和可持续发展服务。在20世纪后半叶，遥感和地理信息系统作为一门新兴的科学和技术，迅速地成长起来。1 遥感技术的主要发展趋势1.1 航空航天遥感传感器数据获取技术趋向三多（多平台、多传感器、多角度）和三高（高空间分辨率、高光谱分辨率和高时相分辨率）从空中和太空观测地球获取影像是20世纪的重大成果之一，短短几十年，遥感数据获取手段迅猛发展。遥感平台有地球同步轨道卫星（35000km）、太阳同步卫星（600—1000km）、太空飞船（200—300km）、航天飞机（240—350km）、探空火箭（200—1000km），并且还有高、中、低空飞机、升空气球、无人飞机等；传感器有框幅式光学相机、缝隙、全景相机、光机扫描仪、光电扫描仪、CCD线阵、面阵扫描仪、微波散射计雷达测高仪、激光扫描仪和合成孔径雷达等，它们几乎覆盖了可透过大气窗口的所有电磁波段。三行CCD阵列可以同时得到3个角度的扫描成像，EOS Terra卫星上的MISR可同时从9个角度对地成像。卫星遥感的空间分辨率从Ikonos Ⅱ的1m，进一步提高到Quckbird（快鸟）的0.62m，高光谱分辨率已达到5—6nm，500—600个波段。在轨的美国EO-1高光谱遥感卫星，具有220个波段，EOS AM-1（Terra）和EOS PM-1（Aqua）卫星上的MODIS具有36个波段的中等分辨率成像光谱仪。时间分辨率的提高主要依赖于小卫星技术的发展，通过发射地球同步轨道卫星和合理分布的小卫星星座，以及传感器的大角度倾斜，可以以1—3d的周期获得感兴趣地区的遥感影像。由于具有全天候、全天时的特点，以及用INSAR和D-INSAR，特别是双天线INSAR进行高精度三位地形及其变化测定的可能性，SAR雷达卫星为全世界各国所普遍关注。例如，美国宇航局的长远计划是要发射一系列太阳同步和地球同步的长波SAR,美国国防部则要发射一系列短波SAR，实现干涉重访问间隔为8d、3d和1d，空间分辨率分别为20m、5m和2m。我国在机载和星载SAR传感器及其应用研究方面正在形成体系。“十五”期间，我国将全方位地推进遥感数据获取的手段，形成自主的高分辨率资源卫星、雷达卫星、测图卫星和对环境与灾害进行实时监测的小卫星群。1.2 航空航天遥感对地定位趋向于不依赖地面控制确定影像目标的实地位置（三维坐标），解决影像目标在哪儿（Where）是摄影测量与遥感的主要任务之一。在已成功用于生产的全自动化GPS空中三角测量的基础上，利用DGPS和INS惯性导航系统的组合，可形成航空/航天影像传感器的位置与姿态的自动测量和稳定装置（POS），从而可实现定点摄影成像和无地面控制的高精度对地直接定位。在航空摄影条件下的精度可达到dm级，在卫星遥感的条件下，其精度可达到m级。该技术的推广应用，将改变目前摄影测量和遥感的作业流程，从而实现实时测图和实时数据库更新。若与高精度激光扫描仪集成，可实现实时三维测量（LIDAR），自动生成数字表面模型（DSM），并可推算出数字高程模型（DEM）。美国NASA在1994年和1997年两次将航天激光测高仪（SLA）安装在航天飞机上，企图建立基于SLA的全球控制点数据库，激光点大小为100m，间隔为750m，每秒10个脉冲；随后又提出了地学激光测高系统（GLAS）计划，已于2002年12月19日将该卫星IICESat（cloud and land elevation satellite）发射上天。该卫星装有激光测距系统、GPS接收机和恒星跟踪姿态测定系统。GLAS发射近红外光（1064nm）和可见绿光（532nm）的短脉冲（4ns）。激光脉冲频率为40次/s，激光点大小实地为70m，间隔为170m，其高程精度要明显高于SRTM，可望达到m级。他们的下一步计划是要在2015年之前使星载LIDAR的激光测高精度达到dm和cm级。法国利用设在全球的54个站点向卫星发射信号，通过测定多普勒频移，以精确解求卫星的空间坐标，具有极高的精度。测定距地球1300km的Topex/Poseidon卫星的高度，精度达到±3cm。用来测定SPOT 4卫星的轨道，3个坐标方向达到±5cm精度，对于SPOT 5和Envisat，可望达到±1m精度。若忽略SPOT 5传感器的角元素，直接进行无地面控制的正射像片制作，精度可达到±15m，完全可以满足国家安全和西部开发的需求。1.3 摄影测量与遥感数据的计算机处理更趋向自动化和智能化从影像数据中自动提取地物目标，解决它的属性和语义（What）是摄影测量与遥感的另一大任务。在已取得影像匹配成果的基础上，影像目标的自动识别技术主要集中在影像融合技术，基于统计和基于结构的目标识别与分类，处理的对象既包括高分辨率影像，也更加注重高光谱影像。随着遥感数据量的增大，数据融合和信息融合技术逐渐成熟。压缩倍率高、速度快的影像数据压缩方法也已商业化。我国学者在这些方面取得了不少可喜的成果。1.4 利用多时像影像数据自动发现地表覆盖的变化趋向实时化利用遥感影像自动进行变化监测（What change）关系到我国的经济建设和国防建设。过去人工方法投入大，周期长。随着各类空间数据库的建立和大量新的影像数据源的出现，实时自动化监测已成为研究的一个热点。自动变化监测研究包括利用新旧影像（DOM）的对比、新影像与旧数字地图（DLS）的对比来自动发现变化和更新数据库。目前的变化监测是先将新影像与旧影像（或数字地图）进行配准，然后再提取变化目标，这在精度、速度与自动化处理方面都有不足之处。笔者提出了把配准与变化监测同步的整体处理[1]。最理想的方法是将影像目标三维重建与变化监测一起进行，实现三维变化监测和自动更新。进一步的发展则是利用智能传感器，将数据处理在轨完成，发送回来的直接为信息，而不一定为影像数据。1.5 摄影测量与遥感在构建“数字地球”、“数字中国”、“数字省市”和“数字文化遗产”中正在发挥愈来愈大的作用“数字地球”概念是在全球信息化浪潮推进下形成的。1999年12月在北京成功地召开了第一届国际“数字地球”大会后，我国正积极推进“数字中国”和“数字省市”的建设，2001年国家测绘局完成了构建“数字中国”地理空间基础框架的总体战略研究。在已完成1∶100万和1∶25万全国空间数据库的基础上，2001年全国各省市测绘局开始1∶5万空间数据库的建库工作。在这个数据量达11TB的巨型数据库中，摄影测量与遥感将用来建设DOM（数字正射影像）、DEM（数字高程模型）、DLG（数字线划图）和CP（控制点数据库）。如果要建立全国1m分辨率影像数据库，其数据量将达到60TB。如果整个“数字地球”均达到1m分辨率，其数据量之大可想而知。本世纪内可望建成这一分辨率的数字地球。“数字文化遗产”是目前联合国和许多国家关心的一个问题，涉及到近景成像、计算机视觉和虚拟现实技术。在近景成像和近景三位量测方面，有室内各种三维激光扫描与成像仪器，还可以直接由视频摄像机的系列图像获取目标场三维重建信息。它们所获取的数据经过计算机自动处理后，可以在虚拟现实技术支持下形成文化遗迹的三维仿真，而且可以按照时间序列，将历史文化在时间隧道中再现，对文化遗产保护、复原与研究具有重要意义。1.6 全定量化遥感方法将走向实用从遥感科学的本质讲，通过对地球表层（包括岩石圈、水圈、大气圈和生物圈4大圈层）的遥感，其目的是为了获得有关地物目标的几何与物理特性，所以需要通过全定量化遥感方法进行反演。几何方程式是有显式表示的数学方程，而物理方程一直是隐式。目前的遥感解译与目标识别并没有通过物理方程反演，而是采用了基于灰度或加上一定知识的统计、结构和纹理的影像分析方法。但随着对成像机理、地物波谱反射特征、大气模型、气溶胶的研究深入和数据积累，多角度、多传感器、高光谱及雷达卫星遥感技术的成熟，相信在21世纪，估计几何与物理方程式的全定量化遥感方法将逐步由理论研究走向实用化，遥感基础理论研究将迈上新的台阶。只有实现了遥感定量化，才可能真正实现自动化和实时化。2 GIS技术的主要发展趋势2.1 空间数据库趋向图形、影像和DEM三库一体化和面向对象[2]GIS发展曾经历过栅格、矢量两个不同数据结构发展阶段，目前随着高分辨率卫星遥感数据的飞快增长和数字地球、数码城市的需求，形成了面向对象的数据模型和三库（图形矢量库、影像栅格库和DEM格网库）一体化的数据结构。这样的数据库结构使GIS的发展更加趋向自然化、逼真化，更加贴近用户。以面向应用的GIS软件为前台，以大型关系数据库（Oracle 8i,9i等)为后台数据库管理，成为当前GIS技术的主流趋势。2.2 空间数据表达趋向多比例尺、多尺度、动态多位和实时三维可视化在传统的GIS中，空间数据是以二维形式存储并挂接相应的属性数据。目前，空间数据表达的趋势是基于金字塔和LOD（level of detail）技术的多比例尺空间数据库，在不同尺度表示时可自动显示出相应比例尺或相应分辨率的数据，多比例尺数据集的跨度要比传统地图的比例尺大，在显示不同比例尺数据时，可采用LOD或地图综合技术。真三维GIS的空间数据要存储三维坐标。动态GIS在土地变更调查、土地覆盖变化监测中已有较好的应用，真四维的时空GIS将有望从理论研究转入实用阶段。基于三库一体化的时空3D可视化技术发展势头迅猛，已能再PC机上实现GIS环境下的三维建筑物室外室内漫游、信息查询、空间分析、剖面分析和阴影分析等，基于虚拟现实技术的真三维GIS将使人们在现实空间外，可以同时拥有一个Cyber空间。2.3 空间分析和辅助决策智能化需要利用数据挖掘方法从空间数据库和属性数据库中发现更多的有用知识GIS是以应用导向的空间信息技术，空间分析与辅助决策支持是GIS的高水平应用，它需要基于知识的智能系统。知识的获取是专家系统中最困难的任务。随着各种类型数据库的建立，从数据库中挖掘知识成为当今计算机界一个非常引人注目的课题。从GIS空间数据库中发现的知识可以有效的支持遥感图像解译，以解决“同物异谱”和“同谱异物”的问题。反过来，从属性数据库中挖掘的知识又具有优化资源配置等一些列空间分析的功能[3]。尽管数据挖掘和知识发现这一命题仍处于理论研究阶段，但随着数据库的快速增大和对数据挖掘工具的深入研究，其应用前景是不可估量的。2.4 通过Web服务器和WAP服务器的互联网和移动GIS将推进联邦数据库和互操作的研究及地学信息服务事业随着计算机通讯网络（包括有线和无线网）的大容量和高速化，GIS已成为在网络上的分布式异构系统。许多不同单位、不同组织维护管理的既独立又互联互用的联邦数据库，将可提供全社会各行各业的应用需要。因此，联邦数据库和互操作（federal databases & interoperability）问题成为当前国际GIS联合研究的一个热点。互操作意味着数据库中数据的直接共享，GIS规律功能模块的互操作与共享，以及多点之间的相同工作，这方面的研究已显示出明显的成效。未来的GIS用户将可能在网络上缴纳为其需要所选用数据和软件功能模块的使用费，而不必购买这个数据库和整套的GIS软硬件，这些成果产生的直接效果是GIS应用将走向地学信息服务。目前已兴起的LBS和MLS，即基于位置的服务和移动定位服务，突出地反映了这种变化趋势。它引起的革命性变化使GIS将走出研究院所和政府机关，成为全社会人人具备的信息服务工具。我国目前已有2亿个手机用户，若每人每月为MLS支付10元费用，全国一年的产值将达到240亿。可以预测在不久的将来，地学信息将能随时随地为任何人和任何事情进行4A服务（geo-in-formation for anyone and anything at anywhere and anytime）。2.5 地理信息科学的研究有望在本世纪形成较完整的理论框架体系笔者曾扼要地叙述了地球空间信息科学的7大理论问题[4]：（1）地球空间信息的基准，包括几何基准、物理基准和时间基准；（2）地球空间信息标准，包括空间数据采集、存储与交换标准、空间数据精度与质量标准、空间信息的分类与代码标准、空间信息的安全

自己进百度去查啊!!!!~~~~~~

森林资源调查中SPOT5遥感图像处理方法探讨王照利、黄生、张敏中、马胜利（国家林业局西北林业规划设计院，遥感计算中心，西安710048）本文发表于＜陕西林业科技＞2005 No.1 P.27-29,55 摘要：目前，多光谱、高空间分辨率的SPOT5卫星遥感数据被广泛应用到森林资源调查中。本文结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的处理和信息提取。探讨性地提出了适应于森林资源调查的SPOT5遥感数据处理方法。关键词：SPOT5 遥感数据，森林资源调查、数据处理DISCUSSION ON SPOT5 IMAGE DATA PROCESSING FOR FOREST INVENTORYWang Zhaoli, Huangsheng,Zhangminzhong,Ma Shengli(Northwest Institute for Forest Inventory, Planning &Design, Xi’an China 710048) Abstract: Now days, high spatial resolution and multispectral SPOT5 image data are widely applied in forest inventory in China. Based on the characteristics of SPOT5 image and requirements of forest inventory, this paper discusses the processing procedures of ordering image data, ortho-rectification, image bands composition and image data fusion. The complete steps of image processing for forest inventory are given.Key words: SPOT5 image data，forest inventory, data processing 前言卫星遥感影像具有空间宏观性、视角广、多分辨率（光谱和空间）、多时相、周期性、信息量丰富等特点，所以卫星遥感影像既可以提供森林资源的宏观空间分布信息又能提供局部的详细信息以及随时间、空间变化的信息等[1]。目前在林业领域卫星遥感数据被广泛的应用于不同尺度层次的森林资源调查、资源监测、病虫害、火灾监测等方面。2002年5月法国SPOT地球观测卫星系列之5号卫星（即SPOT5星）发射。SPOT5遥感数据的多光谱波段空间分辨率为10米（短波红外空间分辨率为20米），但全色波段空间分辨率达到2.5米。SPOT5遥感数据的高空间分辨率和多光谱分辨率为森林资源调查提供了丰富的、可靠的、高精度的基础数据源。从性价比分析，在其他高分辨率遥感数据目前比较昂贵的状况下，SPOT5遥感数据比较适宜应用于大面积的森林资源调查，可大幅度的森林调查的减少外业工作量、提高工作效率。在我国SPOT5卫星数据已被大量地应用于森林资源调查工作中，尤其，是在森林资源“二类”调查中被作基本的森林资源信息源提取各类信息。针对于将多光谱分辨率和高空间分辨率的SPOT5遥感数据应用于森林资源调查的数据处理技术和方法鲜有报道。本文总结工作实践，结合SPOT5遥感数据的特点，根据森林资源调查的需要，从遥感数据的订购、正射校正、波段组合、融合处理和数据变换处理等方面探讨了SPOT5数据的基本处理方法。 1．SPOT5卫星遥感数据特点 SPOT卫星系统采用线性阵列传感器和推扫式扫描技术，具有旋转式平面镜可以进行倾斜观察获得倾斜图像和立体像对。采用与太阳同步的近极地的椭圆形轨道，轨道高度约832Km，轨道倾角98.7o ，每天绕地球14圈多，重复覆盖周期26天[2]。由于有倾斜观测功能，使重复覆盖周期减少到2-3天。SPOT5卫星载有2台高分辨率几何成像仪（HRG）、1台高分辨率立体成像装置（HRS）和1台宽视域植被探测仪（VGT）。高分辨率几何成像仪的波段选择是总结了多年的研究成果，认为HRG的波段设置（见表1）足以取得辨别作物和植被类型的最佳效果。本文主要探讨HRG高空间分辨率数据的处理。 2．SPOT5数据的处理方法和过程 SPOT5数据处理工作流程： 2.1 遥感数据的订购订购数据时，用户需向数据代理商提供购买区域的四个角的大地坐标或者数据的景号（PATH/ROW）。特别应该注意数据订购时间和用户拿到数据之间有时间差，间隔时间长短因用户的要求、天气、卫星重复覆盖周期而异。相对于其他卫星数据，比较有利的一面是SPOT5卫星装置有旋转式平面镜可以进行倾斜观察，用户可向代理商申请红色编程提前得到调查区域的遥感数据，但要支付编程费。对于遥感数据的时相、云量、入射角、阴影量、是否购买高空间分辨率的全色波段等用户根据自己具体的工作需要向代理商提出限制要求。根据我们对SPOT5遥感数据的使用，对于森林资源调查，北方9，10月份和11月初的遥感影像比较适宜。代理商向用户提供经过处理的不同级别的影像产品，在森林资源调查中建议购买SPOT1A级产品，用户可根据自己的工作需要进行处理，同时也可减少费用。 2.2 基础数据准备大比例尺地形图和高精度DEM是进行SPOT5遥感数据高精度正射校正必需的基础地理数据。建议购买1：10000地形图和1：25000数字高程模型（DEM）。将1：1万地形图扫描，扫描分辨率设置为300DPI。将扫描好的地形图进行几何精纠正，纠正精度控制在0.3毫米内。从测绘部门购买的1：1万地形图为北京54坐标系3度分带高斯克吕格投影，而1：2.5万DEM为北京54坐标系6度分带投影。在数据准备时，将校正好的1：1万地形图通过换带转换转成和DEM一致的6度分带投影。对于没有1：1万地形图的地区，建议使用差分GPS接收机采集地面控制点。 2.3几何正射校正正射校正过程应用了法国SPOT公司发行的GEOIMAGE软件。GEOIMAGE软件有针对SPOT5卫星数据开发的SPOT5物理模型。模型模块自动读取DEM信息。SPOT 物理模型可读取卫星在获取遥感数据的瞬间状态参数，这些参数存贮在数据的头文件中[3]。卫星状态参数包括：卫星成像瞬间的经纬度、高度、倾角等。卫星状态参数能够帮助提高几何校正的精度。以校正好的1：1万地形图为基准，在影像图上找出和地形图上地物相匹配的明显地物作为地面控制点。在进行正射校正时，应先进行全色波段数据校正，然后以校正好的全色波段数据为基准进行多光谱数据校正。以全色波段数据为基准校正多光谱波段就比较容易校正，且能提高两者的匹配精度。地面控制点应分布均匀，影像的边缘部分布要有控制点分布，同时在不同的高程范围最好都有控制点。地面控制点的数量因地形地貌的复杂程度而定，根据我们的经验，一景60KmX60Km的SPOT5数据，一般地势平缓的地区20个左右控制点即可达到满意的结果，在高山区25个左右控制点就可使正射校正精度满足要求。重采样方法采用双线性内插法。 2.4 辐射校正用户购买的SPOT5的各级数据，数据提供商已经根据卫星的记录参数对遥感数据做了辐射校正，即消除了传感器自身引起的、大气辐射引起的辐射噪声。若果影像存在薄雾或地形高差较大引起的辐射误差情况，用户应进一步进行辐射校正处理。薄雾的简单消除原理是基于近红外波段不受大气辐射影响，清澈的水体或死阴影区的数值应为零。从各波段数据中减去近红外波段的水体或阴影的不为零值。地形起伏引起的辐射误差校正公式: f (x,y)=g(x,y)/cosa，g(x,y)为坡度为a的倾斜面上的地物影像；f (x,y)为校正后的影像。由于坡度因子参与校正所以需要DEM支持。 2.5 波段组合根据SPOT5数据波谱特征（表1），各波段分别记录反映了植被的不同特征方面：B4（SWIR）短波红外反映植物和土壤的含水量，利于植被水分状况和长势分析；B3（NIR）近红外波段对植被类别、密度、生长力、病虫害等的变化敏感；B2（RED）红光波段对植被的覆盖度、植被的生长状况敏感；B1（VIS）可见光波段对植物的叶绿素和叶绿素浓度敏感。经过比较分析和实际应用发现SPOT5的B3、B4、B2波段组合对植被类型的识别要优于B3、B2和B1的组合。但由于B4波段的空间分辨率为20米，使B342组合对植被空间几何细节表达没有B321组合清晰，例如林缘界线信息表达方面B321要优于B342。 2.6 影像数据融合对于购买有高空间分辨率全色波段数据的用户，进行数据融合是必不可少的。影像数据融合能够综合不同波段、不同空间分辨率数据（层）的特征，融合后的数据具有更丰富、更可靠的信息[4]。根据影像数据融合的水平阶段，影像融合分为：像元级、特征级和决策级三个层次。为了最大限度的从SPOT5遥感数据中提取森林植被信息，应进行像元级的数据融合，将2.5米的全色波段和10米多光谱数据进行融合。融合得到的新数据既具有全色波段数据的高空间分辨率特征又具有多光谱特征。像元级数据融合的方法多种多样，根据数据融合的目的，即最大限度的突显森林植被信息，应选取B4、B3、B2和PAN波段，根据我们的试验Brovey 融合算法方法比较理想： 2.7遥感影像地图将融合好的数据按Rfused、Gfused、Bfused组合，叠加上行政界线、公里格网、坐标、比例尺等辅助信息，按1：1万地形图分幅生成1：1万纸质图作为外业手图。 3. 结果和讨论 3.1 几何精度利用SPOT5物理模型，采用1：1万地形图和2.5万DEM ，经过正射校正处理，可使影像的几何精度控制在2个像元内（<10米）,达到1：1万制图标准要求。为以遥感影像为基础信息源提取林分调查因子、区划林班界线生成大比例尺的林相图、森林分布图提供了几何精度保障。 3.2 波段选择对于没有全色波段的情况，SPOT5数据的B342组合有利于森林植被类型的识别。在应用遥感技术进行森林资源调查区划中，林分类型信息提取是最为重要的环节，所以B342波段组合是小班区划和外业手图的最佳组合。 3.3 融合效果融合数据技术使SPOT5遥感影像既具有全色波段的高空间分辨率又拥有多光谱数据的光谱分辨率，丰富了遥感影像的信息量。采用Brovey算法使SPOT5遥感影像从色彩、纹理等方面增强了影像的可判读性，提高了小班因子正判率和林分小班的区划精度。参考文献 1．周成虎，杨晓梅，骆剑承等.《遥感影像地学理解与分析》，科学出版社，北京，2001，3-4. 2．赵英时.《遥感应用分析原理与方法》，科学出版社，北京，2001.88-90 3．北京视宝卫星图像有限公司.《专业制图工作室GEOIMAGE用户指南》，2004，68-70. 4．Christine Pohl. Geometric Aspects of Multisensor Image Fusion for Topographic Map Updating in The Humid Tropics, ITC Publication, 1996,51-52.21世纪遥感与GIS的发展来源：李德仁时间： 2005-08-11-23:09 浏览次数: 79 21世纪遥感与GIS的发展李德仁（武汉大学测绘遥感信息工程国家重点实验室，武汉市珞瑜路129号，430079）摘要：在20世纪，人类的一大进步是实现了太空对地观测，即可以从空中和太空对人类赖以生存的地球通过非接触传感器的遥感进行观测，并将所得到的数据和信息存储在计算机网络上，为人类社会的可持续发展服务。在短短的30年中，遥感和GIS作为一个边缘交叉学科已发展成为一门科学、技术和经济实体。本文深入地论述了21世纪中遥感的6大发展趋势和GIS的5个发展特征。关键词：发展趋势；航空航天遥感；地理信息系统；对地观测中图法分类号：P208；P237.9 随着计算机技术、空间技术和信息技术的发展，人类实现了从空中和太空来观测和感知人类赖以生存的地球的理想，并能将所感知到的结果通过计算机网络在全球流通，为人类的生存、繁荣和可持续发展服务。在20世纪后半叶，遥感和地理信息系统作为一门新兴的科学和技术，迅速地成长起来。 1 遥感技术的主要发展趋势 1.1 航空航天遥感传感器数据获取技术趋向三多（多平台、多传感器、多角度）和三高（高空间分辨率、高光谱分辨率和高时相分辨率）从空中和太空观测地球获取影像是20世纪的重大成果之一，短短几十年，遥感数据获取手段迅猛发展。遥感平台有地球同步轨道卫星（35000km）、太阳同步卫星（600—1000km）、太空飞船（200—300km）、航天飞机（240—350km）、探空火箭（200—1000km），并且还有高、中、低空飞机、升空气球、无人飞机等；传感器有框幅式光学相机、缝隙、全景相机、光机扫描仪、光电扫描仪、CCD线阵、面阵扫描仪、微波散射计雷达测高仪、激光扫描仪和合成孔径雷达等，它们几乎覆盖了可透过大气窗口的所有电磁波段。三行CCD阵列可以同时得到3个角度的扫描成像，EOS Terra卫星上的MISR可同时从9个角度对地成像。卫星遥感的空间分辨率从Ikonos Ⅱ的1m，进一步提高到Quckbird（快鸟）的0.62m，高光谱分辨率已达到5—6nm，500—600个波段。在轨的美国EO-1高光谱遥感卫星，具有220个波段，EOS AM-1（Terra）和EOS PM-1（Aqua）卫星上的MODIS具有36个波段的中等分辨率成像光谱仪。时间分辨率的提高主要依赖于小卫星技术的发展，通过发射地球同步轨道卫星和合理分布的小卫星星座，以及传感器的大角度倾斜，可以以1—3d的周期获得感兴趣地区的遥感影像。由于具有全天候、全天时的特点，以及用INSAR和D-INSAR，特别是双天线INSAR进行高精度三位地形及其变化测定的可能性，SAR雷达卫星为全世界各国所普遍关注。例如，美国宇航局的长远计划是要发射一系列太阳同步和地球同步的长波SAR,美国国防部则要发射一系列短波SAR，实现干涉重访问间隔为8d、3d和1d，空间分辨率分别为20m、5m和2m。我国在机载和星载SAR传感器及其应用研究方面正在形成体系。“十五”期间，我国将全方位地推进遥感数据获取的手段，形成自主的高分辨率资源卫星、雷达卫星、测图卫星和对环境与灾害进行实时监测的小卫星群。 1.2 航空航天遥感对地定位趋向于不依赖地面控制确定影像目标的实地位置（三维坐标），解决影像目标在哪儿（Where）是摄影测量与遥感的主要任务之一。在已成功用于生产的全自动化GPS空中三角测量的基础上，利用DGPS和INS惯性导航系统的组合，可形成航空/航天影像传感器的位置与姿态的自动测量和稳定装置（POS），从而可实现定点摄影成像和无地面控制的高精度对地直接定位。在航空摄影条件下的精度可达到dm级，在卫星遥感的条件下，其精度可达到m级。该技术的推广应用，将改变目前摄影测量和遥感的作业流程，从而实现实时测图和实时数据库更新。若与高精度激光扫描仪集成，可实现实时三维测量（LIDAR），自动生成数字表面模型（DSM），并可推算出数字高程模型（DEM）。美国NASA在1994年和1997年两次将航天激光测高仪（SLA）安装在航天飞机上，企图建立基于SLA的全球控制点数据库，激光点大小为100m，间隔为750m，每秒10个脉冲；随后又提出了地学激光测高系统（GLAS）计划，已于2002年12月19日将该卫星IICESat（cloud and land elevation satellite）发射上天。该卫星装有激光测距系统、GPS接收机和恒星跟踪姿态测定系统。GLAS发射近红外光（1064nm）和可见绿光（532nm）的短脉冲（4ns）。激光脉冲频率为40次/s，激光点大小实地为70m，间隔为170m，其高程精度要明显高于SRTM，可望达到m级。他们的下一步计划是要在2015年之前使星载LIDAR的激光测高精度达到dm和cm级。法国利用设在全球的54个站点向卫星发射信号，通过测定多普勒频移，以精确解求卫星的空间坐标，具有极高的精度。测定距地球1300km的Topex/Poseidon卫星的高度，精度达到±3cm。用来测定SPOT 4卫星的轨道，3个坐标方向达到±5cm精度，对于SPOT 5和Envisat，可望达到±1m精度。若忽略SPOT 5传感器的角元素，直接进行无地面控制的正射像片制作，精度可达到±15m，完全可以满足国家安全和西部开发的需求。 1.3 摄影测量与遥感数据的计算机处理更趋向自动化和智能化从影像数据中自动提取地物目标，解决它的属性和语义（What）是摄影测量与遥感的另一大任务。在已取得影像匹配成果的基础上，影像目标的自动识别技术主要集中在影像融合技术，基于统计和基于结构的目标识别与分类，处理的对象既包括高分辨率影像，也更加注重高光谱影像。随着遥感数据量的增大，数据融合和信息融合技术逐渐成熟。压缩倍率高、速度快的影像数据压缩方法也已商业化。我国学者在这些方面取得了不少可喜的成果。 1.4 利用多时像影像数据自动发现地表覆盖的变化趋向实时化利用遥感影像自动进行变化监测（What change）关系到我国的经济建设和国防建设。过去人工方法投入大，周期长。随着各类空间数据库的建立和大量新的影像数据源的出现，实时自动化监测已成为研究的一个热点。自动变化监测研究包括利用新旧影像（DOM）的对比、新影像与旧数字地图（DLS）的对比来自动发现变化和更新数据库。目前的变化监测是先将新影像与旧影像（或数字地图）进行配准，然后再提取变化目标，这在精度、速度与自动化处理方面都有不足之处。笔者提出了把配准与变化监测同步的整体处理[1]。最理想的方法是将影像目标三维重建与变化监测一起进行，实现三维变化监测和自动更新。进一步的发展则是利用智能传感器，将数据处理在轨完成，发送回来的直接为信息，而不一定为影像数据。 1.5 摄影测量与遥感在构建“数字地球”、“数字中国”、“数字省市”和“数字文化遗产”中正在发挥愈来愈大的作用 “数字地球”概念是在全球信息化浪潮推进下形成的。1999年12月在北京成功地召开了第一届国际“数字地球”大会后，我国正积极推进“数字中国”和“数字省市”的建设，2001年国家测绘局完成了构建“数字中国”地理空间基础框架的总体战略研究。在已完成1∶100万和1∶25万全国空间数据库的基础上，2001年全国各省市测绘局开始1∶5万空间数据库的建库工作。在这个数据量达11TB的巨型数据库中，摄影测量与遥感将用来建设DOM（数字正射影像）、DEM（数字高程模型）、DLG（数字线划图）和CP（控制点数据库）。如果要建立全国1m分辨率影像数据库，其数据量将达到60TB。如果整个“数字地球”均达到1m分辨率，其数据量之大可想而知。本世纪内可望建成这一分辨率的数字地球。 “数字文化遗产”是目前联合国和许多国家关心的一个问题，涉及到近景成像、计算机视觉和虚拟现实技术。在近景成像和近景三位量测方面，有室内各种三维激光扫描与成像仪器，还可以直接由视频摄像机的系列图像获取目标场三维重建信息。它们所获取的数据经过计算机自动处理后，可以在虚拟现实技术支持下形成文化遗迹的三维仿真，而且可以按照时间序列，将历史文化在时间隧道中再现，对文化遗产保护、复原与研究具有重要意义。 1.6 全定量化遥感方法将走向实用从遥感科学的本质讲，通过对地球表层（包括岩石圈、水圈、大气圈和生物圈4大圈层）的遥感，其目的是为了获得有关地物目标的几何与物理特性，所以需要通过全定量化遥感方法进行反演。几何方程式是有显式表示的数学方程，而物理方程一直是隐式。目前的遥感解译与目标识别并没有通过物理方程反演，而是采用了基于灰度或加上一定知识的统计、结构和纹理的影像分析方法。但随着对成像机理、地物波谱反射特征、大气模型、气溶胶的研究深入和数据积累，多角度、多传感器、高光谱及雷达卫星遥感技术的成熟，相信在21世纪，估计几何与物理方程式的全定量化遥感方法将逐步由理论研究走向实用化，遥感基础理论研究将迈上新的台阶。只有实现了遥感定量化，才可能真正实现自动化和实时化。 2 GIS技术的主要发展趋势 2.1 空间数据库趋向图形、影像和DEM三库一体化和面向对象[2] GIS发展曾经历过栅格、矢量两个不同数据结构发展阶段，目前随着高分辨率卫星遥感数据的飞快增长和数字地球、数码城市的需求，形成了面向对象的数据模型和三库（图形矢量库、影像栅格库和DEM格网库）一体化的数据结构。这样的数据库结构使GIS的发展更加趋向自然化、逼真化，更加贴近用户。以面向应用的GIS软件为前台，以大型关系数据库（Oracle 8i,9i等)为后台数据库管理，成为当前GIS技术的主流趋势。 2.2 空间数据表达趋向多比例尺、多尺度、动态多位和实时三维可视化在传统的GIS中，空间数据是以二维形式存储并挂接相应的属性数据。目前，空间数据表达的趋势是基于金字塔和LOD（level of detail）技术的多比例尺空间数据库，在不同尺度表示时可自动显示出相应比例尺或相应分辨率的数据，多比例尺数据集的跨度要比传统地图的比例尺大，在显示不同比例尺数据时，可采用LOD或地图综合技术。真三维GIS的空间数据要存储三维坐标。动态GIS在土地变更调查、土地覆盖变化监测中已有较好的应用，真四维的时空GIS将有望从理论研究转入实用阶段。基于三库一体化的时空3D可视化技术发展势头迅猛，已能再PC机上实现GIS环境下的三维建筑物室外室内漫游、信息查询、空间分析、剖面分析和阴影分析等，基于虚拟现实技术的真三维GIS将使人们在现实空间外，可以同时拥有一个Cyber空间。 2.3 空间分析和辅助决策智能化需要利用数据挖掘方法从空间数据库和属性数据库中发现更多的有用知识 GIS是以应用导向的空间信息技术，空间分析与辅助决策支持是GIS的高水平应用，它需要基于知识的智能系统。知识的获取是专家系统中最困难的任务。随着各种类型数据库的建立，从数据库中挖掘知识成为当今计算机界一个非常引人注目的课题。从GIS空间数据库中发现的知识可以有效的支持遥感图像解译，以解决“同物异谱”和“同谱异物”的问题。反过来，从属性数据库中挖掘的知识又具有优化资源配置等一些列空间分析的功能[3]。尽管数据挖掘和知识发现这一命题仍处于理论研究阶段，但随着数据库的快速增大和对数据挖掘工具的深入研究，其应用前景是不可估量的。 2.4 通过Web服务器和WAP服务器的互联网和移动GIS将推进联邦数据库和互操作的研究及地学信息服务事业随着计算机通讯网络（包括有线和无线网）的大容量和高速化，GIS已成为在网络上的分布式异构系统。许多不同单位、不同组织维护管理的既独立又互联互用的联邦数据库，将可提供全社会各行各业的应用需要。因此，联邦数据库和互操作（federal databases & interoperability）问题成为当前国际GIS联合研究的一个热点。互操作意味着数据库中数据的直接共享，GIS规律功能模块的互操作与共享，以及多点之间的相同工作，这方面的研究已显示出明显的成效。未来的GIS用户将可能在网络上缴纳为其需要所选用数据和软件功能模块的使用费，而不必购买这个数据库和整套的GIS软硬件，这些成果产生的直接效果是GIS应用将走向地学信息服务。目前已兴起的LBS和MLS，即基于位置的服务和移动定位服务，突出地反映了这种变化趋势。它引起的革命性变化使GIS将走出研究院所和政府机关，成为全社会人人具备的信息服务工具。我国目前已有2亿个手机用户，若每人每月为MLS支付10元费用，全国一年的产值将达到240亿。可以预测在不久的将来，地学信息将能随时随地为任何人和任何事情进行4A服务（geo-in-formation for anyone and anything at anywhere and anytime）。 2.5 地理信息科学的研究有望在本世纪形成较完整的理论框架体系笔者曾扼要地叙述了地球空间信息科学的7大理论问题[4]：（1）地球空间信息的基准，包括几何基准、物理基准和时间基准；（2）地球空间信息标准，包括空间数据采集、存储与交换标准、空间数据精度与质量标准、空间信息的分类与代码标准、空间信息的安全

随心所欲的写咯

图像中的目标检测论文

运动目标检测与跟踪算法研究视觉是人类感知自身周围复杂环境最直接有效的手段之一，而在现实生活中大量有意义的视觉信息都包含在运动中，人眼对运动的物体和目标也更敏感，能够快速的发现运动目标，并对目标的运动轨迹进行预测和描绘。随着计算机技术、通信技术、图像处理技术的不断发展，计算机视觉己成为目前的热点研究问题之一。而运动目标检测与跟踪是计算机视觉研究的核心课题之一，融合了图像处理、模式识别、人工智能、自动控制、计算机等众多领域的先进技术，在军事制导、视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实用价值和广阔的发展前景。 1、国内外研究现状 1.1 运动目标检测运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。根据运动目标与摄像机之间的关系，运动目标检测分为静态背景下的运动目标检测和动态背景下的运动目标检测。静态背景下的运动目标检测是指摄像机在整个监视过程中不发生移动；动态背景下的运动目标检测是指摄像机在监视过程中发生了移动，如平动、旋转或多自由度运动等。静态背景静态背景下的运动目标检测方法主要有以下几种：（1）背景差分法背景差分法是目前最常用的一种目标检测方法，其基本思想就是首先获得一个背景模型，然后将当前帧与背景模型相减，如果像素差值大于某一阈值，则判断此像素属于运动目标，否则属于背景图像。利用当前图像与背景图像的差分来检测运动区域，一般能够提供比较完整的特征数据，但对于动态场景的变化，如光照和外来无关事件的干扰等特别敏感。很多研究人员目前都致力于开发不同的背景模型，以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、阴影的去除等对跟踪结果的好坏至关重要。背景差分法的实现简单，在固定背景下能够完整地精确、快速地分割出运动对象。不足之处是易受环境光线变化的影响，需要加入背景图像更新机制，且只对背景已知的运动对象检测比较有效，不适用于摄像头运动或者背景灰度变化很大的情况。（2）帧间差分法帧间差分法是在连续的图像序列中两个或三个相邻帧间，采用基于像素的时间差分并阈值化来提取图像中的运动区域。帧间差分法对动态环境具有较强的自适应性，但一般不能完全提取出所有相关的特征像素点，在运动实体内部容易产生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法，它是对图像序列中每连续三帧图像进行对称差分，检测出目标的运动范围，同时利用上一帧分割出来的模板对检测出来的目标运动范围进行修正，从而能较好地检测出中间帧运动目标的形状轮廓。帧间差分法非常适合于动态变化的环境，因为它只对运动物体敏感。实际上它只检测相对运动的物体，而且因两幅图像的时间间隔较短，差分图像受光线变化影响小，检测有效而稳定。该算法简单、速度快，已得到广泛应用。虽然该方法不能够完整地分割运动对象，只能检测出物体运动变化的区域，但所检测出的物体运动信息仍可用于进一步的目标分割。（3）光流法光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流是指空间中物体被观测面上的像素点运动产生的瞬时速度场，包含了物体表面结构和动态行为等重要信息。基于光流法的运动目标检测采用了运动目标随时间变化的光流特性，由于光流不仅包含了被观测物体的运动信息，还携带了物体运动和景物三位结构的丰富信息。在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可用于动态场景的情况。但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明性及噪声等原因，使得光流场基本方程——灰度守恒的假设条件无法满足，不能正确求出光流场，计算方也相当复杂，计算量巨大，不能满足实时的要求。动态背景动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动，检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、光流法以及全局运动估计法等。 2、运动目标跟踪运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。近年来出现了大批运动目标跟踪方法，许多文献对这些方法进行了分类介绍，可将目标跟踪方法分为四类：基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、基于模型的跟踪，这种分类方法概括了目前大多数跟踪方法，下面用这种分类方法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪基于区域的跟踪方法基本思想是：首先通过图像分割或预先人为确定提取包含目标区域的模板，并设定一个相似性度量，然后在序列图像中搜索目标，把度量取极值时对应的区域作为对应帧中的目标区域。由于提取的目标模板包含了较完整的目标信息，该方法在目标未被遮挡时，跟踪精度非常高，跟踪非常稳定，但通常比较耗时，特别是当目标区域较大时，因此一般应用于跟踪较小的目标或对比度较差的目标。该方法还可以和多种预测算法结合使用，如卡尔曼预测、粒子预测等，以估计每帧图像中目标的位置。近年来，对基于区域的跟踪方法关注较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重遮挡时的情况。 (2)基于特征的跟踪基于特征的跟踪方法基本思想是：首先提取目标的某个或某些局部特征，然后利用某种匹配算法在图像序列中进行特征匹配，从而实现对目标的跟踪。该方法的优点是即使目标部分被遮挡，只要还有一部分特征可以被看到，就可以完成跟踪任务，另外，该方法还可与卡尔曼滤波器结合使用，实时性较好，因此常用于复杂场景下对运动目标的实时、鲁棒跟踪。用于跟踪的特征很多，如角点边缘、形状、纹理、颜色等，如何从众多的特征中选取最具区分性、最稳定的特征是基于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪基于活动轮廓的跟踪方法基本思想是：利用封闭的曲线轮廓表达运动目标，结合图像特征、曲线轮廓构造能量函数，通过求解极小化能量实现曲线轮廓的自动连续更新，从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来，基于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方法，轮廓表达有减少复杂度的优点，而且在目标被部分遮挡的情况下也能连续的进行跟踪，但是该方法的跟踪结果受初始化影响较大，对噪声也较为敏感。 (4)基于模型的跟踪基于模型的跟踪方法基本思想是：首先通过一定的先验知识对所跟踪目标建立模型，然后通过匹配跟踪目标，并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型，即线图模型、二维轮廓模型和三维立体模型口61，应用较多的是运动目标的三维立体模型，尤其是对刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹，即使在目标姿态变化和部分遮挡的情况下也能够可靠的跟踪，但跟踪精度取决于模型的精度，而在现实生活中要获得所有运动目标的精确模型是非常困难的。目标检测算法，至今已提出了数千种各种类型的算法，而且每年都有上百篇相关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研究，现己提出的分割算法大都是针对具体问题的，并没有一种适合于所有情况的通用算法。目前，比较经典的运动目标检测算法有：双帧差分法、三帧差分法(对称差分法)、背景差法、光流法等方法，这些方法之间并不是完全独立，而是可以相互交融的。目标跟踪的主要目的就是要建立目标运动的时域模型，其算法的优劣直接影响着运动目标跟踪的稳定性和精确度，虽然对运动目标跟踪理论的研究已经进行了很多年，但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑战。基于此目的，系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂环境中运动目标快速、稳定的跟踪，人们提出了众多算法，但先前的许多算法都是针对刚体目标，或是将形变较小的非刚体近似为刚体目标进行跟踪，因而这些算法难以实现对形状变化较大的非刚体目标的正确跟踪。根据跟踪算法所用的预测技术来划分，目前主要的跟踪算法有：基于均值漂移的方法、基于遗传算法的方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方法等。运动检测与目标跟踪算法模块运动检测与目标跟踪算法模块与目标跟踪一、运动检测算法 1.算法效果算法效果总体来说，对比度高的视频检测效果要优于对比度低的视频。算法可以比较好地去除目标周围的浅影子，浅影的去除率在 80%以上。去影后目标的完整性可以得到较好的保持，在 80%以上。在对比度比较高的环境中可以准确地识别较大的滞留物或盗移物。从对目标的检测率上来说，对小目标较难进行检测。一般目标小于 40 个像素就会被漏掉。对于对比度不高的目标会检测不完整。总体上来说，算法在对比度较高的环境中漏检率都较低，在 0.1%以下，在对比度不高或有小目标的场景下漏检率在 6%以下。精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域，以供高层进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。反映算法优缺点的详细效果如下所示：去影子和完整性效果好公司内视频左边的为去影前，右边的为去影后的结果，可以看出在完整性和去影率上都有所突出。这两个视频的共周特点城市交通是，影子都是浅影子，视频噪声不太明显。目标与背景的对比度比较高。效果差这两个视频的特点是影子都是深影子。虽然影子没有去掉，但是物体的完整性是比较高的。主要原因就是场景的对路口，上午十点比度比较高。滞留物检测和稳定性效果好会议室盗移效果好的原因，一是盗移或滞留目标与背景对比度较大，二是目标本身尺寸较大。另外盗移物或滞留物在保持各自的状态期间不能受到光照变化或其它明显运动目标的干扰，要不然有可能会造成判断的不稳定。效果差会议室遗留物大部分时间内，滞留的判断都是较稳定的，但是在后期出现了不稳定。主要原因是目标太小的原故。因此在进行滞留物判断时，大目标，对比度较高的环境有利于判断的稳定性和准确性。漏检率效果好城市交通在对比度高的环境下，目标相对都较大的情况下（大于 40 个像素）可以很，稳定的检测出目标。在这种条件下的漏检率通常都是非常低的，在 0.1%以下。效果差行人－傍晚和“行人”目录下的其它昏暗条件下的视频在对比度较低的情况下，会造成检测结果不稳定。漏检率较高。主要原因是由于去影子造成的。这种对比度下的漏检率一般在 6%以下。除了对比度低是造成漏检的原因外，过小的目标也会造成漏检，一般是 40 个像素以下的目标都会被忽略掉。 1.2 算法效率内存消耗（单位：b） .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率一帧耗时 Max:57% Min:2.8% Avg:37.5% Max:23 Min:1.14 Avg:15 运动区域占 1/3 左右时 Max:45% Min:2.8% Avg:20% Max:18 Min:1.14 Avg:8 1.3 检测参数说明检测参数说明检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧，可以通过参数来自行调整。目前目标与背景的差异是根据局部光照强度所决定的，范围在 4 个像素值以上。目前参数设置要求目标大小要在 20 个像素以上才能被检测到，可以通过参数来自行调整。目标阴影的去除能力是可以调整的，目前的参数设置可以去除大部分的浅影子和较小的光照变化。 1.4 适用环境推荐光照条件较好（具有一定的对比度）的室内环境或室外环境。不易用它去检测过小的目标，比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标，可以为后面高层应用提供良好的信息。二、目标跟踪 2.1 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合，对相机的架设和视频的背景环境和运动目标数量运动方式有一定要求：背景要求：由于运动跟踪是基于运动检测的结果进行的，所以对背景的要求和运动检测一样，背景要求：运动目标相对于背景要有一定反差。运动目标：由于运动检测中，对较小的目标可能过滤掉。所以运动目标的大小要符合运动检运动目标：测的要求。运动目标的速度不能太大，要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改，过小，可能把碎片当成原目标分裂出来的小目标，过大，可能失去跟踪。当然可试着调节以适应不同场景)。该算法对由于运动检测在地面上产生的碎片抗干扰性比较差，运动目标和碎片相遇时，容易发生融合又分离的现象，造成轨迹混乱。消失目标和新生目标很容易当成同一目标处理，所以可能出现一个新目标继承新生目标的轨迹。运动方式：运动目标的最大数量由外部设定。但运动跟踪对运动目标比较稀疏的场景效果比运动方式：较好。算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。算法没对物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。拍摄角度：拍摄角度：拍摄视野比较大，且最好是俯视拍摄。

有一个月没更博客了，捂脸 o(￣=￣)d

端午回家休息了几天，6月要加油~

回到正文，HOG是很经典的一种图像特征提取方法，尤其是在行人识别领域被应用的很多。虽然文章是2005年发表在CVPR上的，但近十年来还没有被淹没的文章真的是很值得阅读的研究成果了。

key idea：局部物体的形状和外观可以通过局部梯度或者边缘的密度分布所表示。

主要步骤：

上图为论文中提供的图，个人觉得我在参考资料中列出的那篇博客中给出的图可能更好理解一些。

具体细节：关于每一个过程的详细解释还是在这篇博客中已经写得很清楚了，这里就不再搬运了。

文章中数据集的图像大小均为：64*128, block大小为16x16， block stride为8x8，cell size为8x8，bins=9（直方图等级数）；

获取到每张图的特征维度后，再用线性SVM训练分类器即可。

下图为作者而给出的示例图：

这两篇博客写的都很好，推荐阅读一波。

能不能给我发一份呢？

图像目标检测综述论文

论文名称：Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间：2014年论文地址：针对问题：从Alexnet提出后，作者等人思考如何利用卷积网络来完成检测任务，即输入一张图，实现图上目标的定位（目标在哪）和分类（目标是什么）两个目标，并最终完成了RCNN网络模型。创新点： RCNN提出时，检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢，作者采用的是Selective Search候选区域提取算法，来获得当前输入图上可能包含目标的不同图像块，再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。参考博客：。论文题目：OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间：2014年论文地址：针对问题：该论文讨论了，CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后，在网络后端组织两组卷积或全连接层，一组用于实现定位，输出当前图像上目标的最小外接矩形框坐标，一组用于分类，输出当前图像上目标的类别信息。也是以此为起点，检测网络出现基础主干网络(backbone)+分类头或回归头（定位头）的网络设计模式雏形。创新点：在这篇论文中还有两个比较有意思的点，一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的，而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制，那用1x1卷积来替换FC层，是否可行呢？作者在测试时通过将全连接层替换为1x1卷积核证明是可行的；二是提出了offset max-pooling，也就是对池化层输入特征不能整除的情况，通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练，然后切换分类头为回归头，再训练回归头的参数，最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。参考博客：论文题目：Scalable Object Detection using Deep Neural Networks 提出时间：2014年论文地址：针对问题：既然CNN网络提取的特征可以直接用于检测任务（定位+分类），作者就尝试将目标框（可能包含目标的最小外包矩形框）提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。创新点：本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心，（800个anchor box）然后学习预测不考虑目标类别的二分类网络，背景or前景。用到了多尺度下的检测。参考博客：论文题目：DeepBox: Learning Objectness with Convolutional Networks 提出时间：2015年ICCV 论文地址：主要针对的问题：本文完成的工作与第三篇类似，都是对目标框提取算法的优化方案，区别是本文首先采用自底而上的方案来提取图像上的疑似目标框，然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序；而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点：本文作者想通过CNN学习输入图像的特征，从而实现对输入网络目标框是否为真实目标的情况进行计算，量化每个输入框的包含目标的可能性值。参考博客：论文题目：AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间：2015年ICCV 论文地址：主要针对的问题：对检测网络的实现方案进行思考，之前的执行策略是，先确定输入图像中可能包含目标位置的矩形框，再对每个矩形框进行分类和回归从而确定目标的准确位置，参考RCNN。那么能否直接利用回归的思路从图像的四个角点，逐渐得到目标的最小外接矩形框和类别呢？创新点：通过从图像的四个角点，逐步迭代的方式，每次计算一个缩小的方向，并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。参考博客：论文题目：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间：2014年论文地址：针对问题：如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络，在处理过程中就造成了图像块信息的损失。在实际的场景中，输入网络的目标尺寸很难统一，而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点：作者提出的SPPnet中，通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸，在训练的时候，池化的操作还是通过滑动窗口完成的，池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。参考博客：论文题目：Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间：2015年论文地址：针对问题：既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位，本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点：作者通过对输入网络的region进行一定的处理（通过数据增强，使得网络利用目标周围的上下文信息得到更精准的目标框）来增加网络对目标回归框的精度。具体的处理方式包括：扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置，使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性，从而提高了回归框的精度。参考博客：论文题目：Fast-RCNN 提出时间：2015年论文地址：针对问题： RCNN中的CNN每输入一个图像块就要执行一次前向计算，这显然是非常耗时的，那么如何优化这部分呢？创新点：作者参考了SPPNet（第六篇论文），在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸，从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图，再将原图上用Selective Search算法得到的目标框映射到特征图上，避免了特征的重复提取。参考博客：论文题目：DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间：2015年论文地址：主要针对的问题：本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文，作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。创新点：作者在不同的激活层上以滑动窗口的方式生成了假设，并表明最终的卷积层可以以较高的查全率找到感兴趣的对象，但是由于特征图的粗糙性，定位性很差。相反，网络的第一层可以更好地定位感兴趣的对象，但召回率降低。论文题目：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间：2015年NIPS 论文地址：主要针对的问题：由multibox（第三篇）和DeepBox（第四篇）等论文，我们知道，用CNN可以生成目标待检测框，并判定当前框为目标的概率，那能否将该模型整合到目标检测的模型中，从而实现真正输入端为图像，输出为最终检测结果的，全部依赖CNN完成的检测系统呢？创新点：将当前输入图目标框提取整合到了检测网络中，依赖一个小的目标框提取网络RPN来替代Selective Search算法，从而实现真正的端到端检测算法。参考博客：

随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文，欢迎阅读!

图像识别技术研究综述

摘要：随着图像处理技术的迅速发展，图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解，由于图像在成像时受到外部环境的影响，使得图像具有特殊性，复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词：图像处理;图像识别;成像

中图分类号：TP391 文献标识码：A 文章编号：1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像，是人类最重要的信息源，它是通过各种观测系统从客观世界中获得，具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展，图像处理技术的应用也越来越广泛，并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段，比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等，在这些应用中，都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理，着重强调图像与图像之间进行的交换，主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性，使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析，以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理，而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声，将原始图像编程适于计算机进行特征提取的形式，主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集，图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像，也包括一些动态图像，并可以将其转为数字图像，和文字、图形、声音一起存储在计算机内，显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强，图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化，数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分，使图像的主体结构更加明确，必须对图像进行改善，即图像增强。通过图像增强，以减少图像中的图像的噪声，改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量，使图像中的物体的轮廓更加清晰，细节更加明显。图像增强不考虑图像降质的原因，增强后的图像更加赏欣悦目，为后期的图像分析和图像理解奠定基础。

3)图像复原，图像复原也称图像恢复，由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊，为了提取比较清晰的图像需要对图像进行恢复，图像恢复主要采用滤波方法，从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建，该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩，数字图像的显著特点是数据量庞大，需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频，那么必须对图像进行编码和压缩。目前，图像压缩编码已形成国际标准，如比较著名的静态图像压缩标准JPEG，该标准主要针对图像的分辨率、彩色图像和灰度图像，适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列，因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术，图像分割是把图像分成一些互不重叠而又具有各自特征的子区域，每一区域是像素的一个连续集，这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位，然后把目标从背景中分离出来。目前，图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰，使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述，描述是用数字或者符号表示图像或景物中各个目标的相关特征，甚至目标之间的关系，最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时，可以采用模板匹配模型。在某些具体的应用中，图像识别除了要给出被识别对象是什么物体外，还需要给出物体所处的位置和姿态以引导计算初工作。目前，图像识别技术已广泛应用于多个领域，如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有：

2.1 指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段，主要应用于身份验证。指纹识别是生物特征的一个部分，它具有不变性：一个人的指纹是终身不变的;唯一性：几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前，指纹识别技术与我们的现实生活紧密相关，如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

2.2 人脸识别目前大多数人脸识别系统使用可见光或红外图像进行人脸识别，可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下，其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响，但由于红外线不能穿透玻璃，如果待识别的对象戴有眼镜，那么在图像识别时，眼部信息全部丢失，将严重影响人脸识别的性能[4]。

2.3 文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术，可以自动地把文字和其他信息分离出来，通过智能识别后输入计算机，用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档，如银行票据、文稿、各类公式和符号等自动录入，可以提供文字的处理效率，有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样，使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事，但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下，图像识别技术取得了一定的成功，但在复杂的环境下，仍面临着许多问题：如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准，以及算法本身存在一定的局限性，这使得图像识别的最终结果不十分精确等。

参考文献：

[1] 胡爱明，周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用，2003，39(7)：90—91.

[2] 胡学龙.数字图像处理[M].北京：电子工业出版社，2011.

[3] 范立南，韩晓微，张广渊.图像处理与模式识别[M].北京：科学出版社，2007.

[4] 晓慧，刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用，2009，1(29)：8.

[5] 陈良育，曾振柄，张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用，2005，25(7)：1629-1631.

[6] Sanderson C，Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33，Martigny，Swizerland，2002.

点击下页还有更多>>>图像识别技术论文

遥感图像处理毕业论文

随心所欲的写咯

我这里有，可以发给你

洋河流域遥感图像土地利用分类方法研究【摘要】遥感影像分类方法的确定是LUCC研究中的关键步骤。文章以洋河流域为研究区，分别进行了非监督分类和监督分类。针对监督分类结果中存在的误差，对水域、植被、城镇与工矿用地三种类型地物的提取分别选择了综合阈值法、植被指数法、DEM数据辅助分析法进行了改进，结果表明改进后的提取结果较监督分类直接得到的结果有了很大的改善。【关键词】遥感图像；监督分类；综合阈值法；植被指数法【中图分类号】TP79 【文献标识码】A【文章编号】1671-5969（2007）16-0164-03一、研究区域概况及图像资料（一）研究区域概况洋河流域是张家口经济发展的中心地带，水资源相对丰富。洋河发源于山西省阳高县和内蒙古兴和县，是永定河上游的一大支流，流域面积约14600km2 。在张家口市流域面积为9762km2，流经万全县、怀安县、张家口市区、宣化县、宣化区、下花园区、怀来县等，干流全长106 km，在朱官屯于桑干河汇合后流至官厅水库，是官厅水库的重要水源。洋河流域形状东西向较长，南北向较短，地形总趋势西北高、东南低。流域的东北、北部和西北沿坝头一带海拔高程1200～1500m之间，西部和南部边界海拔高程一般在500～1000m之间。流域内80％以上为丘陵山区，绝大部分为荒山秃岭。流域内大部分为黄色沙壤土，并有部分砂砾土及黄粘土，沿河川地层厚且较肥沃[1]。（二）信息源遥感信息源的选择要综合考虑其光谱分辨率、空间分辨率、时间分辨率等因素，这是利用遥感图像进行土地利用分类的关键问题。美国的Landsat TM 图像是当前应用最为广泛的卫星遥感信息源之一，它可提供7个波段的信息，空间分辨率为30～120m。TM数据源各波段各有特点，可进行不同地物类型的信息提取。相关资料表明TM遥感数据各波段间的信息相关关系为：TM1与TM2，TM5与TM7高度相关，相关系数达0.95以上，信息冗余大，可以考虑不选取TM1波段。另外由于第6个波段的分辨率为120m，不利于地物信息的提取，所以亦不选取TM6波段。一般来说，选择图像类型时，应考虑研究区域的大小、研究的目的，以及要达到的精度要求，另外不同时相遥感图像的选择对分类精度也具有很大的影响。为了能把水域、城市与工矿用地、林地、耕地、裸地区分开，以洋河流域1987年9月17日的TM图像为信息源进行研究。本文中所使用的遥感图像处理工具为美国ERDAS公司的ERDAS IMAGINE8.4软件，它是一个功能完整的、集遥感与地理信息系统于一体的专业软件，具有数据预处理、图像解译、图像分类、矢量功能、虚拟gis等多个功能。二、现有遥感图像土地利用分类的主要方法及其分析遥感图像土地利用分类就是利用计算机通过对遥感图像中各类地物的光谱信息和空间信息进行分析，选择特征，并用一定的手段将特征空间划分为互不重叠的子空间，然后将图像中的各个像元划归到各个子空间中以实现分类[2]。按照是否有已知训练样本的分类数据，将其分为非监督分类和监督分类。它们最大的区别在于监督分类首先给定类别，而非监督分类则由图像数据本身的统计特征来确定。（一）非监督分类非监督分类是在多光谱特征空间中通过数字操作搜索像元光谱属性的自然群组的过程，这种聚类过程生成一副有m个光谱类组成的分类图。然后分析人员根据后验知识将光谱类划分或转换成感兴趣的专题信息类[3]。洋河流域内有很多山地，在图像上会产生大量的阴影，导致了像元灰度值的空间变化，这对分类结果有很大的影响。为此可以通过比值运算来去除阴影的影响，使向阳处和背阴处都毫不例外地只与地物的反射率的比值有关。常用算法：近红外波段（TM4）/红外波段（TM3），这样所得到的效果比较好，从原始图像和比值运算后的图像（图像略）中，可以清楚地看到山体阴面的阴影得到了有效的去除。经过比值运算后，就可以对图像进行非监督分类。得到的分类结果如图1所示。非监督分类只根据地物的光谱特征进行分类，受人为因素的影响较少，不需要对地面信息有详细的了解，但由于“同物异谱、异物同谱”等现像的存在，其结果一般不如监督分类令人满意。比如官厅水库旁边的大量建筑物被分到水体一类。是因为在TM3波段上，水体和建筑物的灰度值相近，同样在TM7波段上，裸山和建筑物的灰度值也相近。总之，在TM的6个波段上，无论采用哪个波段进行非监督分类，总有几种地物的光谱值接近，因此单纯依靠计算机自动分类取得很好的效果是非常困难的。

遥感图像道路提取研究论文

随心所欲的写咯

杨大志付洛玲段嵘峰曹千红管相荣

（河南省国土资源厅信息中心，郑州，450003）

摘要：本文采用面向对象分类的方法，使用专业遥感图像分类软件eCognition4.0，以河南省临颍县为研究区，对处理后的临颍县SPOT5影像进行多层次分割及合并，根据分类体系定义相应知识库，进行土地利用信息提取研究，探讨该方法在高空间分辨率遥感影像应用于土地利用/土地覆被自动分类中的应用潜能，为高分辨率影像用于土地利用分类信息提取提供新技术手段。

关键词：eCognition；SPOT5；自动分类；土地利用

土地资源利用状况调查、土地资源动态监测是土地管理工作的一个重要内容。近年来，随着空间遥感技术的发展，高分辨率遥感影像在土地资源调查、土地资源动态监测等领域中的应用日益广泛。高分辨率遥感数据与多光谱和高光谱分辨率数据相比，具有空间信息丰富、地物几何结构和纹理信息更加明显、波段较少的特点。对于高分辨率的遥感影像来说，利用传统的面向像元的图像分类方法来提取土地利用分类信息，易造成分类精度低，空间数据大量冗余以及资源的浪费［1～2］。实际上，靠传统的面向像元的遥感图像分类法来提取土地利用信息已不能满足实际运用的要求。因此，基于高分辨率遥感影像土地利用分类信息提取必须根据其特点采取新的技术方法，建立起图像数据与目标特性之间的物理—机理联系，而不仅仅是统计联系，才能充分挖掘高分辨率遥感影像所包含的信息，这是高分辨率卫星影像信息处理成败的关键［3］。面向对象分类技术作为一种新的遥感影像很好地解决了这个问题，而eCognition软件正是基于面向对象方法的影像分类技术。本文就是基于该软件以河南省临颍县土地利用分类信息提取为例对该方法进行了探讨。

1 研究区概况和资料基础

研究选取河南省临颍县作为研究区。临颍县位于河南省中部，颍河上游，属漯河市，面积821km2，人口65.76 万，辖15个乡镇，362个行政村。临颍县地处颍河冲积平原，西北部较高，东南部稍低。图1是河南省临颍县SPOT5遥感影像图。

本研究主要以下述资料为研究基础。

1.1 影像数据

本次遥感图像分类采用数据为SPOT5 （2.5 m分辨率）影像数据，景带号为279/281和279/282，接收时间为2004年9月。两景数据采用Erdas 8.7软件进行处理，通过配准校正融合，选择克拉索夫斯基椭球体和高斯—克吕格投影，通过裁切，得到临颍县遥感影像数据（见图1）。

图1 河南省临颍县 SPOT5 遥感影像图

1.2 矢量数据

近年的土地利用数据库数据。

1.3 其他资料

与研究区有关的行政区划、农、林等方面的文献资料。

通过近年的土地利用数据库数据和影像数据研究可以发现临颍县土地利用类型较丰富，主要以农用地为主，地物类型比较全面，是研究土地利用/土地覆被的较好选择。

2 面向对象分类方法简介

面向对象的分类方法是一种智能化的自动影像分析方法，它的分析单元不再是单个像素，而是由若干个像素组成的像素群，即目标对象［4］。目标对象比单个像素更具有实际意义，特征的定义和分类均是基于目标对象进行的。通常面向对象的分类方法包括两个步骤：多分辨率分割和模糊逻辑分类［5］。

eCognition软件采用面向对象的遥感影像解译思想。首先根据像元光谱信息、局部区域纹理信息以及形状和尺度参数自动将影像分割为若干相对同质的区域，称为影像对象（Image objects），为下一步分类提供信息载体和构建基础［6］，所有后续的分类工作都基于这些影像对象进行，分类结果避免了斑点噪声而具有很好的整体性，改变了以往面向像素进行分类的传统。同时，软件提供最邻近法和模糊隶属度函数两种解译方法。

本研究就是采用面向对象的分类方法，以eCognition 中membership function （隶属度函数）为主，模仿目视解译过程，从遥感信息机理与地学规律的综合分析入手，综合其他辅助信息进行分类。通过对辅助资料、外业调查成果以及软件的学习得到了临颍县各类典型地物分类的知识，并以相应的形式表示这些知识，集成影像亮度值、亮度值关系和几何形状以及纹理、邻近关系等特征，对试验区土地利用/覆被进行分类。

3 分类体系和技术流程

3.1 分类体系

根据临颍县土地利用实际情况，参照历年土地利用分类标准，本次信息提取分类采取的分类体系如图2所示。

3.2 技术流程

使用eCognition软件对研究区SPOT5影像数据进行土地利用信息提取研究分如下几步进行：①把处理好的影像数据输入到软件中，定制分割参数，对其执行分割，生成影像对象；②根据研究区地物类型创建分类层次结构；③确定合适的分类方法（包括最邻近法和模糊隶属度函数两种方法），选取相应地物类型样本或者分类特征，构建知识库，执行分类，并可根据目视解译结果和事先准备的调查区资料对分类结果进行人工干预，进一步提高分类精度；④对分类结果进行分类精度评价；⑤把分类结果输出，输出的格式可以为所需要的相应的矢量格式或栅格格式。本研究的技术流程如图3所示。

图2 研究区地物类型

图3 研究技术流程图

4 主要分类过程

4.1 定制分割参数

分割参数的定制相当重要，它关系到每一个分类对象的大小，直接影响到最后的分类结果。通过多次试验，本次分类决定采用多层次分割的方法进行：水体和非水体信息的提取以分割参数为80进行，其他参数均为默认；分类体系中其他类别信息的提取在首次分割基础上，以分割参数为65，其他参数也为默认对非水体进行多重分割，来进行其他地物类型的分类。

4.2 制定分类策略，创建类层次结构

在进行分类之前，首先要参照研究区地物类型，分析每种地物类型特征及其相互之间的关系，制定合适的分类策略，创建类层次结构。可利用的研究对象属性特征包括色调、形状、面积/大小和纹理等特征，各对象之间关系包括与父对象之间、与子对象之间以及与邻对象之间的关系三种类型。对象属性特征选取正确与否及其在多大程度上被正确表达对分类结果有着重要影响，它决定了最后分类正确与否和其精度。面向对象的分类方法可以模仿人类大脑认知过程，充分利用每种地物类型特征，按照由简单到困难的顺序逐步剥离提取分类体系中每种地物信息。通过研究本次分类所要提取信息自身特征及其相互之间关系，制定本次分类的分类策略，创建了类层次结构，如图4所示。

图4 类层次结构示意图

4.3 分类特征的选取

根据创建的类层次结构，选取合适的对象属性，对对象属性进行定义，提取出相应对象的土地利用信息。本次分类采用以下几步进行：

（1）提取水体信息分割参数设为80，对影像进行分割，分割后，在整个研究区均匀选取样本，采用标准最邻近方法（Standard Nearest Neighbor）对遥感影像进行分类（类似于监督分类），提取水体信息。在此基础上，依据水体的形状特征，把水体分为河流水面和坑塘水面两类。根据实验，长宽比大于3是河流，小于3的是坑塘。

（2）提取植被信息，并进一步把植被分为耕地和林地首先把提取出的水体信息保护起来，在首次分割的基础上对非水体进行再分割，分割参数设为65，其他参数为默认值，把非水体分为植被和非植被两类，然后根据耕地和林地的不同特征把其信息提取出来。

（3）对非植被信息进一步细分，从中提取出主要交通道路、城镇居民点工矿和裸地（已收获耕地）信息首先从非植被信息中提取出交通道路和非交通道路信息，然后把非交通道路细分为裸地（已收获耕地）和城镇居民点工矿两类。

此时，分类体系中的所有类别信息已经全部提取出来，可根据实际情况对分类结果进行手工编辑，进一步删除一些过小对象和纠正一些错分信息。当分得的各类信息结果都比较满意后，进行基于分类的融合，把小对象合并为大的对象，通过手工编辑和基于分类的融合后，得到最终分类结果如图5所示。

图5 遥感影像分类结果图

4.4 分类精度评价

得到分类结果后，要根据分类得到的结果进行分类精度评价。评价采用如下方法进行：在分割后的影像上均匀随机选取每个地类的目标对象，选取的目标对象数目根据分类结果得到的每个地类的目标对象数目而定，进行自动统计，得到统计结果。统计结果如表1所示。

表1 分类结果精度评价表

通过分类结果精度评价表可以发现，自动分类的最后分类精度超过了80%，这对于研究区来讲，分类结果还是比较令人满意的。同时，根据统计结果可以得到如下结论：耕地、城镇居民点、坑塘、河流信息提取的效果较好；相对而言，裸地和道路信息提取比较困难；林地信息由于同耕地信息相近，提取起来也有相当的难度，还有待于今后进一步研究。

通过研究表明，采用面向对象方法进行图像解译和信息的自动提取与面向像元方法相比具有较强优势。面向对象的分类方法可以灵活运用地物本身的几何信息和结构信息，纹理信息以及上下层关系信息、邻近关系信息等，更主要的是可以加载人的思维，构建知识库，从而提高了分类的精度，为各种不同地物的分类提供了更多的依据，比如通过影像的形状和纹理特征可以有效地识别河流、道路、建筑物的形状。利用eCognition对高分辨率遥感图像进行土地利用自动分类，快速简便，而且能够达到较高精度，节省了大量的人力物力，为大面积土地利用调查和监测提供了新的科学方法。

参考文献

丁晓英.eCognition在土地利用项目中的应用［J］.测绘与空间地理信息，2005，28 （6）：116～120

刘亚岚，阎守邕，王涛等.遥感图像分区自动分类方法研究［J］.遥感学报，2002，6 （5）：357～362

孙晓霞，张继贤，刘正军.利用面向对象的分类方法从IKONOS全色影像中提取河流和道路［J］.测绘科学，2006，31 （1）：62～63

eCognition 3 Made in Germany ［Z］

Sun Xiaoxia.An object－oriented classification method on high resolution satellite data ［Z］.ACRS2004，Istanbul

杜凤兰.面向对象的地物分类方法分析与评价［J］.遥感技术与应用，2004，19 （1）：20～23

首页

> 期刊投稿知识库

遥感图像目标检测论文