机器视觉国际研究现状论文

1研究现状及存在的问题水果实时分级系统主要功能是水果外部品质和内部品质的自动检测。水果的外部品质检测的项目有大小、形状、颜色、表面缺陷等，内部品质无损检测的项目为水果的硬度、糖含量、酸度、口味及某些内部缺陷等。1.1水果外部品质的自动检测水果的尺寸和颜色检测技术已比较成熟，且在国外已经实现自动化检测，在国内也有按重量或尺寸分级的系统。但果面的缺陷检测却一直成为水果实时分级的障碍。果面缺陷检测的技术比较复杂，目前存在以下几方面难题。1.1.1对水果整个表面进行实时视觉检测比较困难在水果分选生产线上，输送机构输送水果并把水果整个表面呈现给摄像机，这是水果实时分级系统比较关键的组成部分，因为当水果通过时，要求视觉系统能快速检查每个水果的全部果面，即使很小的缺陷面积，也会使得水果级别发生很大变化。同时，设计的视觉分级系统必须满足高生产率的要求。在这方面，国外学者（Growe,1996,Tao,1996)［1，2］采用滚子输送带使水果一边移动一边自身转动，从而使安装在输送带上方的摄像机能采集到水果的多个面的图像，达到全表面检测的目的。但由于水果大小和形状不规则，造成水果旋转速度不一致且难以保证按同一轴线旋转。此外，水果旋转两端的表面部分摄像机无法采集到，因此，分级误差较大。1.1.2快速而准确地测定水果表面的各种缺陷且与梗、萼凹陷区正确区分比较困难Miller等(1991)［3］对桃子的分选试验表明：因不能正确区分水果表面的缺陷和梗、萼凹陷区，由此产生的分级误差为25％左右。Rehkugler等（1986）［4］利用机械定向机构使苹果梗、萼处于垂直方向并绕梗萼轴旋转，CCD线扫描摄像机可扫描苹果的整个表面且形成一幅图像，该方法的特点是由机械定向机构定位水果梗、萼区，摄像机对此区不需要再检查。但因为受定向机构速度的限制，还达不到实时分级的速度，试验结果为每分钟选30个苹果。Yang(1996)［5］利用结构光图像与散射光图像相结合来区分梗、萼区和缺陷区，综合两方面图像处理的结果，共抽取16个特征参数，再利用BP神经网络区分苹果的梗、萼区和缺陷区，分辨精度为95％，但还需要进一步把试验结果应用于实际水果分选生产线中。Growe等（1996）［1］采取在780 nm附近带域内，用结构光由一黑白摄像机进行水果表面的凹陷度检测；在750 nm带域内的散射光照射下，由一黑白摄像机进行水果表面的可疑缺陷区检测。水果的输送旋转装置及摄像机布置如图1a所示，采用的双锥滚筒输送带可使水果一方面沿水平方向作平移运动，另一方面又绕自身水平轴作旋转运动。两个黑白CCD摄像机用来采集750 nm附近的散射光图像和780 nm附近的结构光图像，水果旋转一周摄取两次图像。两个黑白摄像机采集的图像经过设计的接口电路后，被合成为一幅黑白图像，合成过程如图1b所示。图像的处理由流水线图像处理系统完成。试验结果表明：每个水果采集两幅图像时，缺陷检测的速度可达5个/s，但误差较大，如对于苹果，碰伤检测的准确率仅为51％。试验表明，要想得到较高的检测精度，每个水果应采集5幅以上的图像，结构光至少6条以上。此外，由于水果尺寸不同所造成各个水果旋转速度的不一致，也是产生测量误差的原因。徐娟（1997）［6］及Nakano(1997)［7］利用人工神经网络法对缺陷区和梗萼区进行区分，试验表明神经网络的区分准确率较低。在果面各种缺陷的快速检测方面，Throop(1997)［8］等人研究了多光谱测量技术，对10个品种的苹果的22种缺陷，在460～1 030 nm光谱范围内，每隔10 nm试验测定了它们的反射光谱特性，其中对3种苹果同一种缺陷测量的结果如图2所示。图中纵坐标的马氏距离反映了水果缺陷区与正常区反射强度的差别程度，距离越大，两者差别越大。由图中曲线可看出：在中心为540 nm、740 nm、1 030 nm三波段附近，3种苹果同一缺陷与正常区的反射强度的差别表现为最大或最小值，最后通过对3个波段的图像进行简单的减法和阈值处理，即可得到检测的缺陷，下一步应考虑实际应用的实现。(a)(b)图1图像采集布置图与图像合成示意图(a)输送装置及摄像机布置(b) 图像合成示意图图23种苹果同一缺陷在460～1 030 nm范围内与正常区反射强度的差别情况1.1.3球形水果表面引起光照强度在投影面内呈曲面分布，以及二维图像上的透视区域与水果实际表面存在的畸变，给图像的缺陷检测带来困难和造成误差Tao(1996)［2］提出的球形变换法很好地解决了第一个问题。基本思想如图3所示：带缺陷的原始物体图像（OOI）与该物体反表面无缺陷的图像(IOI)相加得到变换后的物体图像（TOI），此图像具有平面物体图像的性质，而缺陷区低于该平面，然后经过简单阈值处理即可得缺陷区。何东健（1997）［9］提出了缺陷透视图像面积发生畸变的校正方法，但对复杂形状的缺陷区进行校正，还存在一定的困难。Nakano(1997)［7］利用一旋转平台使水果旋转，每旋转18°CCD摄像机采集一幅图像，苹果旋转一周可得20幅图像，为消除苹果球面面积的畸变，每幅图像只保留中间13 cm宽度的幅面，再全部合成一幅苹果整个表面的展开图像，此法非常有效，但在分选生产线上实现比较困难。图3球形变换方法1.1.4传统的图像处理及模式识别算法的速度不适合实时分选线的要求国外一般采用高速图像处理硬件与简单有效的图像处理软件相结合的途径，来实现水果的实时分级。如Yang(1996)［5］利用的是Transputer系统、结构光法和洪水算法；Growe等(1996)［1］研制的系统，图像的大部分工作由流水线图像处理硬件系统完成；Tao(1996)［2］采用的是专用Merlin图像处理系统和简单有效的球形变换法，研制的苹果分选系统已应用到水果分选生产线上，其分选速度可达3 165个/min。国内研究者（刘禾，1998，徐娟，1997，杨秀坤，1997，何东健，1997）［6，9～11］大多利用一般的微机和图像采集卡，开发了一些图像处理和模式识别的新算法，如把人工神经网络、模糊理论、遗传算法、图像形态学、分形理论、小波理论及人工智能理论用于图像特征的抽取和识别。但由于图像处理的硬件速度太低，故只能限于静态水果图像分选的算法研究。此外，水果分级的算法应具备人工分级的一些优良性能，如学习与记忆功能，因为目前的一些分级算法的训练样本都比较少，而要分级的水果品种多变且量大。1.2水果内部品质无损检测反映水果内部品质的主要指标有硬度、糖含量、酸度、口味及内部缺陷等。目前国内外研究的主要方法和存在的问题如下。1.2.1水果的硬度检测水果的硬度可间接反映水果的成熟度、运输中的抗损坏性、储藏期等。目前用于水果硬度检测的方法主要有变形法和声学法。变形法就是在一定时间内给水果施加一定的动态力或冲击力，然后根据测得的变形量确定水果的硬度。如Schmilovitch等（1995）［12］研制成功了枣子硬度自动检测系统，其原理是把枣子放在两平板之间，在上面板施加5～8 N的动态力，根据所测变形量的大小把枣子分成4个硬度等级。Delwiche(1991)［13］利用冲击法研制了苹果硬度自动检测系统，发现冲击力会造成苹果表面的轻微损伤。变形法只能测量水果表面的局部硬度，实际上，水果表面硬度变化较大，故限制了变形法的应用。声学法包括声波脉冲响应法和超声波法，声波脉冲响应法（20～1 500 Hz）就是利用一麦克风测量受轻微敲击水果的声波强度，由此确定水果的硬度。Armstrong等（1993）［14］试验研究了所测声波强度与水果硬度的关系，发现二者有很好的相关关系。此法的优点是简单、无损，且能反映水果的整体硬度，缺点是必须注意周围噪声的绝缘及机械振动的消除，此外水果形状也影响测量精度。超声波(＞20 000 Hz)法是根据超声波在水果等介质中传播时，能量衰减系数的大小来确定水果硬度。但由于水果内部含有较多气隙且各向异性，故超声波很难穿透整个水果。1.2.2糖含量、酸度、口味的自动检测糖含量、酸度比较有潜力的检测方法是近红外法（NIR）和磁共振法（MR）。近红外法又分穿透法、反射法和部分穿透法，部分穿透法原理如图4所示。穿透法对水果不适应，反射法一般用于水果表面特征的检测，因此常用的方法是部分穿透法。由图4可看出，在部分穿透法中，光线经过的路径比穿透法短，且入射光线与接收器有一夹角，此夹角的确定对测量起关键作用，此外二者之间必须加一隔板。884 nm和834 nm测得量的比值已用于桃子、苹果（Slaughter ，1995）［15］糖含量的自动测定。Slaughter等（1996）［16］对西红柿，在400～1 100 nm的光谱范围内进行部分穿透性测量试验，结果表明：800～1 000 nm范围的信息对糖含量的确定最有用，测得的相关系数r＝0.92, 但酸度测量比较困难。Mizrach(1997)［17］利用超声波法试验研究了超声波衰减系数和芒果硬度、糖含量、酸度的关系，但其超声波测量探头必须与果面接触，故限制了在线的应用。因此，利用近红外多光谱技术测定水果内部糖含量及其他成分是很有前途的，为达到实时应用的目的，应进一步确定最合适的一两个波段并与计算机视觉技术结合。磁共振及磁共振成像（MRI）技术也是测定水果内部成分的有效方法，其依据是物质内部的某些原子核（H、C、P等）在外部磁场作用下，可与射频区域的电磁波辐射相互作用。Chen等(1996)［18］利用此法对鳄梨的成熟度和鲜杏梅的糖含量进行了一些研究，得到了较好的结果。此法的主要缺点是设备昂贵。图4部分穿透法与水果的口味相关的化学成分主要是可挥发性芳香化合物，当水果成熟时，就会在周围空气中散发这种挥发性芳香气体。Benady等（1995）［19］研制的电子传感器可以测量这种气体的浓度。1.2.3水果内部缺陷的检测西瓜的内部空心用超声波检测已比较成熟。其他缺陷的检测，目前国外正研究利用X射线法、磁共振和磁共振成像技术等方法测量，因成本高及安全性等问题，故很难在农业中推广应用。2研究的途径及方向探讨水果实时分级系统的进一步研究应从两方面入手，一方面要加快水果外部品质的计算机视觉实时分选技术的研究；另一方面也要进行水果内部品质的无损检测技术的研究。因为水果分级的主要目的是选出高质量的水果，故水果内外品质的检测技术都十分重要。在水果的外部品质检测方面，应进行多种技术集成的应用研究。（1）对于水果整个表面机器视觉快速检测的问题，可采用机械与光学技术相结合，设计合理的传送机构，既保证水果在传送带上比较平稳地移动，又可由视觉系统快速检测到水果的全部表面。尽量减小因水果不规则运动造成的分级误差、损伤及图像的模糊。（2）对于果梗、萼区与缺陷的检测与视觉区分方面，应采用多光谱技术与机器视觉技术相结合，研究水果图像上可疑缺陷区的关键特征参数的抽取方法，得到简单、有效、快速的图像处理和识别方法。（3）在球形果面造成的光反射强度呈曲面分布及曲面成像面积的畸变问题，可从光照设计、图像合成及软件补偿3方面综合考虑。光照的充分设计可解决第一个问题；多幅图像的有效合成，可解决畸变问题。我们通过试验表明：一个水果至少应采集5幅图像，然后再合成为一幅，可基本保证水果整个表面上缺陷的有效检测，以避免畸变误差。软件补偿的方法必须简单而有效，以适合高速的要求。（4）在实时系统的图像处理器硬件设计方面，首先应采取先进的并行CPU芯片，如TMS320C80等；其次处理板的设计应与视觉系统结合起来考虑，如采集多路视觉信号的合成问题，机械机构与视觉系统的同步电路设计等。当然，也可引进国外比较成熟的高速图像处理主板，而其他技术可由国内自行开发，这样可以加快国内水果实时分级系统实现自动化的步伐。（5）在图像处理和识别的软件设计方面，应把传统方法与现代新方法（神经网络，并行算法，遗传算法，模糊技术，人工智能，图像形态学，分形学，小波变换等）结合起来，改变传统图像信息的超数据量表达方式，寻求图像表达与解释的新方法，力求图像处理和识别算法的快速性、有效性及鲁棒性。在水果内部品质检测方面，声学振动法是实现硬度自动检测的有效方法，但应设法消除影响测量精度的因素，并进行在生产线上的应用开发；近红外局部投射法和磁共振法是水果糖含量、酸度等内部成分自动检测的有效方法。在国内，近红外局部投射法更有应用前景，应进一步研究其通用性、稳定性和实用性；内部缺陷的无损检测应进一步研究新原理和新方法，应采取自己开发和从国外引进相结合的方式。此外，应进行多种传感器测量信息集成技术的研究，这是水果内外品质实现实时自动检测与分级的有效途径。3结语利用各种现代技术的高度集成，在水果分选生产线上同时完成水果内外品质的检测与分级是将来进一步研究的方向和目的。随着科学技术的飞速发展，在我国近期有望实现农产品品质的自动化检测与分级。

机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品（即图像摄取装置，分CMOS和CCD两种）将被摄取目标转换成图像信号，传送给专用的图像处理系统，根据像素分布和亮度、颜色等信息，转变成数字化信号；图像系统对这些信号进行各种运算来抽取目标的特征，进而根据判别的结果来控制现场的设备动作。一个典型的工业机器视觉应用系统包括如下部分：光源，镜头，CCD照相机，图像处理单元（或图像捕获卡），图像处理软件，监视器，通讯/输入输出单元等。首先采用摄像机获得被测目标的图像信号，然后通过A/ D 转换变成数字信号传送给专用的图像处理系统，根据像素分布、亮度和颜色等信息，进行各种运算来抽取目标的特征，然后再根据预设的判别准则输出判断结果，去控制驱动执行机构进行相应处理。机器视觉是一项综合技术，其中包括数字图像处理技术、机械工程技术、控制技术、光源照明技术，光学成像技术、传感器技术、模拟与数字视频技术、计算机软硬件技术、人机接口技术等。机器视觉强调实用性，要求能够适应工业现场恶劣的环境，要有合理的性价比、通用的工业接口、较高的容错能力和安全性，并具有较强的通用性和可移植性。它更强调实时性，要求高速度和高精度。视觉系统的输出并非图像视频信号，而是经过运算处理之后的检测结果，如尺寸数据。上位机如PC和PLC实时获得检测结果后，指挥运动系统或I/O系统执行相应的控制动作，如定位和分选。从视觉系统的运行环境分类，可分为PC-BASED系统和PLC-BASED系统。基于PC的系统利用了其开放性，高度的编程灵活性和良好的Windows界面，同时系统总体成本较低。以美国DATA TRANSLATION公司为例，系统内含高性能图像捕获卡，一般可接多个镜头，配套软件方面，从低到高有几个层次，如Windows95/98/NT环境下C/C++编程用DLL，可视化控件activeX提供VB和VC++下的图形化编程环境，甚至Windows下的面向对象的机器视觉组态软件，用户可用它快速开发复杂高级的应用。在基于PLC的系统中，视觉的作用更像一个智能化的传感器，图像处理单元独立于系统，通过串行总线和I/O与PLC交换数据。系统硬件一般利用高速专用ASIC或嵌入式计算机进行图像处理，系统软件固化在图像处理器中，通过类似于游戏键盘的简单装置对显示在监视器中的菜单进行配置，或在PC上开发软件然后下载。基于PLC的系统体现了可靠性高、集成化，小型化、高速化、低成本的特点，代表厂商为日本松下、德国Siemens等。德国Siemens公司在工业图像处理方面拥有超过20年经验积累，SIMATIC VIDEOMAT是第一个高性能的单色和彩色图像处理系统，并成为SIMATIC自动化系统中极重要的产品。而99年推出的SIMATIC VS710是业内第一个智能化的、一体化的、带PROFIBUS接口的、分布式的灰度级工业视觉系统，它将图像处理器、CCD、I/O集成在一个小型机箱内，提供PROFIBUS的联网方式（通讯速率达12Mbps）或集成的I/O和RS232接口。更重要的，通过PC WINDOWS下的Pro Vision参数化软件进行组态，VS 710第一次将PC的灵活性，PLC的可靠性、分布式网络技术，和一体化设计结合在一起，使得西门子在PC和PLC体系之间找到了完美的平衡。机器视觉系统在印刷包装中的应用自动印刷品质量检测设备采用的检测系统多是先利用高清晰度、高速摄像镜头拍摄标准图像，在此基础上设定一定标准；然后拍摄被检测的图像，再将两者进行对比。CCD线性传感器将每一个像素的光量变化转换成电子信号，对比之后只要发现被检测图像与标准图像有不同之处，系统就认为这个被检测图像为不合格品。印刷过程中产生的各种错误，对电脑来说只是标准图像与被检测图像对比后的不同，如污迹、墨点色差等缺陷都包含在其中。最早用于印刷品质量检测的是将标准影像与被检测影像进行灰度对比的技术，较先进的技术是以RGB三原色为基础进行对比。全自动机器检测与人眼检测相比，区别在哪里?以人的目视为例，当我们聚精会神地注视某印刷品时，如果印刷品的对比色比较强烈，则人眼可以发现的、最小的缺陷，是对比色明显、不小于0.3mm的缺陷；但依靠人的能力很难保持持续的、稳定的视觉效果。可是换一种情况，如果是在同一色系的印刷品中寻找缺陷，尤其是在一淡色系中寻找质量缺陷的话，人眼能够发现的缺陷至少需要有20个灰度级差。而自动化的机器则能够轻而易举地发现0.10mm大小的缺陷，即使这种缺陷与标准图像仅有一个灰度级的区别。但是从实际使用上来说，即便是同样的全色对比系统，其辨别色差的能力也不同。有些系统能够发现轮廓部分及色差变化较大的缺陷，而有些系统则能识别极微小的缺陷。对于白卡纸和一些简约风格的印刷品来说，如日本的KENT烟标、美国的万宝路烟标，简单地检测或许已经足够了，而国内的多数印刷品，特别是各种标签，具有许多特点，带有太多的闪光元素，如金、银卡纸，烫印、压凹凸或上光印刷品，这就要求质量检测设备必须具备足够的发现极小灰度级差的能力，也许是5个灰度级差，也许是更严格的1个灰度级差。这一点对国内标签市场是至关紧要的。标准影像与被检印刷品影像的对比精确是检测设备的关键问题，通常情况下，检测设备是通过镜头采集影像，在镜头范围内的中间部分，影像非常清晰，但边缘部分的影像可能会产生虚影，而虚影部分的检测结果会直接影响到整个检测的准确性。从这一点来说，如果仅仅是全幅区域的对比并不适合于某些精细印刷品。如果能够将所得到的图像再次细分，比如将影像分为1024dpi X 4096dpi或2048dpi X 4096dpi，则检测精度将大幅提高，同时因为避免了边缘部分的虚影，从而使检测的结果更加稳定。采用检测设备进行质量检测可提供检测全过程的实时报告和详尽、完善的分析报告。现场操作者可以凭借全自动检测设备的及时报警，根据实时分析报告，及时对工作中的问题进行调整，或许减少的将不仅仅是一个百分点的废品率，管理者可以依据检测结果的分析报告，对生产过程进行跟踪，更有利于生产技术的管理。因为客户所要求的，高质量的检测设备，不仅仅是停留在检出印刷品的好与坏，还要求具备事后的分析能力。某些质量检测设备所能做的不仅可以提升成品的合格率，还能协助生产商改进工艺流程，建立质量管理体系，达到一个长期稳定的质量标准。凹版印刷机位置控制及产品检测由设置在生产线上的摄像机连续摄取印制品的视频图像，摄像的速度在30 帧/s 以下且可调。摄像机采集到的图像，首先进行量化，将模拟信号转化成数字信号，从中抽取一张有效代表镜头内容的关键帧，并将其显示在显示器上。对于一帧图像，可采用对静止图像的分析方法来处理，通过尺寸测量和多光谱分析可识别出视频图像上各色标，得出色标间距和色标的颜色参数以及一些其他相关。由于各种因素影响，会出现各种各样的噪声，如高斯噪声、椒盐噪声及随机噪声等。噪声给图像处理带来很多困难，它对图像分割，特征提取，图像识别，具有直接的影响，因此实时采集的图像需进行滤波处理。图像滤波要求能去除图像以外的噪声，同时又要保持图像的细节。当噪声为高斯噪声时，最常使用的是线性滤波器，易于分析和实现；但线性滤波器对椒盐噪声的滤波效果很差，传统的中值滤波器能减少图像中的椒盐噪声，但效果不算理想，即充分分散的噪声被去掉，而彼此靠近的噪声会被保留下来，所以当椒盐噪声比较严重时，它的滤波效果明显变坏。本系统改进型中值滤波法。该方法首先求得噪声图像窗口中去除最大和最小灰度值像素后的中值，然后计算该中值与对应的像素灰度值的差，再与阈值相比较以确定是否用求得的值代替该像素的灰度值。图像分割在该阶段中检测出各色标并与背景分离，物体的边缘是由灰度不连续性所反映的L 边缘种类可分为两种，其一是阶跃性边缘，它两边的像素的灰度值有显著不同；其二是屋顶状边缘，它位于灰度值从增加到减小的变化转折点L对于阶跃性边缘，其二阶方向导数在边缘处呈零交叉，因而可用微分算子来做边缘检测算子。微分算子类边缘检测法类似于高空间域的高通滤波，有增加高频分量的作用，这类算子对噪声相当敏感，对于阶跃性边缘，通常可用的算子有梯度算子Sobel 算子和Kirsh 算子。对于屋顶状边缘可用拉普拉斯变换和Kirsh 算子。由于色标为长方形，且相邻边缘灰度级相差较大，故采用边缘检测来分割图像。这里采用Sobert 边缘子来进行边缘检测，它是利用局部差分算子来寻找边缘，能较好的将色标分离出来。在实际的检测过程中，采用彩色图像边缘检测方法，选择合适的彩色基(如强度、色度、饱和度等)来进行检测。根据印刷机的类型特点，即印刷机各色的颜色和版图的特点，进行多阈值处理，得到各色的二值图。将分割后的图像进行测量，通过测量值来识别物体，由于色标为形状规则的矩形，所以可对下述特征进行提取：(1) 由像素计算矩形面积，(2) 矩形度，(3) 色度(H ) 和饱和度(S )，然后根据各色标的间隔的像素点数量得到色标间的间距，与设定值比较，得到两者的差值，共进行m 次测量，取平均差值，给数字交流伺服调节部分提供相应的调节信号。以调节色辊的相对位置，从而消除或减少印刷错位。在特征提取时，对图像进行多光谱图像分析，可以定量地表示色标，如彩色数图像中像素的颜色，采用HIS 格式得到各色标颜色信息的两个参数：色度和饱和度，以此来检测油墨的质量。对各色二值图再进行统计计算或与标准图形进行样板匹配，测量印刷过程中墨屑等参数。印刷机由开卷机放卷运行依次经过各印刷单元，进行各色的印刷和烘干，由收卷机进行收卷L 每色印刷都会在印料的边沿印上以供套色用的色标，该色标线水平10mm，宽1 mm ，每个相邻颜色的标志线在套印精确时应相互平行，垂直(纵向)相巨20 mm，由设置在生产线上的摄影机连续摄取印制品的视频图像，通过尺寸测量和多光谱分析可识别出视频图像上各色标，得出色标间距和色标的颜色参数L如果相邻两色色标间隔大于或小于20 mm ，则说明套印出现了偏差。将该偏差信号送给伺服变频驱动单元，驱动交流伺服电机，使相应的套色修正辊ML上下移动来延长或缩短印料自上一单元印刷版辊到该单元印刷版辊的行程来动态修正。在现代包装工业自动化生产中，涉及到各种各样的检查、测量，比如饮料瓶盖的印刷质量检查，产品包装上的条码和字符识别等。这类应用的共同特点是连续大批量生产、对外观质量的要求非常高。通常这种带有高度重复性和智能性的工作只能靠人工检测来完成，我们经常在一些工厂的现代化流水线后面看到数以百计甚至逾千的检测工人来执行这道工序，在给工厂增加巨大的人工成本和管理成本的同时，仍然不能保证100%的检验合格率（即零缺陷），而当今企业之间的竞争，已经不允许哪怕是0。1%的缺陷存在。有些时候，如微小尺寸的精确快速测量，形状匹配，颜色辨识等，用人眼根本无法连续稳定地进行，其它物理量传感器也难有用武之地。这时，人们开始考虑把计算机的快速性、可靠性、结果的可重复性，从而引入了机器人视觉技术。一般地说，首先采用CCD照相机将被摄取目标转换成图像信号，传送给专用的图像处理系统，根据像素分布和亮度、颜色等信息，如：面积、长度、数量、位置等；最后，根据预设的容许度和其他条件输出结果，如：尺寸、角度、偏移量、个数、合格/不合格、有/无等。机器视觉的特点是自动化、客观、非接触和高精度，与一般意义上的图像处理系统相比，机器视觉强调的是精度和速度，以及工业现场环境下的可靠性。机器视觉极适用于大批量生产过程中的测量、检查和辨识，如：对IC表面印字符的辨识，食品包装上面对生产日期的辨识，对标签贴放位置的检查。在机器视觉系统中；关键技术有光源照明技术、光学镜头、摄像机、图像采集卡、图像处理卡和快速准确的执行机构等方面。在机器视觉应用系统中；好的光源与照明方案往往是整个系统成败的关键；起着非常重要的作用；它并不是简单的照亮物体而已。光源与照明方案的配合应尽可能地突出物体特征量；在物体需要检测的部分与那些不重要部份之间应尽可能地产生明显的区别；增加对比度；同时还应保证足够的整体亮度；物体位置的变化不应该影响成像的质量。在机器视觉应用系统中一般使用透射光和反射光。对于反射光情况应充分考虑光源和光学镜头的相对位置、物体表面的纹理；物体的几何形状、背景等要素。光源的选择必须符合所需的几何形状、照明亮度、均匀度、发光的光谱特性等；同时还要考虑光源的发光效率和使用寿命。光学镜头相当于人眼的晶状体；在机器视觉系统中非常重要。一个镜头的成像质量优劣；即其对像差校正的优良与否；可通过像差大小来衡量；常见的像差有球差、彗差、像散、场曲、畸变、色差等六种。摄像机和图像采集卡共同完成对物料图像的采集与数字化。高质量的图像信息是系统正确判断和决策的原始依据；是整个系统成功与否的又一关键所在。在机器视觉系统中；CCD 摄像机以其体积小巧、性能可靠、清晰度高等优点得到了广泛使用。 CCD 摄像机按照其使用的CCD 器件可以分为线阵式和面阵式两大类。线阵CCD 摄像机一次只能获得图像的一行信息；被拍摄的物体必须以直线形式从摄像机前移过；才能获得完整的图像；因此非常适合对以一定速度匀速运动的物料流的图像检测；而面阵CCD 摄像机则可以一次获得整幅图像的信息。图像信号的处理是机器视觉系统的核心；它相当于人的大脑。如何对图像进行处理和运算；即算法都体现在这里；是机器视觉系统开发中的重点和难点所在。随着计算机技术、微电子技术和大规模集成电路技术的快速发展；为了提高系统的实时性；对图像处理的很多工作都可以借助硬件完成；如DSP、专用图像信号处理卡等；软件则主要完成算法中非常复杂、不太成熟、尚需不断探索和改变的部分。从产品本身看，机器视觉会越来越趋于依靠PC技术，并且与数据采集等其他控制和测量的集成会更紧密。且基于嵌入式的产品将逐渐取代板卡式产品，这是一个不断增长的趋势。主要原因是随着计算机技术和微电子技术的迅速发展，嵌入式系统应用领域越来越广泛，尤其是其具备低功耗技术的特点得到人们的重视。另外，嵌入式操作系统绝大部分是以C语言为基础的，因此使用C高级语言进行嵌入式系统开发是一项带有基础性的工作，使用高级语言的优点是可以提高工作效率，缩短开发周期，更主要的是开发出的产品可靠性高、可维护性好、便于不断完善和升级换代等。因此，嵌入式产品将会取代板卡式产品。由于机器视觉是自动化的一部分，没有自动化就不会有机器视觉，机器视觉软硬件产品正逐渐成为协作生产制造过程中不同阶段的核心系统，无论是用户还是硬件供应商都将机器视觉产品作为生产线上信息收集的工具，这就要求机器视觉产品大量采用标准化技术，直观的说就是要随着自动化的开放而逐渐开放，可以根据用户的需求进行二次开发。当今，自动化企业正在倡导软硬一体化解决方案，机器视觉的厂商在未来5-6年内也应该不单纯是只提供产品的供应商，而是逐渐向一体化解决方案的系统集成商迈进。在未来的几年内，随着中国加工制造业的发展，对于机器视觉的需求也逐渐增多；随着机器视觉产品的增多，技术的提高，国内机器视觉的应用状况将由初期的低端转向高端。由于机器视觉的介入，自动化将朝着更智能、更快速的方向发展。

国内机器视觉研究的现状及发展趋势：早前，由于使用机器视觉的行业在我国本身就属于新兴领域，再加之视觉产品技术的普及推广不够，导致机器视觉的应用几乎是空白，即便有也只是低端方面的｡目前，随着我国配套基础建设的完善，以及技术与资金的不断积累，各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现，国内有关大专院校、研究所和企业近年来在图像和机器视觉技术领域进行了积极思索和大胆尝试，逐步开始了工业现场的应用，如制药、印刷、矿泉水瓶盖检测等领域，但真正高端的应用还很少，因此，以上相关行业的应用和发展空间还很大。

随着机器视觉技术的不断发展和推进，近年来，国内很多科研机构在机器视觉方面取得了优异成果｡例如，由北京中泰通科技发展有限公司和上海交通大学联合研制的Super—DⅡ型排爆机器人，是国家“863”计划项目支持开发的具有自主知识产权的最新实用型产品｡该机器人采用四个低光CCD摄像头，分别在机械手、爆炸物销毁器、车体前端和车体顶部的云台上各安装一个，这四个摄像头组成多方位的立体摄像观察系统，通过无线通信或有线通信方式将观察到的画面传输到操作系统的视频显示器上，便于操作人员操控机器人工作｡由于机器人的视频监控系统采用四画面切换技术，既可以单幅画面显示，又可以四幅画面同时显示，从而为操作人员掌握系统信息提供了支持和帮助。

当前，视觉技术在我国应用较多的是车牌识别｡不少科研机构或公司在车牌识别方面都已经逐渐开发出自己的产品，如北京绿睿科技公司、陕西维视公司、昆明利普视觉公司等｡其中，较具代表性的有北京绿睿科技公司研发的车牌识别系统。

机器视觉发展前景很好。机器视觉是人工智能正在快速发展的一个分支。随着人工智能技术兴起以及边缘设备算力的提升，机器视觉的应用场景不断扩展，并催生了巨大的市场。目前在我国随着配套基础建设的完善，技术、资金的积累，各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现，在机器视觉赖以普及发展的诸多因素中，有技术层面，也有商业层面，但制造业的需求是决定性。制造业的发展，带来了对机器视觉需求的提升，也决定了机器视觉将由过去单纯的采集、分析、传递数据，判断动作，逐渐朝着开放性的方向发展，这一趋势也预示着机器视觉将与自动化更进一步的融合，更加大了机器视觉的发展前景。【微信平台，沟通无限】想了解更多关于读码器的相关知识，建议到研祥金码官网了解一下，研祥金码是中国企业500强研祥高科技控股集团旗下专业从事机器视觉业务的公司。公司致力于智能读码器、显示屏领域智能化生产加工和质量检测设备的研发、生产和销售，为业界独有的国际化创新型技术企业。公司产品自上市以来，产品广泛应用于各行业。

二维机器视觉运动研究现状论文

根据我在广东粤为工业机器人学院学习的知识所知：在中国，视觉技术的应用开始于90年代，因为行业本身就属于新兴的领域，再加之机器视觉产品技术的普及不够，导致以上各行业的应用几乎空白。目前国内机器视觉大多为国外品牌。国内大多机器视觉公司基本上是靠代理国外各种机器视觉品牌起家，随着机器视觉的不断应用，公司规模慢慢做大，技术上已经逐渐成熟。随着经济水平的提高，3D机器视觉也开始进入人们的视野。3D机器视觉大多用于水果和蔬菜、木材、化妆品、烘焙食品、电子组件和医药产品的评级。它可以提高合格产品的生产能力，在生产过程的早期就报废劣质产品，从而减少了浪费节约成本。这种功能非常适合用于高度、形状、数量甚至色彩等产品属性的成像。在行业应用方面，主要有制药、包装、电子、汽车制造、半导体、纺织、烟草、交通、物流等行业，用机器视觉技术取代人工，可以提供生产效率和产品质量。例如在物流行业，可以使用机器视觉技术进行快递的分拣分类，不会出现大多快递公司人工进行分拣，减少物品的损坏率，可以提高分拣效率，减少人工劳动。

国内外二维动画发展现状及特点在三维动画盛行的时代，国产三维动画发展不尽如人意，反观二维动画却在慢慢进步。国产动画出现今天这种状况的原因主要是我国三维技术比较落后，国产动画产业体制不健全;而二维动画作为一种独特的艺术形式，它的灵动与美是不可取代的。面对新时代人们新的审美要求，国产动画不必拘泥于二维还是三维哪一种形式，配合合理的产业体制才能在世界动画舞台上展现自己的实力

二维动画的现状与发展从1906年布莱克顿的《滑稽脸上的幽默相》第一部动画片诞生至今，动画这门视觉艺术已经走过了她将近100年的历史。随着科学技术的迅猛发展，动画的表现手法也越来越丰富。因此，从不同技术手段上将其分为两种类型，即二维动画和三维动画。二维动画一般指传统的手绘动画，是通过动画师来绘制每一祯画面，最终用摄影机或扫描仪合成传递在屏幕上。而三维动画是制作人员通过计算机所安装的软件界面来操作所要制作的动画造型、背景、灯光等元素。因此，是由于制作手段上的不同将其分为两类。二维动画在动画发展史上占据着相当大的空间，直到90年代三维动画的崛起，传统的二维动画面临着新的困境。从迪士尼《米老鼠》的辉煌时代到宫崎峻的黄金王朝，二维动画从来不缺少她的忠诚拥护者。然而，越来越多的三维优秀动画片涌入了影院，逼真的人物，刺激的画面，绚丽的场景征服了所有的观众。在90年代的动画影片中我们可以发现二维动画的背景开始使用三维技术制作。这种尝试为动画片本身带来了更加神奇的效果，导演更喜欢拥有丰富，色彩绚丽的三维背景。电影《人猿泰山》中的丛林背景就是选用的三维效果，这样的影片还有很多，如《埃及王子》、《蒸汽男孩》等等。这种结合的方式是动画制作史上的一大创新，因此也被很好的继承下来。但是，《玩具总动员》的出现创造了三维动画的最高票房，接下来是《恐龙》、《怪物史莱克》、《怪物公司》等等数部三维动画巨片。这种高技术精度的动画影片一时间开始领跑世界的动画产业--数码时代宣布来临。值得我们思考的是任何艺术形式的动画都应该顺应历史潮流而发展，传统手绘动画也不例外。然而，在影视传媒充斥的当今世界，本身就蕴涵着丰富的艺术元素，二维动画影片是否能够在视觉上有更加震撼的创新是决定其现状的基本因素。就目前的二维动画影片的发展趋势来看，仍然没有里程碑式的突破。迪士尼的衰败就是最好的例子。在电影产业化高度发达的好莱坞，程式化的剧情，标准化的人物，模式化的电影音乐不得不使观众厌倦。然而在二战后突然崛起的日本动画逐渐占领了鳌头。奇幻的故事，精良的制作，风格化极强的人物造型，厚重幽雅的音乐被大部分人们所接受。由于，日本的动画也已经发展为产业化大规模生产的模式，因此也有重倒迪士尼旧辙的可能性，所以必须在风格与故事上不断的创新，在视觉冲击上的不断开辟新的技术领域，才可以走的更远。中国的二维动画就不容乐观了，与先进的动画产业国家相比较还有很大的差距。但是中国的传统动画也曾在20世纪50-60年代一度兴盛，有《大闹天宫》、《哪吒闹海》等优秀动画影片，还有中国所特有的一系列水墨动画短片，如《牧笛》、《小蝌蚪找妈妈》等。代表了中国二维动画迄今为止的最高水平，以至于现在仍无法达到和超越。由于在中国的动画市场基本还没有被开发，中国动画产业还没有形成规模，等待中国动画人需要努力的路途仍旧很遥远，因此在国际动画大环境日趋竞争激烈的形式下，全球经济一体化的趋势下，中国的动画应当加紧脚步，争取在短时间内制作出优秀的动画影片。二维动画的发展前景仍然一片生机，只要努力寻求新的结合点，与三维技术更好的结合，就一定能够在今后的动画史上大放异彩

机器视觉可以用在工业上，如自动化生产线，还可以用在医疗上+智能生活等等

视觉龙VD200配合EPSON机械手玩具定位应用现场有两个振动盘，振动盘1作用是把玩偶振动到振动盘2中，振动盘2作用是把玩偶从反面振动为正面。视觉龙的VD200视觉定位系统通过判断玩偶正反面，把玩偶处于正面的坐标值通过串口发送给机器人，机器人收到坐标后运动抓取产品，当振动盘中有很多玩偶处于反面时，VD200视觉系统需判断反面玩偶数量，当反面玩偶数量过多时，VD200视觉系统发送指令给振动盘2把反面玩偶振成正面。

视觉龙VD200配合HBR机器人视觉引导对位应用

本项目为视觉龙的VD200视觉定位系统配合HBR机械手，识别刀片正反取放定位。

机器视觉车辆检测现状调研论文

之前也是为论文苦恼了半天，网上的范文和能搜到的资料，大都不全面，一般能有个正文就不错了，而且抄袭的东西肯定不行的，关键是没有数据和分析部分，我好不容易搞出来一篇，结果还过不了审。还好后来找到文方网，直接让专业人士帮忙，效率很高，核心的部分帮我搞定了，也给了很多参考文献资料。哎，专业的事还是要找专业的人来做啊，建议有问题参考下文方网吧下面是之前文方网王老师发给我的题目，分享给大家：基于深度学习的无人机地面小目标算法研究基于视觉的智能汽车面向前方车辆的运动轨迹预测技术研究模拟射击训练弹着点检测定位技术研究基于深度卷积神经网络的空中目标识别算法的研究基于可见光图像的飞行器多目标识别及位置估计无人驾驶车辆手势指令识别研究与实现车载毫米波雷达目标检测技术研究基于多传感融合的四足机器人建图方法中老年人群跌倒风险评估的数据采集系统基于深度学习的视觉SLAM闭环检测方法研究真实图片比较视觉搜索任务的年龄效应及对策研究室内复杂场景下的视觉SLAM系统构建与研究基于双目内窥镜的软组织图像三维重建学习资源画面色彩表征影响学习注意的研究毫米波雷达与机器视觉双模探测关键技术的研究语义地图及其关键技术研究多重影响因素下的语音识别系统研究基于卷积神经网络的自主空中加油识别测量技术研究基于视觉语义的深度估计、实例分割与重建重复视觉危险刺激——本能恐惧反应的“二态型”调控机制研究低成本视觉下的三维物体识别与位姿估计面向非规则目标的3D视觉引导抓取方法及系统研究基于物体识别地理配准的跨视频行人检测定位技术研究基于结构光的非刚体目标快速三维重建关键技术研究基于机器视觉的动物交互行为与认知状态分析系统关于单目视觉实时定位与建图中的优化算法研究动态场景下无人机SLAM在智慧城市中的关键技术研究面向视觉SLAM的联合特征匹配和跟踪算法研究基于深度学习的显著物体检测基于平面波的三维超声成像方法与灵长类动物脑成像应用研究基于物体检测和地理匹配的室内融合定位技术研究基于多模态信息融合的人体动作识别方法研究基于视觉惯性里程计的SLAM系统研究基于语义信息的图像/点云配准与三维重建基于种子点选取的点云分割算法研究基于深度学习的场景文字检测与识别方法研究基于运动上下文信息学习的室内视频烟雾预警算法研究基于深度学习的垃圾分类系统设计与实现面向手机部件的目标区域检测算法的设计与实现电路板自动光照检测系统的设计与实现基于机器视觉的工件识别与定位系统的设计与实现基于深度学习的物件识别定位系统的设计与实现基于视觉四旋翼无人机编队系统设计及实现基于视觉惯导融合的四旋翼自主导航系统设计与实现面向城市智能汽车的认知地图车道层生成系统基于深度学习的智能化无人机视觉系统的设计与仿真基于知识库的视觉问答技术研究基于深度学习的火灾视频实时智能检测研究结构化道路车道线检测方法研究基于机器视觉的带式输送机动态煤量计量研究基于深度学习的小目标检测算法研究基于三维激光与视觉信息融合的地点检索算法研究动态环境下仿人机器人视觉定位与运动规划方法研究瓷砖铺贴机器人瓷砖空间定位系统研究城市街景影像中行人车辆检测实现基于无线信号的身份识别技术研究基于移动机器人的目标检测方法研究基于深度学习的机器人三维环境对象感知基于特征表示的扩展目标跟踪技术研究基于深度学习的目标检测方法研究基于深度学习的复杂背景下目标检测与跟踪动态扩展目标的高精度特征定位跟踪技术研究掩模缺陷检测仪的图像处理系统设计复杂场景下相关滤波跟踪算法研究基于多层级联网络的多光谱图像显著性检测研究基于深度结构特征表示学习的视觉跟踪研究基于深度网络的显著目标检测方法研究基于深度学习的电气设备检测方法研究复杂交通场景下的视频目标检测基于多图学习的多模态图像显著性检测算法研究基于面部视频的非接触式心率检测研究单幅图像协同显著性检测方法研究轻量级人脸关键点检测算法研究基于决策树和最佳特征选择的神经网络钓鱼网站检测研究基于深度学习的场景文本检测方法研究 RGB-D图像显著及协同显著区域检测算法研究多模态融合的RGB-D图像显著目标检测研究基于协同排序模型的RGBT显著性检测研究基于最小障碍距离的视觉跟踪研究基于协同图学习的RGB-T图像显著性检测研究基于图学习与标签传播优化模型的图像协同显著性目标检测姿态和遮挡鲁棒的人脸关键点检测算法研究基于多模态和多任务学习的显著目标检测方法研究基于深度学习的交通场景视觉显著性区域目标检测基于生物视觉机制的视频显著目标检测算法研究基于场景结构的视觉显著性计算方法研究精神分裂症患者初级视觉网络的磁共振研究基于fMRI与TMS技术研究腹侧视觉通路中结构优势效应的加工脑机接口游戏神经可塑性研究基于YOLOV3算法的FL-YOLO多目标检测系统基于深度与宽度神经网络显著性检测方法研究基于深度学习的零件识别系统设计与研究基于对抗神经网络的图像超分辨算法研究基于深度学习复杂场景下停车管理视觉算法的研究与实现镍电解状态视觉检测与分析方法研究跨界训练对提升舞者静态平衡能力的理论与方法研究施工现场人员类型识别方法的研究与实现基于深度学习的自然场景文字检测方法研究基于嵌入式的交通标志识别器的设计基于视觉感知特性与图像特征的图像质量评价

在国外，机器视觉的应用普及主要体现在半导体及电子行业，其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路：各类生产印刷电路板组装技术、设备；单、双面、多层线路板，覆铜板及所需的材料及辅料；辅助设施以及耗材、油墨、药水药剂、配件；电子封装技术与设备；丝网印刷设备及丝网周边材料等。SMT表面贴装：SMT工艺与设备、焊接设备、测试仪器、返修设备及各种辅助工具及配件、SMT材料、贴片剂、胶粘剂、焊剂、焊料及防氧化油、焊膏、清洗剂等；再流焊机、波峰焊机及自动化生产线设备。电子生产加工设备：电子元件制造设备、半导体及集成电路制造设备、元器件成型设备、电子工模具。机器视觉系统还在质量检测的各个方面已经得到了广泛的应用，并且其产品在应用中占据着举足轻重的地位。除此之外，机器视觉还用于其他各个领域。2000年来，零售商和消费者对可导致健康风险或增加零售商成本的不合格产品越来越没有忍耐力。如果视觉检测机制正确执行和管理，就可成为强大的工具用于：-保护制造商、零售商和消费者的利益，不会出现贴错标签和无法识别过敏原标签的包装-有助于保护品牌声誉-遵守行业最佳实践指南和零售商标准研究显示，65%的消费者在购买产品时会参考包装。如果包装贴错标签或标签被损坏，隐藏潜在的有害成分，这会导致产品召回、罚款、甚至是法律诉讼。有调查表明食品行业中55%的召回都是由不正确的标签所导致的，食品过敏原就是一个十分普遍的例子。视觉检测是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。自起步发展至今，已经有20多年的历史，其功能以及应用范围随着工业自动化的发展逐渐完善和推广，其中特别是目前的数字图像传感器、CMOS和CCD摄像机、DSP、FPGA、ARM等嵌入式技术、图像处理和模式识别等技术的快速发展，大大地推动了机器视觉的发展。简而言之，机器视觉解决方案就是利用机器代替人眼来作各种测量和判断。

机器人视觉的研究与实现论文

首先，我们要了解，机器人领域的视觉（Machine Vision）跟计算机领域（Computer Vision）的视觉有一些不同：机器视觉的目的是给机器人提供操作物体的信息。所以，机器视觉的研究大概有这几块：

物体识别（Object Recognition）：在图像中检测到物体类型等，这跟 CV 的研究有很大一部分交叉；

位姿估计（Pose Estimation）：计算出物体在摄像机坐标系下的位置和姿态，对于机器人而言，需要抓取东西，不仅要知道这是什么，也需要知道它具体在哪里；

相机标定（Camera Calibration）：因为上面做的只是计算了物体在相机坐标系下的坐标，我们还需要确定相机跟机器人的相对位置和姿态，这样才可以将物体位姿转换到机器人位姿。

当然，我这里主要是在物体抓取领域的机器视觉；SLAM 等其他领域的就先不讲了。

由于视觉是机器人感知的一块很重要内容，所以研究也非常多了，我就我了解的一些，按照由简入繁的顺序介绍吧：

0. 相机标定

这其实属于比较成熟的领域。由于我们所有物体识别都只是计算物体在相机坐标系下的位姿，但是，机器人操作物体需要知道物体在机器人坐标系下的位姿。所以，我们先需要对相机的位姿进行标定。内参标定就不说了，参照张正友的论文，或者各种标定工具箱；外参标定的话，根据相机安装位置，有两种方式：

Eye to Hand：相机与机器人极坐标系固连，不随机械臂运动而运动

Eye in Hand：相机固连在机械臂上，随机械臂运动而运动两种方式的求解思路都类似，首先是眼在手外（Eye to Hand）

只需在机械臂末端固定一个棋盘格，在相机视野内运动几个姿态。由于相机可以计算出棋盘格相对于相机坐标系的位姿、机器人运动学正解可以计算出机器人底座到末端抓手之间的位姿变化、而末端爪手与棋盘格的位姿相对固定不变。这样，我们就可以得到一个坐标系环

而对于眼在手上（Eye in Hand）的情况，也类似，在地上随便放一个棋盘格（与机器人基座固连），然后让机械臂带着相机走几个位姿，然后也可以形成一个的坐标环

这是目前工业流水线上最常见的场景。目前来看，这一领域对视觉的要求是：快速、精确、稳定。所以，一般是采用最简单的边缘提取+边缘匹配/形状匹配的方法；而且，为了提高稳定性、一般会通过主要打光源、采用反差大的背景等手段，减少系统变量。

目前，很多智能相机（如 cognex）都直接内嵌了这些功能；而且，物体一般都是放置在一个平面上，相机只需计算物体的三自由度位姿即可。另外，这种应用场景一般都是用于处理一种特定工件，相当于只有位姿估计，而没有物体识别。当然，工业上追求稳定性无可厚非，但是随着生产自动化的要求越来越高，以及服务类机器人的兴起。对更复杂物体的完整位姿估计也就成了机器视觉的研究热点。

2. 有纹理的物体

机器人视觉领域是最早开始研究有纹理的物体的，如饮料瓶、零食盒等表面带有丰富纹理的都属于这一类。当然，这些物体也还是可以用类似边缘提取+模板匹配的方法。但是，实际机器人操作过程中，环境会更加复杂：光照条件不确定（光照）、物体距离相机距离不确定（尺度）、相机看物体的角度不确定（旋转、仿射）、甚至是被其他物体遮挡（遮挡）。

幸好有一位叫做 Lowe 的大神，提出了一个叫做 SIFT （Scale-invariant feature transform）的超强局部特征点： Lowe, David G. "Distinctive image features from scale-invariant keypoints."International journal of computer vision 60.2 (2004): 91-110. 具体原理可以看上面这篇被引用 4万+ 的论文或各种博客，简单地说，这个方法提取的特征点只跟物体表面的某部分纹理有关，与光照变化、尺度变化、仿射变换、整个物体无关。因此，利用 SIFT 特征点，可以直接在相机图像中寻找到与数据库中相同的特征点，这样，就可以确定相机中的物体是什么东西（物体识别）。

对于不会变形的物体，特征点在物体坐标系下的位置是固定的。所以，我们在获取若干点对之后，就可以直接求解出相机中物体与数据库中物体之间的单应性矩阵。如果我们用深度相机（如Kinect）或者双目视觉方法，确定出每个特征点的 3D 位置。那么，直接求解这个 PnP 问题，就可以计算出物体在当前相机坐标系下的位姿。

↑ 这里就放一个实验室之前毕业师兄的成果当然，实际操作过程中还是有很多细节工作才可以让它真正可用的，如：先利用点云分割和欧氏距离去除背景的影响、选用特征比较稳定的物体（有时候 SIFT 也会变化）、利用贝叶斯方法加速匹配等。而且，除了 SIFT 之外，后来又出了一大堆类似的特征点，如 SURF、ORB 等。

3. 无纹理的物体

好了，有问题的物体容易解决，那么生活中或者工业里还有很多物体是没有纹理的：

我们最容易想到的就是：是否有一种特征点，可以描述物体形状，同时具有跟 SIFT 相似的不变性？不幸的是，据我了解，目前没有这种特征点。所以，之前一大类方法还是采用基于模板匹配的办法，但是，对匹配的特征进行了专门选择（不只是边缘等简单特征）。

这里，我介绍一个我们实验室之前使用和重现过的算法 LineMod： Hinterstoisser, Stefan, et al. "Multimodal templates for real-time detection of texture-less objects in heavily cluttered scenes." Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.

简单而言，这篇论文同时利用了彩色图像的图像梯度和深度图像的表面法向作为特征，与数据库中的模板进行匹配。由于数据库中的模板是从一个物体的多个视角拍摄后生成的，所以这样匹配得到的物体位姿只能算是初步估计，并不精确。但是，只要有了这个初步估计的物体位姿，我们就可以直接采用 ICP 算法（Iterative closest point）匹配物体模型与 3D 点云，从而得到物体在相机坐标系下的精确位姿。

当然，这个算法在具体实施过程中还是有很多细节的：如何建立模板、颜色梯度的表示等。另外，这种方法无法应对物体被遮挡的情况。（当然，通过降低匹配阈值，可以应对部分遮挡，但是会造成误识别）。针对部分遮挡的情况，我们实验室的张博士去年对 LineMod 进行了改进，但由于论文尚未发表，所以就先不过多涉及了。

4. 深度学习

由于深度学习在计算机视觉领域得到了非常好的效果，我们做机器人的自然也会尝试把 DL 用到机器人的物体识别中。

首先，对于物体识别，这个就可以照搬 DL 的研究成果了，各种 CNN 拿过来用就好了。有没有将深度学习融入机器人领域的尝试？有哪些难点？ - 知乎这个回答中，我提到 2016 年的『亚马逊抓取大赛』中，很多队伍都采用了 DL 作为物体识别算法。然而，在这个比赛中，虽然很多人采用 DL 进行物体识别，但在物体位姿估计方面都还是使用比较简单、或者传统的算法。似乎并未广泛采用 DL。如 @周博磊所说，一般是采用 semantic segmentation network 在彩色图像上进行物体分割，之后，将分割出的部分点云与物体 3D 模型进行 ICP 匹配。

当然，直接用神经网络做位姿估计的工作也是有的，如这篇： Doumanoglou, Andreas, et al. "Recovering 6d object pose and predicting next-best-view in the crowd." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

它的方法大概是这样：对于一个物体，取很多小块 RGB-D 数据（只关心一个patch，用局部特征可以应对遮挡）；每小块有一个坐标（相对于物体坐标系）；然后，首先用一个自编码器对数据进行降维；之后，用将降维后的特征用于训练Hough Forest。

5. 与任务/运动规划结合

这部分也是比较有意思的研究内容，由于机器视觉的目的是给机器人操作物体提供信息，所以，并不限于相机中的物体识别与定位，往往需要跟机器人的其他模块相结合。

我们让机器人从冰箱中拿一瓶『雪碧』，但是这个『雪碧』被『美年达』挡住了。我们人类的做法是这样的：先把『美年达』移开，再去取『雪碧』。所以，对于机器人来说，它需要先通过视觉确定雪碧在『美年达』后面，同时，还需要确定『美年达』这个东西是可以移开的，而不是冰箱门之类固定不可拿开的物体。当然，将视觉跟机器人结合后，会引出其他很多好玩的新东西。由于不是我自己的研究方向，所以也就不再班门弄斧了。

机器人家上有关于这个很详细的图文讲解，你可以看下，希望对你有用

视觉注意在机器人上的应用主要是目标定位、目标识别以及目标跟踪等。视觉注意一般分为自上而下的视觉注意和自上而下的视觉注意；对于在机器人上的应用主要是自上而下（目标驱动）和自下而上（早期视觉特征）在什么时间以什么方式如何很好的结合。

机器人实验教学论文

1改革措施与实践结果

1．1实验平台的建设

为了强化学生在机器人方面的实践环节，首先需要构建机器人实验平台。让学生在课堂教学中了解机器人的基本组成、工作原理等，而学生的综合分析能力和解决问题的能力只能通过实践才能得到锻炼及提升。学生通过课堂教学了解机器人的基本组成、工作原理等，通过实践锻炼提高综合分析能力和解决问题的能力。依托西安交通大学机械基础实验教学中心的资源，将现有的实验教学机器人资源进行整合，构建机器人实验教学平台，包括:开放源代码的固高等国产机器人;具有示教手持盒的日本生产的商业机器人MOTOMAN－SK16、川崎RS10N等工业机器人;进行二次开发、能够组合使用的博时机器人。在机器人实验教学中，为学生的实践环节提供了足够的教学资源。

1．2改革实验教学体系，丰富实验层次

目前的实验教学体系多数为实验教师针对某一点进行实验教学。但是机器人本身具有实践性强、学科融合范围广的特点，机器人实验已经不能仅仅依靠单独的一个实验进行支撑，需要与机械结构、轨迹规划、系统控制、传感器等技术进行融合。目前开展的机器人实验往往着重于某一方面，不同的教师由于个人研究方向不同，或者专业限制，往往开展实验项目侧重自己的方向。但在本科教学中，还需要注重学生知识面的扩展，学生应全面地了解各个方面，开拓学生的眼界，因此机器人实验应增加“广度”。系统级的机器人实验是一种全新的实验形式，它将机械结构分析、建模、传感器技术、机械控制等多学科融合。在实验项目实施中，学生以团队形式进行实验，分工明确，为学生应用多种学科知识提供了平台，培养了学生创新和团队协作能力。在结构部分，小型的博时串联机器人拆装与建模分析、慧鱼模型搭建机器人;在机器人结构实验方面，以六自由度模块化可拆装串联机器人为平台，学生可自由搭建2～6自由度五种组合方式机器人系统。该机器人各关节内部结构多样化，采用了同步齿形带传动、谐波减速传动、行星减速传动、锥齿轮传动、蜗轮蜗杆传动等多种传动方式。每一模块均为透明封装，可直观看到内部传动结构及运动形式，并可将其拆装至螺钉级。通过机器人本体装拆实验可以提高学生对机构中各种传动原理的直观认识，锻炼学生的装配能力，并以此了解零件加工工艺与特点，增强学生对机构运动形式实践的动手操作能力。慧鱼模型是一套由机械构件、传感器、控制部件组成的机电产品。在控制部分，现有的实验仪器分为商业机器人及科教公司研发机器人。商业机器人技术成熟，使用可靠，但控制源代码不开放;科教公司研发机器人源代码开放，但设备使用可靠性较差，因此实验内容需要对两种实验设备进行调整，克服两类实验设备各自的缺点，让两者互补，形成对学生的全面培养。学生在对已有的机械工业中常见机器人使用后，工业中的手持器可供学生直接操作，将教学理论与工业实践并重，学生可以直接通过控制使用了解机器人的基本轨迹规划等，将注意力集中到机器人实验的主要问题中。科教公司研发的机器人源代码开放，学生在学有余力的情况下，能够进行二次开发，将机器人控制技术与传感器技术等相结合，提高学生兴趣，培养学生的创新能力。

1．3教学方法的改革，提高学生兴趣

机器人广泛应用在各个工业领域，实验教学与其中机械部件包括连杆、齿轮、马达、涡轮等，一般工程机械制造所需要的零部件在模型中都能找到，模型中的零件可以在短时间内插装和拆卸，为学生想象力插上了翅膀，在对实际机器人拆装后，组建属于自己的机器人，提高学生兴趣，增强学生对于传动知识的理解。工程应用是互相联系，密不可分的。以实验室中固高柔性制造系统为例，机器人在中间起到了仓储、上下料作用，完全实现了自动化控制，因此在机器人实验的开发中应联系工程背景，提高学生兴趣。实验体系包括常见的机器人运动学实验、动力学分析实验、轨迹规划实验，并且需要让学生明白机器各个部分的组成，因此在实验授课时，控制类教师与机械设计类教师应联合开发机器人实验，使学生将课程中学习的知识运用到实验中，加强理论与实践的结合。在学生使用中，学生可以先从柔性制造系统进行认知机器人广泛应用在各大工业领域，然后进行机器人的拆装，了解机器人的各个组成部分，随后进行自己控制机器人的运动轨迹，对运动轨迹进行规划。在学生全面了解机器人知识后，在综合实验中，学生可以选择偏结构方面的实验，如用慧鱼模型搭建机器人;也可选择偏控制方面实验，如机器人的视觉系统的开发;也可将二者结合，设计出新的机器人结构、系统等。这是一个从认知到实践的过程，符合人的一般认知规律。机器人学科具有更新快的特点，作为教师在教学时不仅需要给学生技术指导，更应该着重培养学生对机器人技术发展趋势的了解，培养学生的创新意识，让学生尽可能参与实验的各个环节，增加学生的主观能动性，包括实验问题的提出、实验机器人的.确定、实验程序(路线)的设计以及分析总结等。只有在实验过程中，学生团队精神、创新能力、动手能力等素质才能得到培养。

1．4考评方法的改革，突出培养学生能力

目前对学生的考核较为单一，仅是考核学生最终的实验结果，不仅不能督促学生对实验结果等进行合理分析，而且对于学生在实验中的操作也忽略了，这对于机器人实验考评而言是不合理的，机器人实验作为一门实践性很强的课程，没有一个唯一确定的答案。机器人结构分析实验可以培养学生空间想象的能力，关注细节的能力，机器人轨迹规划则涉及到数学在实际生活中应用的能力，而软件编程涉及规划能力。它反映了学生的空间想象和规划能力，对新事物的敏感度、以及完成任务的执行力。因此改革学生的实验考评体系非常必要。合理的考评方式不仅能使学生掌握机器人的相关知识，而且能对学生在后期机器人研究中起到一个引导作用。目前机器人实验教学的成绩评定中遇到的突出问题，即做为项目存在的机器人实验在学生评价体系中不应该规定学生的研究范围，而应该对学生综合能力进行考察，这就需要一个多元化和标准化的考核方式。在机器人实验中，学生以小组为单位，互相配合实验，在考核过程中，学生在实验中的过程考评应该占到非常重要的地位。为了避免教师的主观影响，学生应该进行互评，将学生互相之间的评价纳入考核方法。

2结语

经过机器人实验教学改革，学生普遍反应良好，增加了学生的动手实践能力。机器人实验教学改革是一个需要长期积累、不断深化的过程，需要在不断探索中提高总体教学质量，在实际教学中需要重视实践性环节，注重激发学生的学习主动性，培养学生的研究开发兴趣和科学创新精神，激励创新思维，培养学生解决实际问题的能力和创新设计能力。

我的论文，基于STM32的多关节机器人设计，图文详细，绝对满足你的需求

网页链接

国内视觉素养研究现状论文

同意青白城观点

视觉文化时代使我们处于一个视像膨胀的“非常时期”。“眼见更为重要”，人类的经验比过去任何时候都视觉化和具象化了。视觉素养成为信息时代的大众基本素养。如今，对视觉信息的感受与处理能力在生活中普遍需要，视觉素养能力的高低将自然而然地影响人们的生活情趣与生活质量。对“美”的“解蔽”，不仅需要“明亮”的眼睛，更需要“敏感”的心灵。视觉素养培养成为必需关注的国民教育问题。艺术已走出象牙塔，视觉素养不再仅仅是艺术工作者的专利。许多人看似缺乏艺术细胞，却并非与视觉素养无缘，同样具有视觉素养的可塑性。现代社会分工中，除了专业艺术工作者，还有相当多的职业需要具备视觉素养能力进行相关的创作，如教师、大众传媒、各类设计(城市建筑设计、服饰产品设计、包装用品设计、广告影视设计、网页设计等)。他们所具备视觉素养能力的高低将深刻而广泛地影响社会的文明风貌和人们的精神状态。大众对视觉信息的“读、解、用”的修养和能力，需要经过长期的培养训练和文化熏陶才能提高，而提高的效果如何则取决于进行相关创作和应用的工作者的视觉素养。美国艺术心理学家阿恩海姆在《视觉思维》一书中曾说：“在那些致力于培育自己的感性能力的人中——艺术家——有不少人对理性采取不信任的态度，认为它是艺术的敌人；另一方面，那些从事理性思维的人，又喜欢把理性思维说成是一种完全超越了感知范围的活动。”他指出，这种根植于西方文化传统的偏见，实际上已给人类造成了不可估量的损失和危害。由于这种偏见的作用，感知与理智、艺术与科学变成相互排序、迥然相异的东西。正是由于这种分裂，艺术家把自己封闭在象牙塔内，清高孤傲，自成一体。科学家不问艺术，教育家忽视艺术，所有正规中学和大学都把艺术作为可有可无的东西，整个社会都把艺术当成生活的点缀品。这样一来，人们便丧失了一个通向真理、通向认识自身和社会的重要途径。阿尔文．托夫勒在他早期的未来学著作《第三次浪潮》中就曾指出：人类社会正在孕育三种文盲：文字文化文盲、计算机文化文盲和视觉文化文盲。扫除视觉文化文盲的根本途径就是使国民具备视觉素养。时代的发展，要求教育尤其是教育技术工作者及时关注视觉文化教育和开展视觉素养培养工程，将其纳入大众教育的必修内容之中，以期引起人们足够的关注、研究和行动。每个人在这个世界看到的并不是相同的图像。在这些不同的世界图像面前，我们怎么确定真假、辨别正误?人们总是把自己看到的世界的图像当作世界的真实，而忽略个人的差别。造成这个错误的原因是我们无法看到别人看到的图像。有没有一个独立于我们意识之外的客观世界?人们究竟能否获得一个真实世界的景象?这些问题成为认识论难以终结的哲学问题。当我们对某一件事的注意足够集中时，我们会对其他的事物视而不见。决定我们看见还是看不见的规则是什么?是习惯，是沉积已久的经验，是本能。本能决定把什么信息处理成显意识，把什么信息处理成背景。显意识是一个某些信息被淡化为背景，而某些信息被凸显的过程。因此我们所看到的世界是一个包含被淡化信息的世界，是一个经过主观处理的感知世界。决定成像的最浅层条件是社会习俗，最重要的因素是语言和理性。包含在语言文化中的价值理性常常排斥世界的多样性，因为理性总是倾向于选择那些尽量不与原来的经验和习惯相矛盾的答案。爱因斯坦说：物理世界的规律不是发现的，而是发明的。在矛盾无法调和时，理性则设法在更大的范围内得到调和。经过理性的有条不紊的加工，世界就变成了一个有意义的、有序的世界，而一个多元的世界就渐渐被驱逐于视野和意识之外。长期如此的过程，养成了人们的观察与思维的习惯，并逐步形成相对稳定的意识世界。无形之中不知不觉地局限着人们的观察视野，潜移默化地影响着人们世界观的形成——这是视觉与意识之间的深层次关系!揭示出这一点意义非凡，可以帮助我们认识到视觉素养的培养何等重要!它不仅仅事关观察习惯和文化素养的培养，更重要的是它对思想意识与世界观的形成发生着极其深刻的影响!视觉素养的培养对在世界全球化过程中保护文化的多样性具有本质的意义——人类不仅需要继承和创造多样化的文化，更要培养自身多样化的“看”的习惯并能够理解其深刻的内涵——这是视觉素养培养研究的本质意义与独特价值。人的真正的知识是以主观和客观这两个对立面的交会、融合为前提的，并且是一种经过中介而实现的活动。最重要的中介之一便是“视觉”。视觉在主观“理性”活动和客观“自然”规律之间建立了联系，视觉成为知识的来源和根据。可见，直观这个元素对我们一切知识的形成都起着奠基性的作用。直观包含无意的和有意的“看”。“无意的看”是天性、本能，“有意的看”则取决于习惯和经验。所以，有意的看对意识的形成起着决定性的选择作用。因此，培养“有意的看”的习惯，也就是在培养“人的思想意识”——人的一种最重要的素质!如何从最初级、最简单的直观开始，而逐步发展到最高级的，即美感的直观?这正是视觉素养培养研究要解决的理论和实践的课题

摄影是人们记录客观世界的一种方式，随着现代摄影技术的发展，摄影已经深刻地影响了人们的日常生活。下面是我为大家整理的摄影相关论文，供大家参考。

上好摄影课不容易，上好大学生的专业摄影课就更不容易。笔者作为一名兼职教师，在艺术教育教学第一线，通过听课、走访、问卷、调研，发现目前我们有相当一部分大学专业课老师在教学中，仍然是“老三篇”：黑板粉笔、照本宣科、缺乏激情。这种讲课从表象看很像写作文，大家都在写，但精彩的篇章不多，多系平铺直叙，;有“标签式”硬贴，“商品式”硬配之嫌。这种讲课说老实话老师是花了苦力，也费了心血的，但大学生们不买账，不喜欢，学生掌握不了应该掌握的知识，素质提不高，教学成效甚微。笔者认为，要教好大学的专业摄影课，授课教师必须讲究授课艺术。要解决这个难题，授课教师必须努力做到三个字：新、情、活。

一、精心备课，内容求“新”

内容求新，一是指对内容的开掘要深，要扩充新内容，向大学生提供足够的信息量。摄影课内容变化较快，特别是数码技术、网络技术的出现，对传统摄影的冲击较大，要适应这种变化，摄影课教学必须“与时俱进”。因此，我们不能抱住老教材不放，应该坚持“信息新、数量大、实用性、课题化”的原则来组织教学内容。摄影课只有在有限的时间里给学生提供最大量的最新的和有用的信息，他们听起来才会觉得过瘾。二是指对内容的创新和发展，要掌握其本质，占据制高点，讲到最前沿。在调研中发现，大学生对老师不满意的意见中有一条就是“我们知道的老师反复讲，我们不太懂的老师省略讲，我们不明白的老师又不讲，老师讲过后我们还是不会做”，这就是没有处理好这些问题，当然，有时是老师自己也不太清楚，怎么能讲得清楚呢?

二、细心讲解，表达含“情”

这是研究“怎么讲”的问题。

有了好的、最新的摄影知识内容，如何将它们变成可视、可听、可读、可析的对象，并通过老师的语言将各个知识点让大学生记住并掌握呢?这是另一个困惑老师的地方。笔者认为只有发挥情感的功能，细心讲解，方可解之。情感在讲课中的功能主要有如下四个：一是动力功能，即老师积极的情感能引起大学生的兴奋、激动、愉快的情智体验，使学生们充满活力，积极投身于自己感兴趣的各种课堂活动。

因此，老师上课的每一段话，都要有感情色彩，都要努力从心灵深处自然流露，当然，这首先要求老师热爱学生、热爱教育事业，这样的话，大学生们就会在老师情感的动力驱动下，精神愉悦地学习，并转化为利于教学的行动。二是感染功能，即个人的情感对他人的情感具有施加影响的作用，也就是说老师的情感能感应大学生，使大学生们具有类似的情感，这表现在很多方面，如关怀、照顾、信任为主的温情式感染，以激发比、学、赶、超为主的示范式感染等。老师的关爱和信任会给学生以强烈的感染。三是调节功能，即人的情感对人的思想和行为具有调节作用。

这一点反映在师生关系上特别明显。和谐的师生关系以师生的积极情感为基础，能够激发师生的热情和智慧，唤起师生的责任感和积极性。因此，老师要热爱学生并尊重学生，及时与学生沟通，同时要情随境迁，善解人意，努力营造师生交流的和谐氛围。如给学生一种认真倾听的表情、一个信任鼓励的眼神、一种朋友商量的口吻、一封探讨问题的E-Mail等等，都会取得极好的效果。笔者认为在课堂上，师生要零距离接触，要有伙伴式交流，这有利于张扬学生个性，放飞学生思绪，使学生真正成为课堂的主人、问题的主人、学习的主人。四是迁移功能，即个人对他人的情感会迁移到与他人有关的事物。

当代大学生情感丰富，而且好激动、善迁移，他们的认识活动，常常靠情感的体验，经常因喜欢听老师的某门专业课而喜欢上这个专业，进而献身于这个事业。老师一定要以正面形象吸引和感染学生，教师对摄影艺术的执著和热爱，种种无言的、不求功利回报的关爱，对学生无疑具有强烈的亲和力和凝聚力。“其身正，不令而行;其身不正，虽令不从”。我们老师只有做一个有德有识之士，才能使大学生实现积极的情感迁移，“爱屋及乌”，从而“亲其师而信其道”。

三、用心设问，方法要“活”

这是研究“谁来讲”的问题。

一是课堂互动、连环问答。“知识是前提，表达是关键”。

摄影课上用音乐做补充，老师有意识地在师生互动讲课，指导学生课上思考、观察、讨论、写感受时，运用精选的与摄影作品相协调的、与课堂氛围相一致的音乐来“讲课”，定会取得非常好的效果。这一方法能充分调动学生动眼、动耳、动手、动脑、动心，从而实现教学目的。大学生喜欢这种氛围，在这种氛围中，他们更容易接受老师提供的知识。

二是让实践成为学生的又一老师。每节课都留下一个实践项目，精心设计一个创作主题，请同学课后做一下，下一次课时，请同学上台讲一讲实践经历。鼓励每一个同学站起来说话，表达自己的看法，从而引发大学生的学习兴趣和保持学习的注意力。有的教师可能会有这样的困惑：引发了学生的主动性，学习没有结果怎么办?其实，激发了同学的学习兴趣和使其掌握了正确的学习方法，这不就是结果吗?这种没结果的结果倒是最重要的。在经历了一个教育过程之后，无论结果是否达到，实际上这个过程本身就是结果，是无形而珍贵的结果。什么是素质?这个结果就叫素质。在很多情况下，教育的结果还没出现，但过程已经存在，在此过程中，大学生的思维方式和学习主动性发生了变化，这个变化就是素质的变化，这理应是我们教育追求的目标。同学回答问题的对与错并不重要，重要的是他敢于发表意见。学生做事有没有结果，这也不重要，他做事的过程已经很重要了。因为在这种过程中，实践在给大学生们“上课”。诚如江汉大学人文学院女生汪洋所言：“与其说摄影课是一门课，还不如说它是一面镜子，让我们学会从生活中、从实践中审视自己，审视自己的生活状态，从中得到人生的启迪和哲理。”

综上所述，高校摄影课教师在授课时，认真做到三个字：新、情、活，细心解决好讲什么、怎么讲、谁来讲的问题，一定会受到大学生们的热烈欢迎，同时也会收到良好的教学效果。

摘要：在摄影艺术中，摄影构图有着自己独特的形式规律。一幅成功的摄影作品，在进行画面布局的时候是十分讲究的，它既符合人们的生活规律，又符合人们的心理和视觉习惯。只有掌握了这些固有规律之后，在进行艺术实践的过程中，才能将最优美、最感人的艺术形象传达给受众。

关键词：对称与均衡主次关系黄金分割画面空白

一、构图的意义

构图在传统画论中称之为“章法”、“布局”、“经营位置”等。是指根据画面的需要，安排形象，体现作品的整体效果。构图作为摄影的第一步，因其创作手法的特殊性，决定了它的复杂性和丰富性。事实上，任何艺术形式都有其固有的形式规律，只有掌握了这些固有规律之后，在进行艺术实践的过程中，才能将最优美、最感人的艺术形象传达给受众。虽然摄影构图的形式规律不是死的，但了解这些形式规律可以避免一些初级的错误;掌握和运用这些形式规律，对塑造艺术形象、揭示主题思想则是一条捷径。

在设计摄影画面的构图时，最重要的一点就是构图的均衡美。在日常生活中，每个人可能都有过以下的体会：一把椅子倾斜了就会让人产生不稳定的感觉。而大多庄重、尊严的东西又是很对称的，比如古代宫殿门口的石狮子，它是成双存在的，给人以对称的美感。因此，摄影作品的画面均衡，在构图时十分重要。

二、对称和均衡在画面中的运用

对称，象征一种高度整齐的程度。比如蝴蝶，它的形体和翅翼花纹的对称美，一直为人们所欣赏，在摄影作品中对称的画面也时常可见，但大多数摄影作品，在构图中并不追求一半对一半的对称，而是刻意于画面的视觉均衡。

摄影画面布局的均衡，是人们运用视觉和心理上的习惯，对画面内全部可视形象所处的部位，进行稳定与否的一种衡量。在摄影的构图中，绝对的对称会给人一种静止、拘谨、单调的感觉，生活中人们对审美的要求仍然以追求均衡居多。过多的运用对称会使人感到呆板，缺乏活力。而均衡则是为了打破较呆板的局面，它既有“均”的一面，又有灵活的一面。结构的均衡是指画面中各部分的景物要有呼应，有对照，达到平衡和稳定。均衡的范围包括构图中形象的对比：人与人，人与物，大与小，动与静，明与暗，高与低，虚与实等等。

对摄影者来说，布局的均衡是结构理想的结果，因而处理均衡的问题，也就是处理画面结构的问题。作为摄影画面的两大组成部分，主体与陪体是表达思想内容的主要对象和辅助对象。所以在处理画面布局均衡的时候，首先要考虑的就是它们之间的呼应关系，这其中包括两者在情节上、情绪上以及动态、动势方面的呼应关系。

三、构图中的主次关系

根据主题思想要求，选择有价值的景和物，组成摄影画面。在这个画面中最能体现主题的对象，就是主体。而在画面中，那些不是最直接体现主题思想，仅对主体起到一定程度的烘托、陪衬，帮助主体说明主题思想的对象，习惯上称为陪体或周围环境。在摄影画面中要妥当的安排和处理好主次关系，避免出现零乱、主次不分，淹没或失掉主体，而造成没有主题的现象。

在设计画面时要注意主体和陪体的关系，一幅照片如果只有主体而无陪衬，画面就会显得呆板而无变化，但陪体不能喧宾夺主;主体在画面上必须显著突出，要弃繁就简，必要时可改变拍摄位置和角度，或是搬动不必要的东西，以达到画面简洁，突出主体的效果。在照片画面的主次关系上可以掌握以下两点：第一，如果遇到杂乱的背景，可以采取放大光圈的办法，让后面的背景模糊不清，以突出主体。第二，选择适宜的角度进行拍摄，避开杂乱的背景，以使人物的形象突出。

第四、构图中“黄金分割”的运用

初学摄影者最容易犯的错误，就是把最吸引人的景物放在正中间。的确，在正中间的景物是最容易吸引人的注意力的。但是，将吸引人的物体放在正中间，很容易只让人专注在那个物体上，而令画面变得呆板。

既然要避免居中，就要知道所谓的“黄金分割”，也就是“黄金比例”，将之运用于美术和摄影的构图中往往以5：8的比率来表示。另外，九宫格构图(也称井字构图)，实际上也属于黄金分割的一种形式。就是把画面按水平方向在1/3，2/3位置画两条水平线，按垂直方向在1/3，2/3位置画两条垂直线，然后把主体尽量放在交点的位置上。实际上这几个交点都符合“黄金分割定律”，是最佳的位置，当然还应考虑平衡、对比等因素。这种构图能呈现变化与动感，画面富有活力。这四个点也有不同的视觉感应，上方两点动感就比下方的强，左面又比右面强。在具体的摄影构图中，可将其应用于情节对比、虚实对比、动静对比、大小对比等。

五、处理好画面的空白

摄影构图中的空白，既有因景物本身，如：烟、云、雾、天、水、空隙所制;又有因为光与色的艺术处理所制。实体与空白的相互衬托，形成有规律的起伏节奏，产生一定的的韵律感，是摄影艺术在处理画面构图虚实关系中，广为运用的手段之一。

虚实关系在摄影画面中比较容易看出，也比较容易分辨。但在具体处理的时候，却要注意实体与空白的关系，使画面有变化、不呆板。空白常常可以刻画意境、渲染气氛，在画面中运用得当，会在构图的形式上添加积极的作用。空白还有在视觉上和心理上造成动势的功能，在运动和所注视的方向要留有一定的空白，可以给人们留下伸张的空间，造成一定的方向性，有助于加强运动的空间感。所以才有“大抵实处之妙，皆因虚处而生”之说，足见空白在构图中的重要性。

同绘画一样，摄影也是一种艺术手法，线条的明快以及画面的和谐是关键，好的构图不仅让人感觉主题明确，而且会给人以视觉和心理上的冲击。所以，摄影水平的提高，必须从构图这个环节入手。当然，构图形式也不是绝对的，它只能提供对摄影表现形式的帮助与参考。有句话说得好：规则是用来打破的。所有的规则都不是死的，吸收前人的经验对摄影的形式表现将产生积极的作用，会有利于对形式美的理解。

目前的国内各大高校在摄影系、广播电视编导系、广播电视系的本科学习阶段几乎均开设了影视摄影课，将其作为一门专业基础必修课程。笔者所在的摄影系影视摄影方向在一二年级，分别开设了《摄像技术基础》和《影视摄影造型》课。影视摄影这门课程具有很强的理论性和实践性，如何更好的进行实践教学是教师要思考和解决的重要课题。

一、合理实用的实践教学改革理念

摄影系的学生在一二年级要学习好几门以实践为主的专业基础课，在学习《影视摄影造型》课之前，先修完《摄像技术基础》。应该说是《摄像技术基础》侧重基础知识和技术的学习与训练，而《影视摄影造型》更注重培养学生的艺术感觉，创新思维和画面造型能力。同时，摄影系的学生还要开设其他相关课程，作为有益补充。笔者在讲授影视摄影课程的过程中，根据学科特点和性质，秉承“理论和实践并举，更重实践”的理念。这样做是为了改进以往影视摄影课过多的依赖课堂理论讲授，教师大多是采用上单一的填鸭式理论灌输，而疏于实践技能培养的弊端。通常根据教学大纲的制定，将理论课和实践课的课时数量设置在1：2的比例左右，教学环节按照“理论―实践―理论―实践”的节奏推进。即每次课堂理论教学的落脚点最终是指导学生实践练习和操作，将上一阶段所学到的理论知识充分转化为实践能力，提升学生的实践技能和水平。然后再进行下一阶段的“理论课―实践课”学习。如在《摄像技术基础》课上，教师讲授完数字高清摄像机的基本基本原理和曝光控制白平衡调节等理论知识后，便在下一阶段课时中安排进行实践课部分，教师将学生分小组，讲解并示范摄像机的曝光与白平衡控制的操作步骤，然后指导学生分组逐个练习。在课堂上对学生出现的操作环节错误，教师及时指出并予以纠正。待此部分实践内容学生基本掌握后，再进行下一环节的“理论――实践”教学。

二、改善实践教学方法

影视摄影作为一门学科，具有很强的理论性和实践性，同时又是融技术性和艺术性于一体的学科。在实践创作中，一名影视摄影师艺术创意的体现有赖于扎实的技术素养和水平。而检验一个学生理论知识扎实与否的落脚点，就是看他的实践能力如何。因此，如何上好实践课以提升学生的专业实践能力，是影视摄影专业任课教师面临的重要问题。笔者根据数年的教学经历和改革尝试，通常在理论教学时采用全班集体授课方式。而在实践课环节，采用分小组示范讲解，学生分小组练习实践的小班化学习方式。考虑到现在的每个自然班学生人数较多，而实验器材相对有限的现实状况，教师每次指导学生分小组时将组员人数控制在6人左右。每个小组成员人数不宜过多的目的，就在于确保每个学生在实践课上都有足够的时间量来练习操作。无论是课堂实践练习，还是课下的实践作业以及期末结课作业，学生都以这个相对固定的小组完成实践拍摄。

1、利用多媒体技术，提升教学效果

在实践课上，教师利用多媒体影像技术手段，结合优秀的影视作品案例，对学生在实践过程中出现的普遍性和个别性错误进行对比和指导。教师可以选取摄影画面优秀的影视作品片段，对比学生实践作业中出现的问题进行分析、讲解和指导。例如学生在练习使用摄像机拍摄固定机位不同景别画面的实践内容时，初学者普遍存在的问题就是景别取景不规范，镜头与镜头之间景别运用不合理或景别过于单一等问题。这时任课教师利用多媒体为学生播放一些优秀影视作品中景别运用规范的镜头片段，然后来对比学生学生实践作业中普遍出现的错误案例，帮助学生分析问题所在并寻找解决办法。

在这个环节，教师避免局限于单方面的讲授知识和技法，而是采用引导学生对比自己的练习作业进行思考，检查，分组讨论，分析问题，积极调动学生的积极性，营造活跃互动的课堂氛围。这样，学生会在积极思考热情参与的状态下，更好的将专业理论和实践相结合，从而提高自身的实践水平。此外在课堂练习中，现使用的数字高清摄像机普遍具有USB串行接口，学生可以直接将拍摄练习的作业素材拷贝至教室内的多媒体电脑中。教师现场对学生拍完的练习素材进行回放，讲解。这样可以确保在实践课堂第一时间内就发现学生存在的问题。教师及时给学生指出问题症状，并和学生一起讨论解决办法。

2、根据学生特点，帮助学生制定拍摄主题和计划

影视摄影的实践需要学生调动自己多方面的能力，是一个“脑眼手”综合运用的过程。它需要摄影师用眼睛细致观察，大脑积极思考，最后由手(和身体)来掌控摄像机来完成操作和拍摄。因此影视摄影的实践创作考验的是一个人的综合协调能力。在分组拍摄中，它还考验着学生团队协作和沟通的能力。教师会根据自然班的学生数量、结构和特点，指导他们合理分组搭配，制定合理的拍摄进度安排，时间周期控制。有拍摄采访对象的，教师会指导学生如何与拍摄对象沟通(尽管如何采访不是影视摄影课的重点)。甚至在拍摄时长较长的期末结课作业时，教师要讲授一些制片管理方面的知识，对于拍摄过程中有可能出现的一些制片方面的困难，提醒学生提前做好备选方案和计划。对于大幅度更改实践作业拍摄计划和方案的，指导学生调动现有资源和条件，尽可能拍摄出更好的影像效果。

3、扩展实践教学空间，紧跟行业发展趋势

影视摄影这门学科有一个显著特点，就是随着科学技术的发展，新的创作设备和拍摄理念层出不穷，更新换代的速度极快。例如笔者刚从事教学工作时，当时行业内领先的是数字全高清技术。几年的时间，现今行业内的发展趋势是4K技术，数字电影摄影创作，log模式拍摄甚至是未来VR技术的使用。这一切都意味着无论是专业教师、学生还是从业者，要想从事影视摄影这项职业，就必须要保持对新鲜事物的好奇心，保持一个不断学习新知识的状态。也只有这样，我们培养的学生才会在未来的专业发展道路中越走越宽，不被行业淘汰。基于此，教师积极利用互联网上的相关专业知识和信息资源，结合课堂实践内容。为学生拓宽知识面。例如在介绍行业领先的RED和ARRI数字电影摄影机的知识，市面上常见的纸质教材和资料鲜有这方面内容。

教师搜索专业的技术网站，寻找适当的资料截取成视频影像，做成图片PPT和文字介绍，选取业内专家对此摄影机性能指标的介绍和使用注意事项，所有这些都可以作为实践教学的补充。不但激发了学生的学习兴趣和热情，更是将影视摄影行业内先进的知识和理念带给学生，让他们及时掌握专业发展趋势和动态。此外，专业的影视摄影交流网站和信息公众号也是教师指导学生拓宽知识面的好渠道。专业性比较强的影视工业网、拍电影网、V电影网，微信电影摄影师公众号，摄像人公众号等等，经常会有业内人士发表的技术文章和创作心得，教师会经常选取有用信息介绍给学生。这些网站一般还设有作品交流专区，学生可以将自己拍摄的作品放到这个板块内进行交流，听取更多业内人士的意见。这样，学生获取专业知识和实践经验的领域不仅仅局限在课堂和校园，他们有更多的可能接受更前沿的专业讯息，提升自己的实践水平。三、实践作业点评

1、学生实践作品课堂展示

每次的实践作业后和期末结课作业之后，教师会安排每个小组将自己的作品用多媒体在课堂上公开展示，教师现场进行点评。这也是影视摄影课实践教学中不可或缺的重要组成部分。在课堂展示的过程中，小组成员会阐释自己的创作思路及理念，讲述拍摄过程中遇到的难题和解决办法，以及尚未解决的技术和艺术问题等等。教师如此安排是为了深入了解学生的实践创作过程。学生实践创作的过程，是检验他们对理论知识掌握程度的具体和真实体现。反映在学生作品中的一些问题，有些是大家普遍存在的，有些则是每个小组甚至每个学生的个别存在的。每个小组的学生在展示并介绍自己实践作业拍摄经历时，其他同学也会反观自身作品中存在的问题。好的实践经验可以得到印证并分享，存在的问题就需要由教师引导学生思考。必要时候教师可以明确指出，以帮助学生提高专业水平，在下一次的拍摄中取得进步。

2、保护并激发学生的创作热情

首页

> 学术发表知识库

机器视觉国际研究现状论文