首页

> 期刊论文知识库

首页 期刊论文知识库 问题

物体检测论文汇总

发布时间:

物体检测论文汇总

钢结构无损检测 摘要:通过对应用于建筑钢结构行业中的几种常规无损检测方法的简述,归纳了被检对象所适用的不同无 损检测方法。为广大工程技术人员和管理人员了解、学习、应用无损检测技术提供参考。 关键词:建筑钢结构;无损检测 1 前言 建筑钢结构由于其强度高、工业化程度高以及综合经济效益好等优点,自上世纪 90 年代,特别是近年来得 到了迅猛发展,广泛应用于工业和民用等领域。由于一些重点工程,建筑钢结构发生了严重的质量事故, 如郑州中原博览中心网架曾发生了崩塌事故,所以建筑钢结构的安全性和可靠性越来越受到重视。 建筑钢结构的安全性和可靠性源于设计,其自身质量则源于原材料、加工制作和现场安装等因素。评价建 筑钢结构的安全性和可靠性一般有三种方式:⑴模拟实验;⑵破坏性实验;⑶无损检测。模拟实验是按一 定比例模拟建筑钢结构的规格、材质、结构形式等,模拟在其运行环境中的工作状态,测试、评价建筑钢 结构的安全性和可靠性。模拟实验能对建筑钢结构的整体性能作出定量评价,但其成本高,周期长,工艺 复杂。破坏性实验是采用破坏的方式对抽样试件的性能指标进行测试和观察。破坏性实验具有检测结果精 确、直观、误差和争议性比较小等优点,但破坏性实验只适用于抽样,而不能对全部工件进行实验,所以 不能得出全面、综合的结论。无损检测则能对原材料和工件进行 100%检测,且经济成本相对较低。 上世纪 50 年代初,无损检测技术通过前苏联进入我国。作为工艺过程控制和产品质量控制的手段,如今在 核电、航空、航天、船舶、电力、建筑钢结构等行业中得到广泛的应用,创造了巨大的经济效益和社会效 益。无损检测技术是建立在众多学科之上的一门新兴的、综合性技术。无损检测技术是以不损伤被检对象 的结构完整性和使用性能为前提,应用物理原理和化学现象,借助先进的设备器材,对各种原材料,零部 件和结构件进行有效的检验和测试,借以评价它们的完整性、连续性、致密性、安全性、可靠性及某些物 理性能。无损检测经历了三个阶段,即无损探伤(Non-destructive Inspection,简称 NDI)、无损检测 (Non-destructive testing,简称 NDT)、无损评价(Non-destructive Evaluation,简称 NDE)、无损 探伤的含义是探测和发现缺陷。无损检测不仅仅要探测和发现缺陷,而且要发现缺陷的大小、位置、当量、 性质和状态。无损评价的含义则更广泛、更深刻, 它不仅要求发现缺陷,探测被检对象的结构、性质、状 态,还要求获得更全面、更准确的,综合的信息,从而评价被检对象的运行状态和使用寿命。应用于钢结 构行业中的常规无损检测方法有磁粉检测(Magnetic Testing 简称 MT)、渗透检测(Penetrate Testing, 简称 PT)、涡流检测(Eddy current Testing 简称 ET)、声发射检测(Acoustic Emission Testing 简称 AET)、超声波检测(Ultrasonic Testing,简称 UT)、射线检测(Radiography Testing,简称 RT)。在 建筑钢结构行业中,按检测缺陷产生的时机,无损检测方法可以按下图分类。 2 检测方法的简述 磁粉检测(MT) 原理 铁磁性材料被磁化后,产生在被检对象上的磁力线均匀分布。由于不连续性的存在,使工件表面和近表面 的磁力线发生了局部畸变而产生了漏磁场,漏磁场吸附施加在被检对象表面的磁粉,形成在合适光照下可 见的磁痕,从而达到检测缺陷的目的。 适用范围 可以对铁磁性原材料,如钢板、钢管、铸钢件等进行检测,也可以对铁磁性结构件进行检测。 局限性 仅适用铁磁性材料及其合金的表面和近表面的缺陷检测,对检测人员的视力、工作场所、被检对象的规格、 形状等有一定的要求。 优点 经济、方便、效率高、灵敏度高、检测结果直观。 渗透检测(PT) 原理 在被检对象表面施加含有荧光染料或着色染料的渗透液,渗透液在毛细血管的作用下,经过一定时间 后,渗透液可以渗透到表面开口的缺陷中去。经过去除被检对象表面多余的渗透液,干燥后,再在被检对 象表面施加吸附介质(显象剂)。同样在毛细血管的作用下,显象剂吸附缺陷中的渗透液,使渗透液回渗 到显象剂中,在一定的光照下,缺陷中的渗透液被显示。从而达到检测缺陷的目的。 适用范围 适用于非多孔状固体表面开口缺陷。 局限性 仅适用于表面开口缺陷的检测,而且对被检对象的表面光洁度要求较高,涂料、铁锈、氧化皮会覆盖表面 缺陷而造成漏检。对检测人员的视力有一定要求,成本相对较高。 优点 设备轻便、操作简单,检测灵敏度高,结果直观、准确。 涡流检测(ET) 原理 金属材料在交变磁场的作用下产生了涡流,根据涡流的分布和大小可以检测出铁磁性材料和非铁磁性材料 的缺陷。 适用范围 适用于各种导电材料的表面和近表面的缺陷检测。 局限性 不适用不导电材料检测,对形状复杂的试件很难应用,比较适合钢管、钢板等形状规则的轧制型材的检测, 而且设备较贵;无法判定缺陷的性质。 优点 检测速度快,生产效率高,自动化程度高。 声发射检测(AET) 原理 材料或结构件受到内力或外力的作用产生形变或断裂时, 以弹性波的形式释放出应变能的现象称为声发射, 也称为应力波发射。声发射检测是通过受力时材料内部释放的应力波判断被检对象内部结构损伤程度的一 种新兴动态无损检测技术。 适用对象 适用于被检对象的动态监测,如对大型桥梁、核电设备的实时动态监测。 局限性 无法监测静态缺陷、干扰检测的因素较多;设备复杂、价格较贵、检测技术不太成熟。 优点 可以远距离监控设备的运行情况和缺陷的扩展情况,对结构的安全性和可靠性评价提供依据。 超声波检测(UT) 原理 超声波是指频率大于 20 千兆赫兹的机械波。根据波动传播时介质的振动方向相对于波的传播方向不同,可 将波动分为纵波、横波、表面波和板波等。用于钢结构检测的主要是纵波和横波。 超声波探伤仪激励探头产生的超声波在被检对象的介质中按一定速度传播,当遇到异面介质(如气孔、夹 渣)时,一部分超声波反射回来,经仪器处理后,放大进入示波屏,显示缺陷的回波。 适用对象 适用于各类焊逢、板材、管材、棒材、锻件、铸件以及复合材料的检测,特别适合厚度较大的工件。 局限性 检测结果可追溯性较差;定性困难,定量不精确,人为因素较多;对被检工件的材质规格,几何形状有一 定要求。 优点 检测成本低、速度快、周期短、效率高;仪器小、操作方便;能对缺陷进行精确定位;对面积型缺陷的检 出率较高(如裂纹、未熔合等) 射线检测(RT) 原理 射线是一种波长短、频率高的电磁波。 射线检测,常规使用×射线机或放射性同位素作为放射源产生射线,射线穿过被检对象,经过吸收和衰减, 由于被检试件中存在厚度差的原因,不同强度的射线到达记录介质(如射线胶片),射线胶片的不同部位 吸收了数量不等的光子,经过暗室处理后,底片上便出现了不同黑度的缺陷影象,从而判定缺陷的大小和 性质。 适用范围 适用较薄而不是较厚(如果工件的厚度超过 80mm 就要使用特殊设备进行检测,如加速器)的工件的内部体 积型缺陷的检测。 局限性 检测成本高、周期长,工作效率低;不适用角焊逢、板材、管材、棒材、锻件的检测;对面状的缺陷检出 率较低;对缺陷的高度和缺陷在被检对象中的深度较难确定;影响人体健康。 优点 检测结果直观、定性定量准确;检测结果有记录,可以长期保存,可追溯性较强。 3 小结 综上所述,每种无损检测方法的原理和特点各不相同,且适用的检测对象也不一样。在建筑钢结构的行业 中应根据结构的整体性能,检测成本及被检对象的规格、材质、缺陷的性质、缺陷产生的位置等诸多因素 合理选择无损检测方法。一般地,选择无损检测方法及合格等级,是设计人员依据相关规范而确定的。有 的工程,业主也有无损检测方法及合格等级的要求,这就需要供需双方相互协商了。 钢结构在加工制作及安装过程中无损检测方法的选择见表 1 被检对象 原材料检验 板材 锻件及棒材 管材 螺栓 焊接检验 坡口部位 清根部位 对接焊逢 角焊逢和 T 型焊逢 UT 检测方法 UT、MT(PT) UT(RT)、MT(PT) UT、MT(PT) UT、PT(MT) PT(MT) RT(UT)、MT(PT) UT(RT)、PT(MT) 被检对象所适用的无损检测方法见表 2 内部缺陷 表面缺陷和近表面 检测方法 UT ● ○ ● ● MT ● ● ● ● PT ● ○ ○ ● ET △ △ ● × AET △ △ △ △ 发生中缺陷检 测 检测方法 RT 被检对象 试 件 分 类 锻件 铸件 压延件(管、板、型材) 焊逢 × ● × ● 分层 疏松 气孔 内部 缩孔 缺陷 未焊透 未熔合 缺陷 分类 夹渣 裂纹 白点 表面裂纹 表面 缺陷 表面气孔 折叠 断口白点 × × ● ● ● △ ● ○ × △ ○ — × ● ○ ○ ○ ● ● ○ ○ ○ △ × — × — — — — — — — — — ● △ ○ ● — — — — — — — — — ● ● ○ ● — — — — — — — — — ● △ ○ — — — — — △ △ △ △ △ △ — — — 注:●很适用;○适用;△有附加条件适用;×不适用;—不相关 参 1. 考 文 献 强天鹏 射线检测 [M] 云南科技出版社 2001 2. 3. 4. 5. 周在杞等 张俊哲等 无损检测技术及其应用 [M] 科学出版社 王小雷 锅炉压力容器无损检测相关知识 [M] 李家伟等 无损检测 冉启芳 2001 1993 [M] 机械工业出版社 2002 无损检测方法的分类及其特征的介绍 [J] 无损检测 1999 2 钢网架结构超声波检测及其质量的分 [J] 无损检测 2001 6 磁粉检测(MT) 磁粉检测(MT) 原理 铁磁性材料被磁化后,产生在被检对象上的磁力线均匀分布。由于不连续性的存在,使工件表面和近表面 的磁力线发生了局部畸变而产生了漏磁场,漏磁场吸附施加在被检对象表面的磁粉,形成在合适光照下可 见的磁痕,从而达到检测缺陷的目的。 磁粉探伤的原理及概述 磁粉探伤的原理 磁粉探伤又称 MT 或者 MPT(Magnetic Particle Testing),适用于钢铁等磁性材料的表面附近进行探伤 的检测方法。利用铁受磁石吸引的原理进行检查。在进行磁粉探伤检测时,使被测物收到磁力的作用,将 磁粉(磁性微型粉末)散布在其表面。然后,缺陷的部分表面所泄漏出来泄露磁力会将磁粉吸住,形成指 示图案。指示图案比实际缺陷要大数十倍,因此很容易便能找出缺陷。 磁粉探伤方法 磁粉探伤检测的顺序分为前期处理、磁化、磁粉使用、观察,以及后期处理。 前期处理→磁化→磁粉使用→观察→后期处理 以下分别说明各个步骤的概要。 (1)前期处理 探探伤面如果有油脂、涂料、锈、或其他异物附着的情况下,不仅会妨碍磁粉吸附在伤痕上,而且还会出 现磁粉吸附在伤痕之外的部分形成疑私图像的情况。因此在磁化之前,要采用物理或者化学处理,进行去 除污垢异物的步骤。 (2)磁化 将检测物适当磁化是非常重要的。通常,采用与伤痕方向与磁力线方向垂直的磁化方式。另外为了适当磁 化,根据检测物的形状可以采用多种方法。日本工业规格(JIS G 0565-1992)中规定了以下 7 种磁化方法。 ①轴通电法……在检测物轴方向直接通过电流。 ②直角通电法……在检测物垂直于轴的方向直接通过电流。 ③Prod 法……在检测物局部安置 2 个电极(称为 Prod)通过电流。 ④电流贯通法……在检测物的孔穴中穿过的导电体中通过电流。 ⑤线圈法……在检测物中放入线圈,在线圈中通过电流。 ⑥极间法……把检测物或者要检测的部位放入电磁石或永磁石的磁极间。 ⑦磁力线贯通法……对通过检测物的孔穴的强磁性物体施加交流磁力线,使感应电流通过检测物。 (3)磁粉使用磁粉探伤的原理 ① 磁粉的种类 为了让磁粉吸附在伤痕部的磁极间形成检出图像,使用的磁粉必须容易被伤痕部的微弱磁场磁化,吸附在 磁极上,也就是说需要优秀的吸附性能。另外,要求形成的磁粉图像必须有很高的识别性。 一般,磁粉探伤中使用的磁粉有在可见光下使用的白色、黑色、红色等不同磁粉,以及利用荧光发光的荧 光磁粉。另外,根据磁粉使用的场合,有粉状的干性磁粉以及在水或油中分散使用的湿性磁粉。 ② 磁粉的使用时间 磁粉使用时间分为一边通过磁化电流一边使用磁粉的连续法,以及在切断磁化电流的状态即利用检测物的 残留磁力的残留法两种。 (4)观察 为了便于观察附着在伤痕部位的磁粉图像,必须创造容易观察的环境。普通磁粉需要在尽可能明亮的环境 下观察,荧光磁粉则要使用紫外线照射灯将周围尽量变暗才容易观察。 (5)后期处理 磁粉探伤结束,检测物有可能仍作为产品或是需要送往下一个加工步骤接受机械加工等。这时就需要进行 退磁、去除磁粉、防锈处理等后期处理。 适用范围 可以对铁磁性原材料,如钢板、钢管、铸钢件等进行检测,也可以对铁磁性结构件进行检测。 局限性 仅适用铁磁性材料及其合金的表面和近表面的缺陷检测,对检测人员的视力、工作场所、被检对象的规格、 形状等有一定的要求。 优点 经济、方便、效率高、灵敏度高、检测结果直观。 生产厂家: 生产厂家:济宁联永超声电子有限公司 仪器设备名称: 仪器设备名称:CDX-Ⅲ该机型磁粉探伤仪 Ⅲ 仪器概况:CDX-Ⅲ该机型磁粉探伤仪是具有多种磁化方式的磁粉探 伤仪设备。仪器采用可控硅作无触点开关,噪音小、寿命长、操作简 单、方便、适应性强、工作稳定。是最近推出新产品,它除具有便携 式机种的一切优点,还具有移动机种的某些长处,扩展了用途,简化 了操作,还具有退磁功能。 该设备有四种探头: 1、旋转探头: 型)能对各种焊缝、各种几何形状的曲面、平面、 (E 管道、锅炉、球罐等压力容器进行一次性全方位显示缺陷和伤痕。 2、电磁轭探头: 型)它配有活关节,可以对平面、曲面工件进行 (D 探伤。 3、马蹄探头: 型)它可以对各种角焊缝,大型工件的内外角进行 (A 局部探伤。 4、磁环: 型)它能满足所有能放入工件的周向裂纹的探伤,用它 (O 来检测工件的疲劳痕(疲劳裂痕均垂于轴向)及为方便,用它还可以 对工件进行远离法退磁。 总之,该仪器是多种探伤仪的给合体,功能与适用范围广,尤其应用 于不允许通电起弧破表面零件的探伤。 无损检测概论及新技术应用 无损检测概论及新技术应用 概论 摘要: 摘要:综述了无损检测的定义、方法、特点、要求等基本知识,以及无损检测在 现今社会中的应用实例,其中包括混凝土超声波无损检测技术、涡流无损检测技 术、渗透探伤技术。 关键词: 关键词:无损检测;混凝土缺陷;涡流检测;渗透探伤。 引言: 引言:随着现代工业的发展,对产品的质量和结构的安全性、使用的可靠性提出 了越来越高的要求,无损检测技术由于具有不破坏试件、检测灵敏度高等优点, 所以其应用日益广泛。无损检测是工业发展必不可少的有效工具,在一定程度上 反映了一个国家的工业发展水平,其重要性已得到公认。 1、 无损检测概论 、 无损检测 检测概论 无损检测就是利用声、光、磁和电等特性,在不损害或不影响被检对象使用 性能的前提下,检测被检对象中是否存在缺陷或不均匀性,给出缺陷的大小、位 置、性质和数量等信息,进而判定被检对象所处技术状态(如合格与否、剩余寿 命等)的所有技术手段的总称。 常用的无损检测方法有射线照相检验(RT)、超声检测(UT)、磁粉检测(MT)和 液体渗透检测(PT) 四种。 其他无损检测方法: 涡流检测(ET)、 声发射检测 (AT) 、 (TIR) 泄漏试验 、 (LT) 交流场测量技术 、 (ACFMT) 漏磁检验 、 (MFL)、 热像/红外 远场测试检测方法(RFT)等。 基于以上方法,无损检测具有一下应用特点: 1>不损坏试件材质、结构 无损检测的最大特点就是能在不损坏试件材质、 结构的前提下进行检测, 所以实施无损检测后,产品的检查率可以达到 100%。但是,并不是所有需要测 试的项目和指标都能进行无损检测,无损检测技术也有自身的局限性。某些试验 只能采用破坏性试验, 因此, 在目前无损检测还不能代替破坏性检测。 也就是说, 对一个工件、材料、机器设备的评价,必须把无损检测的结果与破坏性试验的结 果互相对比和配合,才能作出准确的评定。 2>正确选用实施无损检测的时机 在无损检测时, 必须根据无损检测的目的,正确选择无损检测的时机,从而顺利 地完成检测预定目的,正确评价产品质量。 3>正确选用最适当的无损检测方法 由于各种检测方法都具有一定的特点,为提高检测结果可靠性,应根据设备 材质、制造方法、工作介质、使用条件和失效模式,预计可能产生的缺陷种类、 形状、部位和取向,选择合适的无损检测方法。 4>综合应用各种无损检测方法 任何一种无损检测方法都不是万能的,每种方法都有自己的优点和缺点。应 尽可能多用几种检测方法,互相取长补短,以保障承压设备安全运行。此外在无 损检测的应用中,还应充分认识到,检测的目的不是片面追求过高要求的“高质 量”,而是应在充分保证安全性和合适风险率的前提下,着重考虑其经济性。只 有这样,无损检测在承压设备的应用才能达到预期目的。[1] 通过各种检测方法,最终对于无损检测的要求是:不仅要发现缺陷,探测试 件的结构、状态、性质,还要获取更全面、准确和综合的信息,辅以成象技术、 自动化技术、计算机数据分析和处理技术等,与材料力学、断裂力学等学科综合 应用,以期对试件和产品的质量和性能作出全面、准确的评价。 2、 无损检测在各领域的应用 、 无损检测基于以上优点,在现今社会受到广泛关注和应用,为实际生产工作减 少了废料成本,提供了极大的方便。其中超声波检测技术、涡流检测、渗透探伤 技术、霍尔效应无损探伤技术应用极为出色。 混凝土超声无损检测 混凝土是我国建筑结构工程最为重要的材料之一,它的质量直接关系到结构 的安全。多年来,结构混凝土质量的传统检测方法是以按规定的取样方法,制作 立方体试件,在规定的温度环境下,养护 28d 时按标准实验方法测得的试件抗压 强度来评定结构构件的混凝土强度。用试件实验测得的混凝土性能指标,往往是 与结构物中的混凝土性能有一定差别。因此,直接在结构物上检测混凝土质量的 现场检测技术,已成为混凝土质量管理的重要手段。 所谓混凝土“无损检测”技术,就是要在不破坏结构构件的情况下,利用测 试仪器获取有关混凝土质量等受力功能的物理量。 因该物理量与混凝土质量之间 有较好的相互关系,可采用获取的物理量去推定混凝土质量。[2] 混凝土超声检测是用超声波探头中的压电陶瓷或其他类型的压电晶体加载某 频率的交流电压后激发出固定频率的弹性波, 在材料或结构内部传播后再由超声 波换能器接收,通过对采集的超声波信号的声速、振幅、频率以及波形等声学参 数进行分析,以此推断混凝土结构的力学特性、内部结构及其组成情况。超声波 检测可用于混凝土结构的测厚、探伤、混凝土的弹性模量测定以及混凝土力学强 度评定等方面. [3] 涡流无损检测 涡流检测的基本原理:将通有交流电的线圈置于待测的金属板上或套在待测 的金属管外。这时线圈内及其附近将产生交变磁场,使试件中产生呈旋涡状的感 应交变电流,称为涡流。涡流的分布和大小,除与线圈的形状和尺寸、交流电流 的大小和频率等有关外,还取决于试件的电导率、磁导率、形状和尺寸、与线圈 的距离以及表面有无裂纹缺陷等。因而,在保持其他因素相对不变的条件下,用 一探测线圈测量涡流所引起的磁场变化,可推知试件中涡流的大小和相位变化, 进而获得有关电导率、缺陷、材质状况和其他物理量(如形状、尺寸等)的变化或 缺陷存在等信息。但由于涡流是交变电流,具有集肤效应,所检测到的信息仅能 反映试件表面或近表面处的情况。[4] 应用:按试件的形状和检测目的的不同,可采用不同形式的线圈,通常有穿过 式、探头式和插入式线圈 3 种。穿过式线圈用来检测管材、棒材和线材,它的内 径略大于被检物件, 使用时使被检物体以一定的速度在线圈内通过, 可发现裂纹、 夹杂、凹坑等缺陷。探头式线圈适用于对试件进行局部探测。应用时线圈置于金 属板、管或其他零件上,可检查飞机起落撑杆内筒上和涡轮发动机叶片上的疲劳 裂纹等。插入式线圈也称内部探头,放在管子或零件的孔内用来作内壁检测,可 用于检查各种管道内壁的腐蚀程度等。为了提高检测灵敏度,探头式和插入式线 圈大多装有磁芯。涡流法主要用于生产线上的金属管、棒、线的快速检测以及大 批量零件如轴承钢球、汽门等的探伤(这时除涡流仪器外尚须配备自动装卸和传 送的机械装置) 、材质分选和硬度测量,也可用来测量镀层和涂膜的厚度。[5] 优缺点:涡流检测时线圈不需与被测物直接接触,可进行高速检测,易于实现 自动化,但不适用于形状复杂的零件,而且只能检测导电材料的表面和近表面缺陷, 检测结果也易于受到材料本身及其他因素的干扰。 渗透探伤技术 液体渗透检测的基本原理:零件表面被施涂含有荧光染料或着色染料的渗透 剂后,在毛细管作用下,经过一段时间,渗透液可以渗透进表面开口缺陷中;经 去除零件表面多余的渗透液后,再在零件表面施涂显像剂,同样,在毛细管的作 用下,显像剂将吸引缺陷中保留的渗透液,渗透液回渗到显像剂中,在一定的光 源下 (紫外线光或白光) 缺陷处的渗透液痕迹被现实, 黄绿色荧光或鲜艳红色) , ( , 从而探测出缺陷的形貌及分布状态。[6] 渗透检测适用于具有非吸收的光洁表面的金属、非金属,特别是无法采用磁 性检测的材料,例如铝合金、镁合金、钛合金、铜合金、奥氏体钢等的制品,可 检验锻件、铸件、焊缝、陶瓷、玻璃、塑料以及机械零件等的表面开口型缺陷。 渗透检测的优点是灵敏度较高(已能达到检测开口宽度达 的裂缝) ,检测 成本低,使用设备与材料简单,操作轻便简易,显示结果直观并可进一步作直观 验证(例如使用放大镜或显微镜观察) ,其结果也容易判断和解释,检测效率较 高。缺点是受试件表面状态影响很大并只能适用于检查表面开口型缺陷,如果缺 陷中填塞有较多杂质时将影响其检出的灵敏度。[7] 3、 结语 、 随着现代科学技术的发展,激光、红外、微波、液晶等技术都被应用于无损 检测领域,而传统的常规无损检测技术也因为现代科技的发展,大大丰富了应用 方法,如射线照相就可细分为 X 射线、γ射线、中子射线、高能 X 射线、射线 实时照相、层析照相……等多种方法。 无损检测作为一种综合性应用技术,无损检测技术经历了从无损探伤,到无 损检测,再到无损评价,并且向自动无损评价、定量无损评价发展。相信在不远 的将来, 新生的纳米材料、 微机电器件等行业的无损检测技术将会得到迅速发展。 参考文献【1】李喜孟.无损检测.机械工业出版社.2011 】 【2】父新漩. 混凝土无损检测手册.人民交通出版社.2003 】 【 3】 冯子蒙.超声波无损检测于评价的关键技术问题及其解决方案.煤矿机 】 械.2009(9) 【4】唐继强.无损检测实验.机械工业出版社.2011 】 【5】李丽茹.表面检测.机械工业出版社.2009 】 【6】国防科技工业无损检测人员资格鉴定与认证培训教材编审委员会.机械工业 出版社.2004 【7】胡学知主编. 中国劳动社会保障出版社.2007 】

对于目标检测方向并不是特别熟悉,本文记录一下RCNN, fast-RCNN, faster-RCNN, mask-RCNN这4篇有关目标检测的论文笔记和学习心得。

R-CNN的意思就是Region based,主要思路就是根据一张图像,提取多个region,再将每个Region输入CNN来进行特征的提取。因此RCNN就可以分为 Region proposals , Feature extraction 两个主要部分,提取的特征就可以输入任意一个分类器来进行分类。 模型的流程图如下:

在训练的时候,首先使用的是已经训练好的CNN网络作为特征提取器,但是由于预训练是在分类数据集上,因此在应用到检测之前要做finetune。也就是说,为了将用ImageNet数据集训练的网络应用到新的任务(检测),新的数据集(region)上,作者将原来的CNN最后的1000类的fc层,更改为了 层, 代表待检测的物体的类别数。然后,对于所有的region,如果它和ground truth的重叠率大于,就认为是正类。 对于分类器的训练,作者发现选择多大的IoU来区分正类和负类非常关键。并且,对于每一类,都会训练一个分类器。

框的回归非常重要,在对每一个region proposal使用分类器进行打分评价之后,作者使用一个回归器来预测一个新的框作为结果。这个回归器使用的特征是从CNN中提取的特征。回归器的训练中,输入是 region proposal 的 和ground truth的 ,目标是学习一种变换,使得region proposal通过该变换能够接近ground truth。同时,希望这种变换拥有尺度不变性,也就是说尺度变化的话,变换不会改变。 如下图所示,每一个regressor会学习一组参数,特征输入是pool 5的特征输出,拟合的目标是 。

Fast-RCNN 主要解决的问题是在RCNN中对于每一个region proposal都进行特征提取,会产生非常多的冗余计算,因此可以先对一张图像进行特征提取,再根据region proposal在相应的特征上进行划分得到对应region的特征(映射关系)。 这样便可以实现共享计算提高速度,但是与SPPnets不同,SPPnets在一副图像得到对应的特征后,从这张图像的特征上proposal对应的部分,采用空间金字塔池化,如下图:

RoI pooling的方法很简单,类似于空间金字塔pooling,它将proposal部分对应卷积层输出的特征(称之为RoI,因为用于做pooling的特征是 region of interest,也就是我们感兴趣的区域)划分成 块,然后对每一块求最大值,最终得到了一个 的特征图。可以看出,它只是空间金字塔pooling的一部分。 但是SPP-nets的空间金字塔也是可以求导的,那么它到底不好在哪里呢?因为当每一个RoI都可能来源于不同的图像的时候(R-CNN和SPPnets的训练策略是从一个batch的不同图像中,分别挑选一个proposal region),SPPNets的训练非常地低效,这种低效来源于在SPPnets的训练中,每个RoI的感受野都非常地大,很可能对应了原图的整个图像,因此,得到的特征也几乎对应了整张图像,所以输入的图像也就很大。 为了提高效率,Fast-RCNN首先选取 个图像,再从每个图像上选择 个RoI,这样的效率就比从每个图像提取一个RoI提高了 倍。

为了将分类和框回归结合起来,作者采用了多任务的loss,来进行联合的训练。具体来说就是将分类的loss和框回归的loss结合起来。网络的设计上非常直接,就是将RoI得到的特征接几个FC层后,分别接不同的输出层。对应于分类部分,特征会接一个softmax输出,用于分类,对于框回归部分,会接一个输出4维特征的输出层,然后分别计算loss,用于反向传播。loss的公式如下:

回归的target可以参考前面的R-CNN部分。

notes

为什么比fast还fast呢?主要原因是在这篇论文中提出了一个新的层:RPN(region proposal networks)用于替代之前的selective search。这个层还可以在GPU上运算来提高速度。 RPN的目的:

为了能够进行region proposal,作者使用了一个小的网络,在基础的卷积层输出的特征上进行滑动,这个网络输入大小为 ,输入后会映射(用 的卷积)为一个固定长度的特征向量,然后接两个并联的fc层(用 的卷积层代替),这两个fc层,一个为box-regressoin,一个为box-classification。如下图:

在每一个滑动窗口(可以参考 ),为了考虑到尽可能多的框的情况,作者设计了anchors来作为region proposal。anchors就是对于每一个滑动窗口的中心位置,在该位置对应的原图位置的基础上,按照不同的尺度,长宽比例框出 个不同的区域。然后根据这些anchors对应的原始图像位置以及区域,和ground truth,就可以给每一个滑动窗口的每一个anchor进行标记,也就是赋予label,满足一定条件标记为正类(比如和ground truth重叠大于一个值),一定条件为负类。对于正类,就可以根据ground truth和该anchor对应的原图的区域之间的变换关系(参考前面的R-CNN的框回归),得到回归器中的目标,用于训练。也就是论文中的loss function部分:

自然地,也就要求RPN的两个并联的FC层一个输出2k个值用于表示这k个anchor对应的区域的正类,负类的概率,另一个输出4k个值,用于表示框回归的变换的预测值。

对于整个网络的训练,作者采用了一种叫做 4-step Alternating Training 的方法。具体可以参考论文。

与之前的检测任务稍有不同,mask r-cnn的任务是做instance segmentation。因此,它需要对每一个像素点进行分类。 与Faster R-CNN不同,Faster R-CNN对每一个候选框产生两个输出,一个是类别,一个是bounding box的offset。Mask R-CNN新增加了一个输出,作为物体的mask。这个mask类似于ps中的蒙版。

与Faster R-CNN类似的是,Mask R-CNN同样采用RPN来进行Region Proposal。但是在之后,对于每一个RoI,mask r-cnn还输出了一个二值化的mask。

不像类别,框回归,输出都可以是一个向量,mask必须保持一定的空间信息。因此,作者采用FCN来从每个RoI中预测一个 的mask。

由于属于像素级别的预测问题,就需要RoI能够在进行特征提取的时候保持住空间信息,至少在像素级别上能够对应起来。因此,传统的取最大值的方法就显得不合适。 RoI Pooling,经历了两个量化的过程: 第一个:从roi proposal到feature map的映射过程。 第二个:从feature map划分成7*7的bin,每个bin使用max pooling。

为此,作者使用了RoIAlign。如下图

为了避免上面提到的量化过程

可以参考

作者使用ResNet作为基础的特征提取的网络。 对于预测类别,回归框,mask的网络使用如下图结构:

整体看完这几篇大佬的论文,虽说没有弄清楚每一个实现细节,但是大体上了解了算法的思路。可以看出,出发点都源于深度神经网络在特征提取上的卓越能力,因此一众大神试图将这种能力应用在检测问题中。从R-CNN中简单地用于特征提取,到为了提高速度减少计算的Fast R-CNN,再到为了将region proposal集成进入整个模型中,并且利用GPU加速的RPN,也就是Faster R-CNN。再到为了应用于instance segmentation任务中,设计的RoIAlign和mask。包括bounding box regression,pooling层的设计,训练方法的选择,loss的设计等等细节,无一不体现了大师们的思考和创造力。 可能在我们这些“拿来”者的眼中,这些方法都显得“理所应当”和巧妙,好用,但是,它们背后隐藏的选择和这些选择的思考却更值得我们学习。 以及,对待每一个问题,如何设计出合理的解决方案,以及方案的效率,通用性,更是应该我们努力的方向。

2019目标检测论文汇总

原文: Scalable Object Detection using Deep Neural Networks——学术范 最近,深度卷积神经网络在许多图像识别基准上取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测了图像中每个对象类别的单个边界框和置信度得分。这样的模型捕获了围绕对象的整幅图像上下文,但如果不天真地复制每个实例的输出数量,就无法处理图像中同一对象的多个实例。在这篇论文中提出了一个显著性启发的神经网络检测模型,它预测了一组与类无关的边界框,每个框有一个分数,对应于它包含任何感兴趣的对象的可能性。该模型自然地为每个类处理数量可变的实例,并允许在网络的最高级别上进行跨类泛化。 目标检测是计算机视觉的基本任务之一。一个解决这个问题的通用范例是训练在子图像上操作的对象检测器,并在所有的场所和尺度上以详尽的方式应用这些检测器。这一范例被成功地应用于经过区别训练的可变形零件模型(DPM)中,以实现检测任务的最新结果。对所有可能位置和尺度的穷举搜索带来了计算上的挑战。随着类数量的增加,这个挑战变得更加困难,因为大多数方法都训练每个类单独的检测器。为了解决这个问题,人们提出了多种方法,从检测器级联到使用分割提出少量的对象假设。 关于对象检测的文献非常多,在本节中,我们将重点讨论利用类不可知思想和解决可伸缩性的方法。 许多提出的检测方法都是基于基于部件的模型,最近由于有区别学习和精心设计的特征,已经取得了令人印象深刻的性能。然而,这些方法依赖于在多个尺度上详尽地应用零件模板,这是非常昂贵的。此外,它们在类的数量上是可伸缩的,这对像ImageNet这样的现代数据集来说是一个挑战。 为了解决前一个问题,Lampert等人使用分支绑定策略来避免计算所有可能的对象位置。为了解决后一个问题,Song et al.使用了一个低维部件基,在所有对象类中共享。基于哈希算法的零件检测也取得了良好的结果。 另一种不同的工作,与我们的工作更接近,是基于对象可以本地化的想法,而不必知道它们的类。其中一些方法建立在自底向上无阶级分割[9]的基础上。通过这种方式得到的片段可以使用自上而下的反馈进行评分。基于同样的动机,Alexe等人使用一种廉价的分类器对对象假设是否为对象进行评分,并以这种方式减少了后续检测步骤的位置数量。这些方法可以被认为是多层模型,分割作为第一层,分割分类作为后续层。尽管它们编码了已证明的感知原理,但我们将表明,有更深入的模型,充分学习可以导致更好的结果。 最后,我们利用了DeepLearning的最新进展,最引人注目的是Krizhevsky等人的工作。我们将他们的边界盒回归检测方法扩展到以可扩展的方式处理多个对象的情况。然而,基于dnn的回归已经被Szegedy等人应用到对象掩模中。最后一种方法实现了最先进的检测性能,但由于单个掩模回归的成本,不能扩展到多个类。 我们的目标是通过预测一组表示潜在对象的边界盒来实现一种与类无关的可扩展对象检测。更准确地说,我们使用了深度神经网络(DNN),它输出固定数量的包围盒。此外,它为每个盒子输出一个分数,表示这个盒子包含一个对象的网络信任度。 为了形式化上述思想,我们将i-thobject框及其相关的置信度编码为最后一网层的节点值: Bounding box: 我们将每个框的左上角和右下角坐标编码为四个节点值,可以写成vectorli∈R4。这些坐标是归一化的w. r. t.图像尺寸,以实现图像绝对尺寸的不变性。每个归一化坐标是由最后一层的线性变换产生的。 Confidence: 置信度:包含一个对象的盒子的置信度得分被编码为单个节点valueci∈[0,1]。这个值是通过最后一个隐藏层的线性变换产生的,后面跟着一个sigmoid。 我们可以组合边界盒位置sli,i∈{1,…K}为一个线性层。同样,我们可以将所有置信区间ci,i∈{1,…K}作为一个s型层的输出。这两个输出层都连接到最后一个隐藏层 在推理时,我们的算法生成kbound盒。在我们的实验中,我们使用ek = 100和K= 200。如果需要,我们可以使用置信分数和非最大抑制在推理时获得较少数量的高置信框。这些盒子应该代表对象。因此,它们可以通过后续的分类器进行分类,实现目标检测。由于盒子的数量非常少,我们可以提供强大的分类器。在我们的实验中,我们使用另一个dnn进行分类。 我们训练一个DNN来预测每个训练图像的边界框及其置信度得分,以便得分最高的框与图像的groundtruth对象框很好地匹配。假设对于一个特定的训练例子,对象被标记为boundingboxesgj,j∈{1,…,M}。在实践中,pre- dictionary的数量远远大于groundtruthboxm的数量。因此,我们试图只优化与地面真实最匹配的预测框子集。我们优化他们的位置,以提高他们的匹配度,最大化他们的信心。与此同时,我们将剩余预测的置信度最小化,这被认为不能很好地定位真实对象。为了达到上述目的,我们为每个训练实例制定一个分配问题。Wexij∈{0,1}表示赋值:xij= 1,如果第i个预测被赋值给第j个真对象。这项任务的目标可以表示为 其中,我们使用标准化边界框坐标之间的el2距离来量化边界框之间的不同。此外,我们希望根据分配x优化盒子的可信度。最大化指定预测的置信度可以表示为  最终的损失目标结合了匹配损失和信心损失 受式1的约束。α平衡了不同损失条款的贡献。 对于每个训练例子,我们通过解决一个最佳的赋值x*的预测到真实的盒子 约束执行赋值解决方案。这是二部匹配的一种变体,是一种多项式复杂度匹配。在我们的应用程序中,匹配是非常便宜的——每幅图像中标记的对象的数量少于一打,而且在大多数情况下只有很少的对象被标记。然后,通过反向传播优化网络参数。例如,反向传播算法的一阶导数计算w、r、t、l和c 尽管上述定义的损失在原则上是足够的,但三次修改使其有可能更快地达到更好的准确性。第一个修改是对地面真实位置进行聚类,并找到这样的聚类/质心,我们可以使用这些聚类/质心作为每个预测位置的先验。因此,鼓励学习算法为每个预测位置学习一个残差到一个先验。 第二个修改涉及到在匹配过程中使用这些先验:不是将N个groundtruth位置与K个预测进行匹配,而是在K个先验和groundtruth之间找到最佳匹配。一旦匹配完成,就会像之前一样计算目标的置信度。此外,位置预测损失也不变:对于任何一对匹配的(目标,预测)位置,其损失定义为groundtruth和对应于匹配先验的坐标之间的差值。我们把使用先验匹配称为先验匹配,并假设它促进了预测的多样化。  需要注意的是,尽管我们以一种与类无关的方式定义了我们的方法,但我们可以将它应用于预测特定类的对象盒。要做到这一点,我们只需要在类的边框上训练我们的模型。此外,我们可以预测每个类的kbox。不幸的是,这个模型的参数数量会随着类的数量线性增长。此外,在一个典型的设置中,给定类的对象数量相对较少,这些参数中的大多数会看到很少有相应梯度贡献的训练示例。因此,我们认为我们的两步过程——首先本地化,然后识别——是一个更好的选择,因为它允许使用少量参数利用同一图像中多个对象类型的数据 我们使用的本地化和分类模型的网络架构与[10]使用的网络架构相同。我们使用Adagrad来控制学习速率衰减,128的小批量,以及使用多个相同的网络副本进行并行分布式训练,从而实现更快的收敛。如前所述,我们在定位损失中使用先验——这些是使用训练集上的均值来计算的。我们还使用α = 来平衡局部化和置信度损失。定位器可以输出用于推断的种植区以外的坐标。坐标被映射和截断到最后的图像区域。另外,使用非最大抑制对盒进行修剪,Jaccard相似度阈值为。然后,我们的第二个模型将每个边界框分类为感兴趣的对象或“背景”。为了训练我们的定位器网络,我们从训练集中生成了大约3000万幅图像,并对训练集中的每幅图像应用以下步骤。最后,样品被打乱。为了训练我们的本地化网络,我们通过对训练集中的每一幅图像应用以下步骤,从训练集中生成了大约3000万幅图像。对于每幅图像,我们生成相同数量的平方样本,使样本总数大约为1000万。对于每幅图像,样本被桶状填充,这样,对于0 - 5%、5 - 15%、15 - 50%、50 - 100%范围内的每个比例,都有相同数量的样本,其中被包围框覆盖的比例在给定范围内。训练集和我们大多数超参数的选择是基于过去使用非公开数据集的经验。在下面的实验中,我们没有探索任何非标准数据生成或正则化选项。在所有的实验中,所有的超参数都是通过对训练集。 Pascal Visual Object Classes (VOC)挑战是最常用的对象检测算法基准。它主要由复杂的场景图像组成,其中包含了20种不同的对象类别的边界框。在我们的评估中,我们关注的是2007版VOC,为此发布了一个测试集。我们通过培训VOC 2012展示了结果,其中包含了大约。11000张图片。我们训练了一个100框的定位器和一个基于深度网络的分类器。 我们在一个由1000万作物组成的数据集上训练分类器,该数据集重叠的对象至少为 jaccard重叠相似度。这些作物被标记为20个VOC对象类中的一个。•2000万负作物与任何物体盒最多有个Jaccard相似度。这些作物被贴上特殊的“背景”类标签。体系结构和超参数的选择遵循。 在第一轮中,定位器模型应用于图像中最大-最小中心方形作物。作物的大小调整到网络输入大小is220×220。单次通过这个网络,我们就可以得到上百个候选日期框。在对重叠阈值为的非最大抑制后,保留评分最高的前10个检测项,并通过21路分类器模型分别通过网络进行分类。最终的检测分数是给定盒子的定位分数乘以分类器在作物周围的最大方形区域上评估的分数的乘积。这些分数通过评估,并用于计算精确查全曲线。 首先,我们分析了本地化器在隔离状态下的性能。我们给出了被检测对象的数量,正如Pascal检测标准所定义的那样,与生成的包围框的数量相对比。在图1中,我们展示了使用VOC2012进行训练所获得的结果。此外,我们通过使用图像的最大中心面积(max-center square crop)作为输入以及使用两个尺度(second scale)来给出结果:最大中心面积(max-center crop)的第二个尺度(select3×3windows的大小为图像大小的60%)正如我们所看到的,当使用10个边界框的预算时,我们可以用第一个模型本地化的对象,用第二个模型本地化48%的对象。这显示出比其他报告的结果更好的性能,例如对象度算法达到42%[1]。此外,这个图表显示了在不同分辨率下观察图像的重要性。虽然我们的算法通过使用最大中心作物获得了大量的对象,但当使用更高分辨率的图像作物时,我们获得了额外的提升。进一步,我们用21-way分类器对生成的包围盒进行分类,如上所述。表1列出了VOC 2007的平均精度(APs)。达到的平均AP是,与先进水平相当。注意,我们的运行时间复杂度非常低——我们只使用top10框。示例检测和全精度召回曲线分别如图2和图3所示。值得注意的是,可视化检测是通过仅使用最大中心方形图像裁剪,即使用全图像获得的。然而,我们设法获得了相对较小的对象,例如第二行和第二列的船,以及第三行和第三列的羊。 在本工作中,我们提出了一种新的方法来定位图像中的对象,该方法可以预测多个边界框的时间。该方法使用深度卷积神经网络作为基本特征提取和学习模型。它制定了一个能够利用可变数量的groundtruth位置的多箱定位成本。在“一个类一个箱”方法的情况下,对1000个盒子进行非max-suppression,使用与给定图像中感兴趣的DeepMulti-Box方法相同的准则,并学习在未见图像中预测这些位置。 我们在VOC2007和ILSVRC-2012这两个具有挑战性的基准上给出了结果,在这两个基准上,所提出的方法具有竞争力。此外,该方法能够很好地预测后续分类器将探测到的位置。我们的结果表明,deepmultibox的方法是可扩展的,甚至可以在两个数据集之间泛化,就能够预测感兴趣的定位,甚至对于它没有训练的类别。此外,它能够捕获同一类物体的多种情况,这是旨在更好地理解图像的算法的一个重要特征。 在未来,我们希望能够将定位和识别路径折叠到一个单一的网络中,这样我们就能够在一个通过网络的一次性前馈中提取位置和类标签信息。即使在其当前状态下,双通道过程(本地化网络之后是分类网络)也会产生5-10个网络评估,每个评估的速度大约为1个CPU-sec(现代机器)。重要的是,这个数字并不与要识别的类的数量成线性关系,这使得所提出的方法与类似dpm的方法非常有竞争力。

对于目标检测方向并不是特别熟悉,本文记录一下RCNN, fast-RCNN, faster-RCNN, mask-RCNN这4篇有关目标检测的论文笔记和学习心得。

R-CNN的意思就是Region based,主要思路就是根据一张图像,提取多个region,再将每个Region输入CNN来进行特征的提取。因此RCNN就可以分为 Region proposals , Feature extraction 两个主要部分,提取的特征就可以输入任意一个分类器来进行分类。 模型的流程图如下:

在训练的时候,首先使用的是已经训练好的CNN网络作为特征提取器,但是由于预训练是在分类数据集上,因此在应用到检测之前要做finetune。也就是说,为了将用ImageNet数据集训练的网络应用到新的任务(检测),新的数据集(region)上,作者将原来的CNN最后的1000类的fc层,更改为了 层, 代表待检测的物体的类别数。然后,对于所有的region,如果它和ground truth的重叠率大于,就认为是正类。 对于分类器的训练,作者发现选择多大的IoU来区分正类和负类非常关键。并且,对于每一类,都会训练一个分类器。

框的回归非常重要,在对每一个region proposal使用分类器进行打分评价之后,作者使用一个回归器来预测一个新的框作为结果。这个回归器使用的特征是从CNN中提取的特征。回归器的训练中,输入是 region proposal 的 和ground truth的 ,目标是学习一种变换,使得region proposal通过该变换能够接近ground truth。同时,希望这种变换拥有尺度不变性,也就是说尺度变化的话,变换不会改变。 如下图所示,每一个regressor会学习一组参数,特征输入是pool 5的特征输出,拟合的目标是 。

Fast-RCNN 主要解决的问题是在RCNN中对于每一个region proposal都进行特征提取,会产生非常多的冗余计算,因此可以先对一张图像进行特征提取,再根据region proposal在相应的特征上进行划分得到对应region的特征(映射关系)。 这样便可以实现共享计算提高速度,但是与SPPnets不同,SPPnets在一副图像得到对应的特征后,从这张图像的特征上proposal对应的部分,采用空间金字塔池化,如下图:

RoI pooling的方法很简单,类似于空间金字塔pooling,它将proposal部分对应卷积层输出的特征(称之为RoI,因为用于做pooling的特征是 region of interest,也就是我们感兴趣的区域)划分成 块,然后对每一块求最大值,最终得到了一个 的特征图。可以看出,它只是空间金字塔pooling的一部分。 但是SPP-nets的空间金字塔也是可以求导的,那么它到底不好在哪里呢?因为当每一个RoI都可能来源于不同的图像的时候(R-CNN和SPPnets的训练策略是从一个batch的不同图像中,分别挑选一个proposal region),SPPNets的训练非常地低效,这种低效来源于在SPPnets的训练中,每个RoI的感受野都非常地大,很可能对应了原图的整个图像,因此,得到的特征也几乎对应了整张图像,所以输入的图像也就很大。 为了提高效率,Fast-RCNN首先选取 个图像,再从每个图像上选择 个RoI,这样的效率就比从每个图像提取一个RoI提高了 倍。

为了将分类和框回归结合起来,作者采用了多任务的loss,来进行联合的训练。具体来说就是将分类的loss和框回归的loss结合起来。网络的设计上非常直接,就是将RoI得到的特征接几个FC层后,分别接不同的输出层。对应于分类部分,特征会接一个softmax输出,用于分类,对于框回归部分,会接一个输出4维特征的输出层,然后分别计算loss,用于反向传播。loss的公式如下:

回归的target可以参考前面的R-CNN部分。

notes

为什么比fast还fast呢?主要原因是在这篇论文中提出了一个新的层:RPN(region proposal networks)用于替代之前的selective search。这个层还可以在GPU上运算来提高速度。 RPN的目的:

为了能够进行region proposal,作者使用了一个小的网络,在基础的卷积层输出的特征上进行滑动,这个网络输入大小为 ,输入后会映射(用 的卷积)为一个固定长度的特征向量,然后接两个并联的fc层(用 的卷积层代替),这两个fc层,一个为box-regressoin,一个为box-classification。如下图:

在每一个滑动窗口(可以参考 ),为了考虑到尽可能多的框的情况,作者设计了anchors来作为region proposal。anchors就是对于每一个滑动窗口的中心位置,在该位置对应的原图位置的基础上,按照不同的尺度,长宽比例框出 个不同的区域。然后根据这些anchors对应的原始图像位置以及区域,和ground truth,就可以给每一个滑动窗口的每一个anchor进行标记,也就是赋予label,满足一定条件标记为正类(比如和ground truth重叠大于一个值),一定条件为负类。对于正类,就可以根据ground truth和该anchor对应的原图的区域之间的变换关系(参考前面的R-CNN的框回归),得到回归器中的目标,用于训练。也就是论文中的loss function部分:

自然地,也就要求RPN的两个并联的FC层一个输出2k个值用于表示这k个anchor对应的区域的正类,负类的概率,另一个输出4k个值,用于表示框回归的变换的预测值。

对于整个网络的训练,作者采用了一种叫做 4-step Alternating Training 的方法。具体可以参考论文。

与之前的检测任务稍有不同,mask r-cnn的任务是做instance segmentation。因此,它需要对每一个像素点进行分类。 与Faster R-CNN不同,Faster R-CNN对每一个候选框产生两个输出,一个是类别,一个是bounding box的offset。Mask R-CNN新增加了一个输出,作为物体的mask。这个mask类似于ps中的蒙版。

与Faster R-CNN类似的是,Mask R-CNN同样采用RPN来进行Region Proposal。但是在之后,对于每一个RoI,mask r-cnn还输出了一个二值化的mask。

不像类别,框回归,输出都可以是一个向量,mask必须保持一定的空间信息。因此,作者采用FCN来从每个RoI中预测一个 的mask。

由于属于像素级别的预测问题,就需要RoI能够在进行特征提取的时候保持住空间信息,至少在像素级别上能够对应起来。因此,传统的取最大值的方法就显得不合适。 RoI Pooling,经历了两个量化的过程: 第一个:从roi proposal到feature map的映射过程。 第二个:从feature map划分成7*7的bin,每个bin使用max pooling。

为此,作者使用了RoIAlign。如下图

为了避免上面提到的量化过程

可以参考

作者使用ResNet作为基础的特征提取的网络。 对于预测类别,回归框,mask的网络使用如下图结构:

整体看完这几篇大佬的论文,虽说没有弄清楚每一个实现细节,但是大体上了解了算法的思路。可以看出,出发点都源于深度神经网络在特征提取上的卓越能力,因此一众大神试图将这种能力应用在检测问题中。从R-CNN中简单地用于特征提取,到为了提高速度减少计算的Fast R-CNN,再到为了将region proposal集成进入整个模型中,并且利用GPU加速的RPN,也就是Faster R-CNN。再到为了应用于instance segmentation任务中,设计的RoIAlign和mask。包括bounding box regression,pooling层的设计,训练方法的选择,loss的设计等等细节,无一不体现了大师们的思考和创造力。 可能在我们这些“拿来”者的眼中,这些方法都显得“理所应当”和巧妙,好用,但是,它们背后隐藏的选择和这些选择的思考却更值得我们学习。 以及,对待每一个问题,如何设计出合理的解决方案,以及方案的效率,通用性,更是应该我们努力的方向。

小目标问题在物体检测和语义分割等视觉任务中一直是存在的一个难点,小目标的检测精度通常只有大目标的一半。

CVPR2019论文: Augmentation for small object detection 提到了一些应对小目标检测的方法,笔者结合这篇论文以及查阅其它资料,对小目标检测相关技巧在本文进行了部分总结。

小目标的定义: 在MS COCO数据集中,面积小于 32*32 的物体被认为是小物体。

小目标难以检测的原因: 分辨率低,图像模糊,携带的信息少。由此所导致特征表达能力弱,也就是在提取特征的过程中,能提取到的特征非常少,这不利于我们对小目标的检测。

1、由于小目标面积太小,可以放大图片后再做检测,也就是在尺度上做文章,如FPN(Feature Pyramid Networks for Object Detection),SNIP(An Analysis of Scale Invariance in Object Detection – SNIP)。

Feature-Fused SSD: Fast Detection for Small Objects, Detecting Small Objects Using a Channel-Aware Deconvolutional Network 也是在多尺度上做文章的论文。

2、在Anchor上做文章(Faster Rcnn,SSD, FPN都有各自的anchor设计),anchor在设置方面需要考虑三个因素:

anchor的密度: 由检测所用feature map的stride决定,这个值与前景阈值密切相关。

anchor的范围: RetinaNet中是anchor范围是32~512,这里应根据任务检测目标的范围确定,按需调整anchor范围,或目标变化范围太大如MS COCO,这时候应采用多尺度测试。

anchor的形状数量: RetinaNet每个位置预测三尺度三比例共9个形状的anchor,这样可以增加anchor的密度,但stride决定这些形状都是同样的滑窗步进,需考虑步进会不会太大,如RetinaNet框架前景阈值是时,一般anchor大小是stride的4倍左右。

该部分anchor内容参考于:

3、在ROI Pooling上做文章,文章SINet: A Scale-Insensitive Convolutional Neural Network for Fast Vehicle Detection 认为小目标在pooling之后会导致物体结构失真,于是提出了新的Context-Aware RoI Pooling方法。

4、用生成对抗网络(GAN)来做小目标检测:Perceptual Generative Adversarial Networks for Small Object Detection。

1、从COCO上的统计图可以发现,小目标的个数多,占到了,但是含有小目标的图片只有,大目标所占比例为,但是含有大目标的图像却有。这说明有一半的图像是不含小目标的,大部分的小目标都集中在一些少量的图片中。这就导致在训练的过程中,模型有一半的时间是学习不到小目标的特性的。

此外,对于小目标,平均能够匹配的anchor数量为1个,平均最大的IoU为,这说明很多情况下,有些小目标是没有对应的anchor或者对应的anchor非常少的,即使有对应的anchor,他们的IoU也比较小,平均最大的IoU也才。

如上图,左上角是一个anchor示意图,右上角是一个小目标所对应的anchor,一共有只有三个anchor能够与小目标配对,且配对的IoU也不高。左下角是一个大目标对应的anchor,可以发现有非常多的anchor能够与其匹配。匹配的anchor数量越多,则此目标被检出的概率也就越大。

实现方法: 1、Oversampling :我们通过在训练期间对这些图像进行过采样来解决包含小对象的相对较少图像的问题(多用这类图片)。在实验中,我们改变了过采样率和研究不仅对小物体检测而且对检测中大物体的过采样效果

2、Copy-Pasting Strategies:将小物体在图片中复制多分,在保证不影响其他物体的基础上,增加小物体在图片中出现的次数(把小目标扣下来贴到原图中去),提升被anchor包含的概率。

如上图右下角,本来只有一个小目标,对应的anchor数量为3个,现在将其复制三份,则在图中就出现了四个小目标,对应的anchor数量也就变成了12个,大大增加了这个小目标被检出的概率。从而让模型在训练的过程中,也能够有机会得到更多的小目标训练样本。

具体的实现方式如下图:图中网球和飞碟都是小物体,本来图中只有一个网球,一个飞碟,通过人工复制的方式,在图像中复制多份。同时要保证复制后的小物体不能够覆盖该原来存在的目标。

网上有人说可以试一下lucid data dreaming Lucid Data Dreaming for Multiple Object Tracking ,这是一种在视频跟踪/分割里面比较有效的数据增强手段,据说对于小目标物体检测也很有效。

基于无人机拍摄图片的检测目前也是个热门研究点(难点是目标小,密度大)。 相关论文: The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking(数据集) Drone-based Object Counting by Spatially Regularized Regional Proposal Network Simultaneously Detecting and Counting Dense Vehicles from Drone Images Vision Meets Drones: A Challenge(数据集)

1: 2: 3: 4: 5: 6: 7:

尊敬的用户,AnchorFree拥有两个输出,其中一个用于连接开发板,另一个是官方推荐的输出,用户可以使用它将开发结果导出到其他设备。

运动物体检测论文

计算机视觉包括许多许多的方向,例如物体识别(object recognition), 物体检测(object detection),运动物体检测与追踪(object detection and tracking)等等,你想要关于什么样的论文,只需要到google的学术搜索: 中输入例如上述的英文关键词,就可以有很多很多很多的论文让你下载了。祝你好运,求最优答案

牛顿第一定律的教学研究,在中学物理教学研究中早已不是一个新问题了.许多物理教育工作者对于这一定律的教学发表了自己颇有见地的教学见解,并且得到了满意的教学效果. 当我们在教学实践中运用这些教学策略时,我们发现,确实可以取得如同一些文献中所述的预期效果.然而,当我们设计一些新的情境让学生运用牛顿第一定律去解决问题时,令我们十分吃惊的是:学生对于牛顿第一定律的掌握程度却又非常之差.这使得我们困惑不解.为何对同一教学策略教学的结果的评价出现如此之大的偏差?是教师教的原因,还是学生学的原因,抑或两者兼而有之.这促使我们对牛顿第一定律的教学进行深层次的理性思考,进一步,我们从学生的认知心理上,对这一规律的教学进行了深入的研究. 1 通常牛顿第一定律的教学,一般是按教材编排顺序,先进行演示实验引出课题,然后通过讲解伽利略与亚里士多德的争论,消除“力是维持物体运动原因”的错误观念,进一步通过做斜面小车实验证明牛顿第一定律的正确性,最后让学生运用牛顿第一定律去解释日常生活中的现象,从而完成整个教学过程. 为了检验学生学习和掌握牛顿第一定律的情况,我们曾用这样一道题目来检测学生.题目如下.你坐在向前匀速直线运动的汽车里,将手中的钥匙竖直上抛,问当钥匙落下来时是落在手里,还是落在手后面.全班56名同学在试卷上皆答:落在手后面.问其原因,皆曰:汽车在走,而钥匙抛出后不再向前走了. 2 怎样更好地改进牛顿第一定律的教学效果,使牛顿第一定律的教学效果真正是实实在在意义上的令人满足.我们认为,囿于一般形式上的教学方法的改进已是隔靴搔痒,而必须深入到学生的认知结构中去考察学生产生错误认识的根源. 认知心理学的理论告诉我们,学生学习物理概念、规律时所形成的错误,常常是由于其头脑中的前科学概念的影响. 所谓前科学概念,是指儿童在学习物理课程以前的生活实际中,对各种物理现象和过程在头脑中反复建构所形成的系统的但并非科学的观念.比如牛顿第一定律就是如此.在物理教学中,那种认为只需要“正面”传授知识,学生就能接受,如果他们仍不理解,可以多讲几遍就能达到目的的想法,实践证明是过于天真了.因为在有些学生的经验中,早已有了与亚里士多德“力是维持物体运动原因“的理论类似的观念.这样,当他们学习了牛顿第一定律之后,就可能把定律纳入到自己原有的认知结构中,牛顿第一定律实际上成了“力是维持物体运动原因”的代名词.让他们解释用手推车、用脚踢球等一些不易暴露错误观念的生活实例时,他们也能解释得头头是道.但当解释用手抛钥匙、飞机扔炸弹的例子时,他们却又运用亚里士多德的理论去解释,其错误观念暴露无遗.这正是牛顿第一定律教学效果不佳的症结之所在. 3 研究和改进牛顿第一定律的教学,应当了解学生头脑中前科学概念的特点. 第一,学生头脑中的前科学概念是自发形成的. 过去,我们在教学中,常常误认为学生在学习物理之前其头脑如同一张“白纸”,教师可以在上面任意涂画,事实并非如此.学生在长期的生活实践当中,逐渐形成了自己对客观世界物质运动规律的看法.他们几乎每天都会看到物体在力的作用下运动,而在力停止作用时物体静止,于是主观地断言:有力,则物体运动;无力,则物体静止.这正是亚里士多德“力是维持物体运动原因”的理论. 第二,学生头脑中的前科学概念具有隐蔽性. 由于学生头脑中前科学概念都在潜移默化中形成的,所以它以潜在的形式存在.这包含两方面的意义.其一是学生自己并没有意识到它的存在,因为学生并没有有意识地思考并形成“力是维持物体运动原因”的概念.其二是前科学概念平时并不表现出来,但往往在学生运用物理概念解决问题时表现出来.比如前述测验表明,许多有10多年教龄的初中物理教师头脑中也存在着牛顿第一定律的前科学概念,然而他们自己却并不知道. 第三,学生头脑中的前科学概念具有顽固性. 由于前科学概念是儿童头脑中业已形成的概念,且长期的日常生活经验与观察又加强了这些概念.因此,学生头脑中的前科学慨念是非常顽固的. 国内外物理教育界近年来的一些研究表明:一旦学生对某些物理现象形成了前科学概念,要想加以转变是极其困难的.尤其那些在人类科学认识史上经历了曲折历程的前科学概念,更是如此. 按照皮亚杰的理论,学生认识什么和如何行动,主要决定于他们所具有的认知图式(思维模式),而不完全取决于教师所讲述的内容.他们按照自己已有的图式吸收和排斥信息.在有错误认识存在的情形下,就会在头脑中形成和正确信息极不相同的东西. 4 在上述研究的基础上,我们对牛顿第一定律的教学提出如下教学建议

运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min: Avg: Max:23 Min: Avg:15 运动区域占 1/3 左右时 Max:45% Min: Avg:20% Max:18 Min: Avg:8 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。

最新物体检测论文

对于目标检测方向并不是特别熟悉,本文记录一下RCNN, fast-RCNN, faster-RCNN, mask-RCNN这4篇有关目标检测的论文笔记和学习心得。

R-CNN的意思就是Region based,主要思路就是根据一张图像,提取多个region,再将每个Region输入CNN来进行特征的提取。因此RCNN就可以分为 Region proposals , Feature extraction 两个主要部分,提取的特征就可以输入任意一个分类器来进行分类。 模型的流程图如下:

在训练的时候,首先使用的是已经训练好的CNN网络作为特征提取器,但是由于预训练是在分类数据集上,因此在应用到检测之前要做finetune。也就是说,为了将用ImageNet数据集训练的网络应用到新的任务(检测),新的数据集(region)上,作者将原来的CNN最后的1000类的fc层,更改为了 层, 代表待检测的物体的类别数。然后,对于所有的region,如果它和ground truth的重叠率大于,就认为是正类。 对于分类器的训练,作者发现选择多大的IoU来区分正类和负类非常关键。并且,对于每一类,都会训练一个分类器。

框的回归非常重要,在对每一个region proposal使用分类器进行打分评价之后,作者使用一个回归器来预测一个新的框作为结果。这个回归器使用的特征是从CNN中提取的特征。回归器的训练中,输入是 region proposal 的 和ground truth的 ,目标是学习一种变换,使得region proposal通过该变换能够接近ground truth。同时,希望这种变换拥有尺度不变性,也就是说尺度变化的话,变换不会改变。 如下图所示,每一个regressor会学习一组参数,特征输入是pool 5的特征输出,拟合的目标是 。

Fast-RCNN 主要解决的问题是在RCNN中对于每一个region proposal都进行特征提取,会产生非常多的冗余计算,因此可以先对一张图像进行特征提取,再根据region proposal在相应的特征上进行划分得到对应region的特征(映射关系)。 这样便可以实现共享计算提高速度,但是与SPPnets不同,SPPnets在一副图像得到对应的特征后,从这张图像的特征上proposal对应的部分,采用空间金字塔池化,如下图:

RoI pooling的方法很简单,类似于空间金字塔pooling,它将proposal部分对应卷积层输出的特征(称之为RoI,因为用于做pooling的特征是 region of interest,也就是我们感兴趣的区域)划分成 块,然后对每一块求最大值,最终得到了一个 的特征图。可以看出,它只是空间金字塔pooling的一部分。 但是SPP-nets的空间金字塔也是可以求导的,那么它到底不好在哪里呢?因为当每一个RoI都可能来源于不同的图像的时候(R-CNN和SPPnets的训练策略是从一个batch的不同图像中,分别挑选一个proposal region),SPPNets的训练非常地低效,这种低效来源于在SPPnets的训练中,每个RoI的感受野都非常地大,很可能对应了原图的整个图像,因此,得到的特征也几乎对应了整张图像,所以输入的图像也就很大。 为了提高效率,Fast-RCNN首先选取 个图像,再从每个图像上选择 个RoI,这样的效率就比从每个图像提取一个RoI提高了 倍。

为了将分类和框回归结合起来,作者采用了多任务的loss,来进行联合的训练。具体来说就是将分类的loss和框回归的loss结合起来。网络的设计上非常直接,就是将RoI得到的特征接几个FC层后,分别接不同的输出层。对应于分类部分,特征会接一个softmax输出,用于分类,对于框回归部分,会接一个输出4维特征的输出层,然后分别计算loss,用于反向传播。loss的公式如下:

回归的target可以参考前面的R-CNN部分。

notes

为什么比fast还fast呢?主要原因是在这篇论文中提出了一个新的层:RPN(region proposal networks)用于替代之前的selective search。这个层还可以在GPU上运算来提高速度。 RPN的目的:

为了能够进行region proposal,作者使用了一个小的网络,在基础的卷积层输出的特征上进行滑动,这个网络输入大小为 ,输入后会映射(用 的卷积)为一个固定长度的特征向量,然后接两个并联的fc层(用 的卷积层代替),这两个fc层,一个为box-regressoin,一个为box-classification。如下图:

在每一个滑动窗口(可以参考 ),为了考虑到尽可能多的框的情况,作者设计了anchors来作为region proposal。anchors就是对于每一个滑动窗口的中心位置,在该位置对应的原图位置的基础上,按照不同的尺度,长宽比例框出 个不同的区域。然后根据这些anchors对应的原始图像位置以及区域,和ground truth,就可以给每一个滑动窗口的每一个anchor进行标记,也就是赋予label,满足一定条件标记为正类(比如和ground truth重叠大于一个值),一定条件为负类。对于正类,就可以根据ground truth和该anchor对应的原图的区域之间的变换关系(参考前面的R-CNN的框回归),得到回归器中的目标,用于训练。也就是论文中的loss function部分:

自然地,也就要求RPN的两个并联的FC层一个输出2k个值用于表示这k个anchor对应的区域的正类,负类的概率,另一个输出4k个值,用于表示框回归的变换的预测值。

对于整个网络的训练,作者采用了一种叫做 4-step Alternating Training 的方法。具体可以参考论文。

与之前的检测任务稍有不同,mask r-cnn的任务是做instance segmentation。因此,它需要对每一个像素点进行分类。 与Faster R-CNN不同,Faster R-CNN对每一个候选框产生两个输出,一个是类别,一个是bounding box的offset。Mask R-CNN新增加了一个输出,作为物体的mask。这个mask类似于ps中的蒙版。

与Faster R-CNN类似的是,Mask R-CNN同样采用RPN来进行Region Proposal。但是在之后,对于每一个RoI,mask r-cnn还输出了一个二值化的mask。

不像类别,框回归,输出都可以是一个向量,mask必须保持一定的空间信息。因此,作者采用FCN来从每个RoI中预测一个 的mask。

由于属于像素级别的预测问题,就需要RoI能够在进行特征提取的时候保持住空间信息,至少在像素级别上能够对应起来。因此,传统的取最大值的方法就显得不合适。 RoI Pooling,经历了两个量化的过程: 第一个:从roi proposal到feature map的映射过程。 第二个:从feature map划分成7*7的bin,每个bin使用max pooling。

为此,作者使用了RoIAlign。如下图

为了避免上面提到的量化过程

可以参考

作者使用ResNet作为基础的特征提取的网络。 对于预测类别,回归框,mask的网络使用如下图结构:

整体看完这几篇大佬的论文,虽说没有弄清楚每一个实现细节,但是大体上了解了算法的思路。可以看出,出发点都源于深度神经网络在特征提取上的卓越能力,因此一众大神试图将这种能力应用在检测问题中。从R-CNN中简单地用于特征提取,到为了提高速度减少计算的Fast R-CNN,再到为了将region proposal集成进入整个模型中,并且利用GPU加速的RPN,也就是Faster R-CNN。再到为了应用于instance segmentation任务中,设计的RoIAlign和mask。包括bounding box regression,pooling层的设计,训练方法的选择,loss的设计等等细节,无一不体现了大师们的思考和创造力。 可能在我们这些“拿来”者的眼中,这些方法都显得“理所应当”和巧妙,好用,但是,它们背后隐藏的选择和这些选择的思考却更值得我们学习。 以及,对待每一个问题,如何设计出合理的解决方案,以及方案的效率,通用性,更是应该我们努力的方向。

论文原文:

YOLO(you only look once)是继RCNN、faster-RCNN之后,又一里程碑式的目标检测算法。yolo在保持不错的准确度的情况下,解决了当时基于深度学习的检测中的痛点---速度问题。下图是各目标检测系统的检测性能对比:

如果说faster-RCNN是真正实现了完全基于深度学习的端到端的检测,那么yolo则是更进一步,将 目标区域预测 与 目标类别判断 整合到单个神经网络模型中。各检测算法结构见下图:

每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值是这样计算的:

其中如果有object落在一个grid cell里,第一项取1,否则取0。第二项是预测的bounding box和实际的groundtruth之间的IoU值。

每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。即SxS个网格,每个网格除了要预测B个bounding box外,还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor。(注意:class信息是针对每个网格的,即一个网格只预测一组类别而不管里面有多少个bounding box,而confidence信息是针对每个bounding box的。)

举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。整个网络结构如下图所示:

在test的时候,每个网格预测的class信息和bounding box预测的confidence信息相乘,就得到每个bounding box的class-specific confidence score:

等式左边第一项就是每个网格预测的类别信息,第二三项就是每个bounding box预测的confidence。这个乘积即encode了预测的box属于某一类的概率,也有该box准确度的信息。

得到每个box的class-specific confidence score以后,设置阈值,滤掉得分低的boxes,对保留的boxes进行NMS(非极大值抑制non-maximum suppresssion)处理,就得到最终的检测结果。

1、每个grid因为预测两个bounding box有30维(30=2*5+20),这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。其中坐标的x,y用bounding box相对grid的offset归一化到0-1之间,w,h除以图像的width和height也归一化到0-1之间。

2、对不同大小的box预测中,相比于大box预测偏一点,小box预测偏一点肯定更不能被忍受的。而sum-square error loss中对同样的偏移loss是一样。为了缓和这个问题,作者用了一个比较取巧的办法,就是将box的width和height取平方根代替原本的height和width。这个参考下面的图很容易理解,小box的横轴值较小,发生偏移时,反应到y轴上相比大box要大。其实就是让算法对小box预测的偏移更加敏感。

3、一个网格预测多个box,希望的是每个box predictor专门负责预测某个object。具体做法就是看当前预测的box与ground truth box中哪个IoU大,就负责哪个。这种做法称作box predictor的specialization。

4、损失函数公式见下图:

在实现中,最主要的就是怎么设计损失函数,坐标(x,y,w,h),confidence,classification 让这个三个方面得到很好的平衡。简单的全部采用sum-squared error loss来做这件事会有以下不足:

解决方法:

只有当某个网格中有object的时候才对classification error进行惩罚。只有当某个box predictor对某个ground truth box负责的时候,才会对box的coordinate error进行惩罚,而对哪个ground truth box负责就看其预测值和ground truth box的IoU是不是在那个cell的所有box中最大。

作者采用ImageNet 1000-class 数据集来预训练卷积层。预训练阶段,采用网络中的前20卷积层,外加average-pooling层和全连接层。模型训练了一周,获得了top-5 accuracy为(ImageNet2012 validation set),与GoogleNet模型准确率相当。

然后,将模型转换为检测模型。作者向预训练模型中加入了4个卷积层和两层全连接层,提高了模型输入分辨率(224×224->448×448)。顶层预测类别概率和bounding box协调值。bounding box的宽和高通过输入图像宽和高归一化到0-1区间。顶层采用linear activation,其它层使用 leaky rectified linear。

作者采用sum-squared error为目标函数来优化,增加bounding box loss权重,减少置信度权重,实验中,设定为\lambda _{coord} =5 and\lambda _{noobj}= 。

作者在PASCAL VOC2007和PASCAL VOC2012数据集上进行了训练和测试。训练135轮,batch size为64,动量为,学习速率延迟为。Learning schedule为:第一轮,学习速率从缓慢增加到(因为如果初始为高学习速率,会导致模型发散);保持速率到75轮;然后在后30轮中,下降到;最后30轮,学习速率为。

作者还采用了dropout和 data augmentation来预防过拟合。dropout值为;data augmentation包括:random scaling,translation,adjust exposure和saturation。

YOLO模型相对于之前的物体检测方法有多个优点:

1、 YOLO检测物体非常快

因为没有复杂的检测流程,只需要将图像输入到神经网络就可以得到检测结果,YOLO可以非常快的完成物体检测任务。标准版本的YOLO在Titan X 的 GPU 上能达到45 FPS。更快的Fast YOLO检测速度可以达到155 FPS。而且,YOLO的mAP是之前其他实时物体检测系统的两倍以上。

2、 YOLO可以很好的避免背景错误,产生false positives

不像其他物体检测系统使用了滑窗或region proposal,分类器只能得到图像的局部信息。YOLO在训练和测试时都能够看到一整张图像的信息,因此YOLO在检测物体时能很好的利用上下文信息,从而不容易在背景上预测出错误的物体信息。和Fast-R-CNN相比,YOLO的背景错误不到Fast-R-CNN的一半。

3、 YOLO可以学到物体的泛化特征

当YOLO在自然图像上做训练,在艺术作品上做测试时,YOLO表现的性能比DPM、R-CNN等之前的物体检测系统要好很多。因为YOLO可以学习到高度泛化的特征,从而迁移到其他领域。

尽管YOLO有这些优点,它也有一些缺点:

1、YOLO的物体检测精度低于其他state-of-the-art的物体检测系统。

2、YOLO容易产生物体的定位错误。

3、YOLO对小物体的检测效果不好(尤其是密集的小物体,因为一个栅格只能预测2个物体)。

物体检测本科论文

论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :

每年的5、6月份,本科生们都会面临论文查重这个问题。学校一般多会指定一个查重系统,但是每个学校使用的查重系统不同。本科毕业论文怎么查重? 一般论文查重也就是查论文的抄袭率,通过论文查重系统,检测结果是否符合学校要求。对于查重率,也需要我们看看查重系统进行具体的核算工作方式和准确率。本科毕业论文一般在30%以下,可以进入答辩环节;而30%到50%之间的论文需要修改;50%以上的论文需要延期答辩。 在论文查重过程中也可以通过发现,本科的查重怎么查都是和连续进行字符以及有关的。如果论文连续13个字与检查系统的内容相似,就会被认定为过高。在具体的查重过程中,当然也需要我们选择一个专业性,安全性具有较高的查重系统,除了进行核算准确之外,对于企业出现的重复论文主要内容也可以通过直接标红,这样学生也有利于后续文章的修改。要说复习的原则就是按照这样的复习方法,所以写论文的时候即使有副本的内容,也不会出现连续13次相同的情况。 如果真的想了解本科毕业论文怎么查重,那么需要我们确定好哪个系统比较安全,并且还能保证严格性的。学校也有专门的论文查重系统,支持大量上传,所以这些系统一般是为各大高校提供服务的。不过自己自查还是使用不了的,所以我们需要使用一些初稿查重系统。

第一,在很多的查重软件的首页上,会有很多论文查重系统的入口,我们要怎么选择呢?知网VIP查重的系统是研究生的论文查重系统,这个的查重系统是学术论文的对比库。还有个是知网小分解的查重,有很多人不知道这个系统,这个系统是不会限制文章的类型,也是不限制人群的。第二,在确定下来的查重系统之后,就要把自己的论文上传上去,系统会把你上传的论文自动转换成文本的形式和数据库进行比较的,知网查重的系统如果有连续13个字数是重复的,那么重复的部分就会有红色的标记。第三, 最后,我们需要等待的就是论文检测出来的结果了,一般知网检测的结果是以报告的形式出现的,一般报告的重复率抄袭的都会有红色的标记明确指出来,也会把重复的地方写清楚文章或者文献重复;这样就可以很方便的进行修改。查重的软件有很多,给大家推荐一些:适合初稿采用的:万方、维普;适合修改论文的:维普、知网小分解、知网大分解、知网PMLC;定稿使用的:知网PMLC、知网硕博vip。

为了更好的提高微生物食品的安全性,对微生物的检验技术的发展就变得十分的重要。下面是我为大家整理的食品微生物论文,供大家参考。

【论文关键词】:食品微生物 实验教学 实验开放管理

【论文摘要】:食品微生物实验教学中,本文从精心选择实验内容,有效组织管理实验教学,引进综合考评机制并加强开放管理实验室方面进行思考和 总结 ,以期确保实验课安全、有序、成功的完成,达到教学目的。

实验教学是高等 教育 教学活动的重要环节。通过实验课不仅可以加深学生对课堂内容的理解,巩固已学到的理论知识,而且能够培养学生理论联系实际的能力、分析问题和解决问题的能力,对于活跃思维、提高创新能力起着积极的作用。

食品微生物学是食品专业学生必修的专业课,是普通微生物学的延伸。食品微生物学是一门实践性和应用性较强的学科,它要求学生在系统学习基础理论知识的基础上,掌握食品微生物学检测技术、分离纯化技术、鉴定技术、发酵食品的制备技术、食品加工与保鲜技术以及现代分子微生物学实验 方法 等。通过食品微生物实验教学培养出不仅具有丰富理论知识,而且能掌握现代生物技术并熟练操作的高技能人才。

如何加强食品微生物实践教学的组织指导,如何调动学生的积极性,提高实验教学效果一直是我们关注和探索的问题。下面简单谈一下我们在食品微生物实验教学中遇到的问题,解决的方法和对一些问题的思考。

1 精心选择实验内容,调动学习积极性

随着食品工业和微生物检测技术的迅速发展,食品微生物学及其实验课的内容也不断扩展,而实验课既受理论课内容进度的限制,又受课时及实验室等客观条件的限制。要在有限的课时内,系统、科学地完成食品微生物所有的实验项目是绝对不可能的,这就要求我们实验教师在掌握微生物学教学大纲的前提下,结合现代科技的发展和食品微生物的研究动态,精心设计实验课教学体系,合理选择实验项目。

选择实验内容,我们由浅入深,由感性到理性。首先要求学生对食品中常见细菌、酵母菌、霉菌、乳酸菌进行观察,掌握其性状特征和培养生长条件。学会识别哪些是有益菌,哪些是有害菌,利用有益菌的代谢活动制造更多的发酵产品,提高食品的质量,同时防止有害菌引起食品腐败变质以及食物中毒。其次选择有代表性的发酵食品作为实验内容,使学生了解利用微生物生产发酵食品的整个过程,通过这些实验使同学们对食品发酵有一个总体印象,并能举一反三。最后对不同的食品和发酵食品设计实验,让学生掌握食品微生物学检测技术、分离纯化技术、鉴定技术。并在课堂上结合自己的科研成果和食品研究 热点 介绍食品工业发展的前沿动态。

实验设计过程中,不仅有验证性实验,更多地引进了综合性和设计性实验,学生分成几人一组,让学生从实验设计,自己选择原材料,准备实验材料,试剂的配置,培养基的制备和灭菌等都由学生自己完成,最后写成规范的实验 报告 。学生对此积极性很高,甜酒酿、酸奶、腐乳等都是同学们喜欢并制作的发酵食品。在这个过程中学生将所学内容贯通,并熟悉掌握各个环节的操作步骤,这对学生将来步入社会,在工作岗位上独立开展工作都会有很大的帮助。

2 强化基础技能的训练,有效组织管理实验教学

食品微生物学是在掌握微生物的基本实验技能的基础上开展的,学生无菌操作观念的培养、正确使用、掌握微生物的实验仪器,如光学显微镜、灭菌消毒器械等都非常重要。但基于很多原因,学生的这些基础技能还是很薄弱,所以我们在进行食品微生物的每一个实验的每一个步骤中只要涉及这些基础性的知识,都会给予强调,亲自演示。

学生微生物基础技能培养和形成,不是一两堂课能完成,也不是单单有老师演示后学生就可以掌握,必须让学生每人亲自动手。但在实际教学过程中,由于学生人数的增加,硬件等条件限制,人手一套实验器材不现实,那么在有限人力、有限资源情况下,使每一位同学都能动手操作并熟悉实验过程,有效组织和管理实验教学过程就尤为重要。

(1)首先任课教师和实验技术人员充分做好预实验,对实验的关键步骤和关键操作点都做到心中有数,在授课过程中有重点地强调,并分析某步骤出现问题可能会出现的结果。

(2)每次实验之前任课教师和实验技术人员就实验进行积极的沟通,不仅对实验准备的物品和材料沟通,更要对实验的组织过程协商。

(3)在实验过程中则需要任课教师和实验技术人员相互协作,并充分发挥学生班干部和小组长的作用。课堂理论教学课和实验课最大的区别在于,实验课更注重学生的动手参与,以及实验过程出现问题发现问题的及时解决。 (4)教师要严于律已,教师要严格要求自己,实验过程中耐心指导,热情帮助,回答好学生提出的每个问题,并随时纠正不正确或不规范操作。

3 加强实验课考核,引进综合实验考评

实验课的成绩给定,往往包括实验课出勤率和实验报告成绩两方面综合。所以首先就要求教师认真考勤,只有学生的出勤率有保证才能有效地组织教学活动。其次,要求实验报告书写规范,详细完成实验报告,对实验结果进行讨论,实验失败要分析原因。同时教师也对实验报告认真批改,实验报告是对实验的总结,也是对实验课质量高低的检验。通过对实验报告的批改,可以发现学生的实验操作能力和观察分析问题的能力。

实际教学中,实验报告雷同和抄袭的现象比较多见,为综合考评学生实际动手能力和对实验技能的掌握,建议今后引进期末的综合实验考评:即将各个试验项目设计成不同的实验题目,让每个学生随机抽取并在有限的时间内独立完成操作,视完成的情况给予评分。比如:“食品中常见菌类的平板培养”考察了无菌操作、培养基的制备,对食品中常见菌类平板接菌技术;“食品中常见菌类的形态观察”考察了革兰氏染色,各真菌形态辨别等。在进行具体考核过程中,可把每个考核的内容进行量化定出详细的评分标准,根据学生的每一个操作环节现场打分,并对同学进行现场提问,让学生进行答辩。

4 有计划推进实验室的开放 加强实验室开放管理

微生物实验室的开放是对食品微生物实验课的有益补充,能强化、巩固、提升对食品微生物课程内容的理解,我们鼓励学生设计和开发自己的科研项目,而且学校有很优厚的资金加以支持。但是开放实验室不是无条件的,有时因实验操作不当引起的安全隐患是很严重和难以预料。因此实验室开放时管理须给予加强。

建立科学的管理机制,利用校园网建设实验网站,公布开放实验项目的题目、时间和地点,供学生选择和预约。

专人负责学生的科研队伍,对菌种、标准品、和学生用到的有毒有害物质要有专人负责,注意保管,不随意丢弃,做好无害化处理。对使用仪器学生做好使用登记,实验物品注意清洗、归还、交接。

总之,食品微生物实验课,只有提高对实验教学活动的认识,精心选择实验内容,合理有效组织和管理实验过程,并加强实验课的考核,在此基础上,推进实验室对学生的开放,加强开放实验室的管理,就能确保实验课安全、有序、成功的完成,达到教学目的,也使学生真正有所收获。

参考文献

[1] 赖建平.从培养学生创新能力入手加强化学院食品微生物学实验教学改革[J].广东化工,2007,2:77~79.

[2] 潘蕾.实验室开放管理的研究与实践[J].实验技术与管理,2007,9:131~133.

[3] 陶思源,食品微生物实验课教学改革的初探[J].辽宁行政学院学报,2005,4:211~212.

[论文关键词]:食品微生物 教学改革 多媒体课件

[论文摘要]:针对食品微生物学课程教学, 文章 从教学内容、教学手段、 教学方法 和成绩考核标准等几个方面进行了探讨,为食品微生物教学改革提供了新的思路。

食品微生物学是一门研究与食品有关的微生物的科学,通过对微生物的基本知识、基础理论和基本实验技能的教学,使学生能辨别有益的、腐败的和病原的微生物,从而在食品制造、保藏过程中,充分利用有益微生物,控制有害微生物的活动,以防止食品的变质[1]。该课程内容多,涉及面广,技术性实用性强,是食品专业的专业基础课程。在教学中,除重视基础理论知识、基本操作技能的传授外,也注重了培养学生分析问题、解决问题的能力,做法和体会如下:

一、变学生被动为主动,变换教学立场

教师的备课不是简单的“背课”[2],是在对教学内容熟悉的基础上,优化内容,根据食品微生物学知识体系的要求合理分配教学时间,增加学生在课堂上的参与和主动,启发引导学生完成学习任务,充分发挥教为主导,学为主体的作用。要改以往课堂以教师讲为主,学生被强迫坐于课堂,不能也不敢出声的传统教学模式,做到让学生“动”起来,让学生自身主动地进入到学习状态,增加学习兴趣,提高学习效果。

如“食品微生物学”与“生物化学”等课程相互渗透、相互联系,在授课时间上有前有后,为了避免相近课程某些内容重复,我们进行了授课内容的优化。对于先修课程生物化学,已讲过“物质代谢”内容,则以学生为主角,让学生课下查阅资料丰富相关知识尤其是一些科研论文(这样可以启发学生发现更多问题),然后课堂向教师提问的方式来完成这部分教学内容。教师要根据学生提问的难易做到由浅及深地回答,帮助学生回顾已忘或还未掌握的内容。学生在提问时,允许学生充分发挥想象;老师答疑时要尽可能多联系一些日常生活的实例和本学科当前研究的最新进展,用简练、幽默、易懂的语言回答相关问题,这样既丰富了学生知识,又调动了学生积极性和趣味性,让学生在课堂上能够感觉到自己是课堂主角,要发挥主角作用。

二、善于利用多媒体教学资源

传统的板书加挂图的食品微生物教学模式已远远不能满足当今学生的信息量。计算机辅助教学成为当今教育科学及教学手段的重要组成部分[3]。多媒体技术应用于食品微生物教学中,使教学效果前所未有的提高。首先,多媒体技术使直观教学成为可能。将微观世界在课堂上生动再现,其效果胜过任何语言的描述。其次,多媒体提供的信息量远远大于传统教学模式。课堂上学生可以观看多幅图片,阅读多篇教学材料,这个数量可以是传统教学的几倍。第三,多媒体将多种教学资源进行了整合,提供了多种教学方法,如课件、动画、相关网络声像资料及新闻报道等。

食品微生物学,不仅内容丰富,涉及面广,发展迅速,而且个体微小,学生对它的认识远不如对宏观事物,再加上其营养方式、遗传类型多种多样、代谢机制错综复杂,学生往往感觉其知识繁琐、抽象和难以理解。针对这种情况,将多媒体技术应用到微生物学课程的教学,受到了学生的普遍欢迎。通过flash动画、PPT课件、高清晰显微照片、动态显微录像等CAI教学软件,使微观世界宏观化、教学内容形象化[4]。例如,把细菌、真菌、病毒的显微世界以色彩丰富、直观清晰、生动形象的三维画面或科教电影形式展示给学生,以动画的形式表现出细菌鞭毛的运动、T偶噬菌体的增殖、主动吸收的方式、细胞的分裂过程等内容。不仅激发了学生的学习兴趣,有助于学生的理解与接受,而且可突破教学中的难点,加大教学的信息量,提高讲课的效率。

三、采取形象化教学形式

在实际教学过程中要注重知识的逻辑性和系统性,强化抽象理论与具体实例结合,增加学生对抽象理论的感性认识和接受能力。食品微生物学主要讲解了微生物在食品生产、贮运及销售过程的利害影响,但由于微生物的自身特性,我们很难就只有显微条件下才能观察到的细小生物让其形象化,宏观化。虽然多媒体已经在此方面有了很大改善,但要做到与具体实例联系更加紧密,更加强化学生的感性认识,我们必须借助实际生产、生活中的例子来实现形象化教学。如,上课时我们将一些常见的白酒、红酒、酸乳、面包、酱类等发酵食品带入课堂来讲授微生物在发酵食品中的应用,并且通过与实验紧密结合,开展发酵酸乳来增强学生对微生物利用的认知,让学生自已亲自动手制作酸乳,品评自已的劳动成果,便于理解和掌握教学内容重点。再如讲到微生物对食品的危害时,我们选用了一些发霉的粮食、发霉的马铃薯以及发臭的肉和罐头等进入课堂,这样在理论讲解时有现实的例子,无论从教师的讲授还是学生掌握都因有了宏观感性认识而变得轻松容易。

四、调动学生兴趣,培养创新能力

兴趣是学习的动力,也是创新的动力,创新的过程需要兴趣来维持。教育学家乌申斯基说:“没有丝毫兴趣的强制学习,将会扼杀学生探求真理的欲望。”[5]食品微生物课堂教学中要注重培养学生的学习兴趣,养成学生良好的学习习惯,为学生创造性学习奠定基础。那么如何在微生物教学过程中做到调动学生兴趣,培养创新能力呢?我们主要从三方面来做起。第一,因材施教。学生的个性差异和智力发展情况各不相同,因材施教,对不同层次的学生实施不同程度的思维能力和创造能力,对不同层次的学生要有不同的评价标准和不同的目标要求。第二,以“新”为轴,调动学生学习兴趣。教学中突出“新”的理念(即运用新思想,联系新理论,列举新课题等),在激发学生的学习热情,培养提出问题,解决问题的能力,积极参加各种学术讨论会,大胆提问等方面都无疑会起重要作用,同时还赋予学生宝贵的 创新思维 。第三,多样化传授知识。改传统课堂教学模式,引入食品中微生物变化的课外观察,自行了解微生物的生长变化;鼓励学生课堂提问,学生课外查阅资料课堂以报告会形式进行教学内容讨论;积极开展相关实验,引入校园河水中微生物检测实验,培养学生自行设计安排和完成实验的能力。

五、强化实验教学,重视动手能力

食品微生物学是一门实验性、技能性很强的专业基础课,这一学科的在校大学生踏上工作岗位前,普遍存在动手能力较差、实验技能欠缺的问题。充分利用现有的力所能及的各种条件,加强实验技能培训,是最快捷有效的弥补方法。

(一)课堂实验

食品微生物实验课开始时,讲明实验目的、要求、步骤和注意事项,努力使实验成功的要求变成学生头脑中的指令,使每位同学都全神贯注地投入到实验当中去。从最基本的操作技术做起,抓住实验课上一切可以利用的机会,采取多种形式强化基本技能。具体如下:

最初,教师进行实验目的、要求、步骤和注意事项的详细讲解。

其次,以多媒体的形式将预先录制的实验过程向学生播放。这样既可以回顾理论教学内容加深实验印象,又可使学生初步了解实验过程、实验步骤及实验中的关键操作,帮助掌握实验技能。

再次,教师与学生同时进行实验操作。这样进行实验,学生在观看了录像后对部分仍不明白或是记忆不清楚的地方可以通过教师演示与他们实验的同步,进行实验信息交换,从而让学生能够最短最及时最迅速地掌握正确的实验技能。

最后,进行实验总结,认真完成实验报告的写作和批阅,从中找出问题并进行集中答疑,进一步修正学生实验中的错误。

(二)课外实验

不定期安排学生在课外做些简单实验或集中安排学生课外进行实验技能训练。如在讲微生物腐败变质时安排学生课外取一空矿泉水瓶内装入校园河流中比较清澈的水,然后进行封口存放,直至水质变化产生腥臭。让学生通过这种现象来强化课堂所学内容,起到了良好教学效果。再如集中学生利用课余时间进行校园河水中微生物检测实验,让学生以小组为单位独立完成从实验设计到完成检测报告一系列工作,并且最后进行结果评比。这样不但丰富了学生课余生活,而且还调动了学生的学习积极性,提高了学生的实际动手和综合运用知识的能力。

六、建立适合当代大学生的考核机制[6],正确评定学生成绩

实行理论和实验考试分离,突出实验,综合评定的考试模式。改以往教师授课内容为蓝本,学生考前背,考后忘的非正常态考试模式。将理论考查内容面放宽加大,强调与实际食品生产的联系,将知识点以命题形式溶入现实生活,做到“学以致用”。实验考试采用笔试和操作各占一半的命题形式,做到实验理论和实验操作并行,要求学生在规定时间内完成两部分命题,达到理论、操作都掌握的目的。实验笔试以实验基本原理和关键操作步骤为主要命题范围,实验操作以抽签形式定,内容均为食品微生物必须掌握的实验内容,如显微镜观察、细菌染色、细菌计数等。最后学生成绩由理论和实验两部成绩再结合平时的课堂提问及实验情况进行综合评定,给出学生一个公平公正科学的考核成绩。通过这种模式考试既要求学生掌握了食品微生物的相关理论知识,又培养了学生的实验操作技能,为以后的实际工作打下了坚实基础。

实践证明,我们进行的食品微生物课程教学改革的大胆尝试是成功的。教学内容的丰富更新、教学手段的现代化,考核机制的客观化,不仅提高了教学质量和教学效果,而且激发了学生的学习兴趣,拓宽了学生的知识面,增强了学生的动手能力,适应了现代社会对人才培养的要求。

参考文献

[1]贾英民,食品微生物学[M],北京,中国轻工业出版社,2001,1~243

[2]朱宏飞,微生物教学中激发学生兴趣的几点探索[J],微生物学通报,2007,34(1)173~175

[3]梁峙,微生物教学中的CAI[J],彭城职业大学学报,2001,3(16),76~79

[4]李平、杜先锋、蒋军,运用多媒体课件好食品微生物学的尝试[J],高等农业教育,2002,10,42~44

[5]叶丹玲,如何在微生物教学中培养学生的创新意识[J],宁波工程学院学报

摘要: 随着人类社会的进步,食品安全已经成为世界性的公共卫生问题,不仅影响到人类的健康,而且关系到国家的安全及稳定,大力发展科学技术,研究新检验方法,快速推广普及有效检测技术越显重要。本文介绍了免疫检测技术、分子生物学方法、快速测试片法、电阻电导测定法四方面的检测方法,并评述了他们的特点。随着生物等新技术新方法在食品微生物检验领域应用,文章对近几年食品微生物检测技术和方法进行介绍,这样做有效的提高了检测效率和检验速度。

关键词: 检测方法;微生物

0 引言

随着人们现代科学技术的发展,“细菌门”、“福寿螺”、“毒饺子”等名词的出现,食品安全问题越来越受到人们的重视,根据WHO统计,全球每年有近15亿人感染食源性疾病,其中70%是食品中致病微生物污染引起的。各个环节中都有污染微生物的可能,包括食品生产、加工、储存、运输、销售等,目前,微生物对食品的污染问题成为人们关注领域。

1 食品微生物分类及命名

微生物并不是生物学分类学上的专门名词,而是对所有形体微小,单细胞的或个体结构较为简单的多细胞的、甚至没有细胞结构的低等生物的统称。其群体非常庞杂,种类繁多,包括细胞型和非细胞型两类。凡具有细胞形态的微生物称为细胞型微生物。细胞型微生物按细胞结构又分为原核微生物和真核微生物。

2 食品微生物检测技术及方法

免疫检测技术———酶联免疫吸附剂测定法 (ELIsA)[1]

免疫学是研究生物体对抗原物质免疫应答性及其方法的生物-医学科学。免疫应答是机体对抗原刺激的反应,也是对抗原物质进行识别和排除的一种生物学过程。现代免疫学将“免疫”定义为:机体对“自己”和“异己”识别、应答过程中所产生的生物学效应的总和,正常情况下是维持内环境稳定的一种生理性功能。

酶联免疫分析法(ELIsA)是食品检验中应用的主要免疫检测技术。它的中心就是让抗体与酶复合物结合,然后通过显色来检测。具体说就是使抗原或抗体结合到某种固相载体表面,即与某种酶连接成酶标抗原或抗体,这种酶标抗原或抗体既保留其免疫活性,又保留酶的活性。在测定时,把受检标本(测定其中的抗体或抗原)和酶标抗原或抗体按不同的步骤与固相载体表面的抗原或抗体起反应。用洗涤的方法使固相载体上形成的抗原抗体复合物与其他物质分开,最后结合在固相载体上的酶量与标本中受检物质的量成一定比例。加入酶反应底物,底物被酶催化变为有色产物,产物的量与标本中受检物质的量直接相关,可根据颜色反应的深浅来进行定性或定量分析。

分子生物学方法

核酸探针法[2] 核酸探针是将已知核苷酸序列

DNA片段用同位素或其他方法标记,加入已变性的被检DNA中,在一定条件下即可与该样品中有同源序列的DNA区段形成杂交双链,从而达到鉴定样品中DNA的目的,这种能认识到特异性核苷酸序列有标记的单链DNA分子就称为核酸探针或基因探针。与免疫学方法相似,探针也需要附加适当标记。以往研究的探针技术要使用放射性同位素,只在专门的实验室使用,而现在较热门的技术是以核酸杂交为基础的第二代技术一—比色计。该方法依赖核糖体RNA(tRNA)发育中储存的核酸成分进行检测。这种天然富含rRNA标靶序列的使用使得无辐射检测成为可能,同时又保持了与放射性同位素方法相当或者更高的灵敏度。总体说,核酸探针技术是一种较为理想的技术,特点是敏感、特异、简便、快速,缺点是一种菌就需要一种探针,目前尚未建立所有菌种探针,该技术还有待进一步发展,再者就是检验费用比较昂贵。

聚合酶链反应法(PcR方法)[2] 聚合酶链反应 (PCR)PCR是美国科学家Mllllis于1983年发明的体外快速扩增特定基因或DNA序列的方法。又称为基因体外扩增法,是一种体外选择性扩增DNA或RNA的技术。该方法通过对人工难以培养的微生物相应RNA或DNA片段扩增,检测扩增的产物含量,从而快速对饲料中致病菌的含量进行检测。PCR技术可直接检测样品中痢疾杆菌,大肠杆菌、乳酸杆菌、肉毒梭菌等。

快速测试片法 快速测试片法是利用无毒的纸膜、纸片、胶片为培养基载体,快速、定性和定量检测试纸和胶片的食品微生物检测方法,它是一种集现代化学、高分子科学、微生物学于一体的检测方法。对有些项目的测定,其准确度和精确度高,几乎与标准方法相媲美。其优点:第一,常规法需要时间较长,而且温度要求严格,而测试片操作简单,大大缩短了测试时间,以往许多实验室不能实施,不能达到及时检测的目的。第二,快速测试片可以在取样时同时接种,防止延长接种时间时由于细菌繁殖造成的数量增多,结果更能反映当时样本中真实的细菌数。第三,测定少量样品,不需配试剂,价格低廉,可随时进行,便于运输,携带方便,易于消毒保存,操作简便快速。

电阻电导测定法 电阻电导测定法原理是:在细菌生长繁殖期间,将大分子物质(蛋白质、糖类等)分解成有机酸、氨基酸等带电荷的小分子物质,改变其培养液的导电度。这样,通过电阻和导电度的数值变化,就可推算出样品含菌数。目前已开发出来的电阻电导检测器有:美国Vitek公司生产的Bactometer可适用于检测肉品、乳制品等含菌量;英国推出的Mathus系统,可用来检测牛乳、酿造液、鱼及海产品的含菌量[3]。

3 结束语

随着人们生活质量的不断提高,食品安全问题已逐渐成为世界性公共卫生问题,直接关系到人类的健康。本文中罗列了几个方面的食品中微生物的检测技术,虽然很多技术依然存在一定的问题,有的属于世界前沿,有的还处于发展阶段,但其应用价值日显突出。

参考文献:

[1]王兰兰.临床免疫学和免疫检验[M].北京:人民卫生出版社,2003:91-93.

[2]杨向荣,江志毅等.快速方法在食品微生物检测中的应用[J].学术论坛,2006,5.

[3]周向华,王衍彬,叶兴乾等.电阻抗法在食品微生物快速检测中的应用[J].粮油加工与食品机械,2003(10):73-75.

1. 食品安全毕业论文范文

2. 大专食品毕业论文范文

3. 食品加工论文范文

4. 医学微生物论文

5. 微生物学习心得

6. 关于畜牧兽医论文范文

相关百科

热门百科

首页
发表服务