首页

> 学术期刊知识库

首页 学术期刊知识库 问题

小目标检测会议论文

发布时间:

小目标检测会议论文

能不能给我发一份呢?

化学论文格式及要求7.在关键词的下一行,标著本文的中图分类号。请用《中国图书馆分类法》第4版中的分类号。(可上网查询) 8.请写作者简介,包括:作者姓名(出生年-)、性别、民族(汉族可省略)、籍贯(省、县)、职称、学位、研究方向。(可写在论文首页地脚处或文末) 9. 特别注意:外文字母的正斜体、黑白体、大小写和上下角标的表示。 ① 外文正体的常用场合: a.计量单位的符号和SI词头符号。如:牛顿N、安培A、毫安mA等; b.数学式中的运算符号和编写号,如:微分号d,极限lim,行列式det,极大值max,极小值min, 对数号ln, 三角函数号sin, cos,等。又如:其它运算符号∑,∏,∪,∩,∈ 等; c.其值不变的数学常数符号,如圆角率π,自然对数的底e,虚数单位i(电工中常用j); d.仪器、元件、样品等的型号、代号; e.生物学中表示拉丁文学名的定名人和亚族以上(含亚族)的拉丁文学名; f.下角标如为说明性符号; g.化学元素、粒子、射线符号,如:H(氢)、Cu(铜)、e(电子)、α射线等。 ② 外文斜体的常用场合: a.用字母代表的数、一般函数式以及统计学符号等,如x,f(x)=4x-5; b.量符号、量符号中代表量或变动性数字、坐标符号的角标字。如力F、电流I、力的分量Fx等; c.文中及公式中的矩阵和矢量,其符号字母用“黑斜体”表示; d.下角标如为变量则用斜体; e.化学物的旋光性、分子构型和取代基位置等符号用斜体,d- (右旋)、L-(左型)、Z-(顺式)、p-(对位)等 ③ 正确使用有关符号: a.有关符号的使用应符合国家标准,例如:sin-1应为arcsin, ctg应为cot, tg应为tan等; b.停止使用废弃的符号,如 ∵ , ∴ , ppm等; c.除Re, Ma(其中e, a不是下标)等几个特征数外,变量应使用单个字母表示(或带下标的单字母,否则由多个字母表示单个变量,易被误解为多个变量相乘)。 10. 图、表描述应标准化。 ①所有的插图均需标注中英文图序和图题。对于函数曲线图,请注意检查横纵坐标的变量符号、单位、刻度值是否完整(对于无量纲或无单位的,请注明“无单位”)。特别注意说明坐标轴物理意义的标目,要求由物理量的名称或符号和相应的单位组成。物理量的符号用斜体字母标注,尽量避免使用中、外文的文字段 (或缩写字母) 来代替符号。单位符号应该使用正体字母标注。量与单位之间用斜线“/’’隔开,如I/A,p/Pa,V/ms-1,等。标目应该与被标注的坐标轴平行,居中放置在坐标轴与标值的外侧。 ②所有的表均需标注中英文表序和表题,表中的各栏均应标明“量和测试项目、标准规定的符号及单位”。尽量用三线表。 ③图、表的宽度尽可能小于8cm,以满足分栏排版的要求。图、表若通栏排版,其宽度要小于16 cm。 11.参考文献代表论文的起点和层次,请严格参照以下格式将所有项目著录完全,并按其在正文中被引用的顺序排列,且在正文中标注出各自的引证地。各类文献的著录格式(含标点)为: ①期刊论文——[序号]作者. 题名[J]. 刊名,出版年,卷(期)号:引文起止页码. 示例: [1]叶晓东,朱兆达. 一种分块处理斜视SAR成像方法[J]. 现代雷达,1997,19(5): 23-29. [2]Moustafa G H. Interaction of axisymmetric supersonic twin jets[J]. AIAA J, 1995,3(5): 871-875. ②专著——[序号]著者.书名[M].版次.出版地:出版者,出版年.引文起止页码. 示例: [1]刘谋 佶 , 吕志咏, 丘成昊, 等. 边条翼与旋涡分离流[M]. 北京: 北京航空学院出版社, 1988. 24-27. [2]Isidori A. Nonlinear control systems[M]. New York: Springer Press,1989:32-33. ③文集中析出文献——[序号]作者.题名[A]. 文集编者. 文集名[C].出版地:出版者,出版年.引文起止页码. 示例: [1]陈永康,李素循,李玉林. 高超声速流绕双椭球的实验研究[A]. 北京空气动力研究所. 第九届高超声速气动力会议论文集[C]. 北京:北京空气动力研究所,1997:9-14. [2]Peng Jin, Luo Xiang Zeng, Jin Cong Jing. The study about the dynamics of the approach glide-down path control of the carrier aircraft[A]. Gong Yaonan . Proceedings of the Second Asian-Pacific Conference on Aerospace Technology and Science[C]. Beijing: Chinese Society of Aeronautics and Astronautics, 1997. 236-241. ④会议论文——[序号]作者.题名[A]. 文集编者(主办单位).文集名[C],会议名称,会议地点,会议日期.出版地:出版者,出版年. 引文起止页码. 示例: [1]辛希孟. 基于局部 熵 的红外图像小目标检测[A].信息技术研究所.信息技术与信息服务国际研讨会论文集:A集[C].北京:中国社会科学出版社,. ⑤ 学位论文——[序号]作者. 题名[D]. 出版地:出版者,出版年. 示例: [1]朱刚. 新型流体有限元法及叶轮机械正反混合问题[D]. 北京:清华大学,1996. [2]Sun Ming. A study of helicopter rotor aerodynamics in ground effect[D]. Princeton: Princeton Univ, 1983. ⑥科技报告——[序号]作者.题名[R].报告名称及编号,出版地:出版者,出版年.示例: [1]孔祥福. FD-09风洞带地面板条件下的流场校测报告[R]. 北京空气动力研究所技术报告 BG7-270,北京:北京空气动力研究所,1989. [2]Carl E J. Analysis of fatigue, fatigue-crack propagation and fracture data[R]. NASA CR-132332, 1973. ⑦专利——[序号]专利权人.专利题名[P].专利国别:专利号,公告或公开日期. 示例: [1]黎志华,黎志军. 反馈声抵消器[P].中国专利:85100748, 1986-09-24. ⑧标准——[序号]标准编号, 标准名称[S].出版地:出版者,出版年. 示例:

小目标问题在物体检测和语义分割等视觉任务中一直是存在的一个难点,小目标的检测精度通常只有大目标的一半。

CVPR2019论文: Augmentation for small object detection 提到了一些应对小目标检测的方法,笔者结合这篇论文以及查阅其它资料,对小目标检测相关技巧在本文进行了部分总结。

小目标的定义: 在MS COCO数据集中,面积小于 32*32 的物体被认为是小物体。

小目标难以检测的原因: 分辨率低,图像模糊,携带的信息少。由此所导致特征表达能力弱,也就是在提取特征的过程中,能提取到的特征非常少,这不利于我们对小目标的检测。

1、由于小目标面积太小,可以放大图片后再做检测,也就是在尺度上做文章,如FPN(Feature Pyramid Networks for Object Detection),SNIP(An Analysis of Scale Invariance in Object Detection – SNIP)。

Feature-Fused SSD: Fast Detection for Small Objects, Detecting Small Objects Using a Channel-Aware Deconvolutional Network 也是在多尺度上做文章的论文。

2、在Anchor上做文章(Faster Rcnn,SSD, FPN都有各自的anchor设计),anchor在设置方面需要考虑三个因素:

anchor的密度: 由检测所用feature map的stride决定,这个值与前景阈值密切相关。

anchor的范围: RetinaNet中是anchor范围是32~512,这里应根据任务检测目标的范围确定,按需调整anchor范围,或目标变化范围太大如MS COCO,这时候应采用多尺度测试。

anchor的形状数量: RetinaNet每个位置预测三尺度三比例共9个形状的anchor,这样可以增加anchor的密度,但stride决定这些形状都是同样的滑窗步进,需考虑步进会不会太大,如RetinaNet框架前景阈值是时,一般anchor大小是stride的4倍左右。

该部分anchor内容参考于:

3、在ROI Pooling上做文章,文章SINet: A Scale-Insensitive Convolutional Neural Network for Fast Vehicle Detection 认为小目标在pooling之后会导致物体结构失真,于是提出了新的Context-Aware RoI Pooling方法。

4、用生成对抗网络(GAN)来做小目标检测:Perceptual Generative Adversarial Networks for Small Object Detection。

1、从COCO上的统计图可以发现,小目标的个数多,占到了,但是含有小目标的图片只有,大目标所占比例为,但是含有大目标的图像却有。这说明有一半的图像是不含小目标的,大部分的小目标都集中在一些少量的图片中。这就导致在训练的过程中,模型有一半的时间是学习不到小目标的特性的。

此外,对于小目标,平均能够匹配的anchor数量为1个,平均最大的IoU为,这说明很多情况下,有些小目标是没有对应的anchor或者对应的anchor非常少的,即使有对应的anchor,他们的IoU也比较小,平均最大的IoU也才。

如上图,左上角是一个anchor示意图,右上角是一个小目标所对应的anchor,一共有只有三个anchor能够与小目标配对,且配对的IoU也不高。左下角是一个大目标对应的anchor,可以发现有非常多的anchor能够与其匹配。匹配的anchor数量越多,则此目标被检出的概率也就越大。

实现方法: 1、Oversampling :我们通过在训练期间对这些图像进行过采样来解决包含小对象的相对较少图像的问题(多用这类图片)。在实验中,我们改变了过采样率和研究不仅对小物体检测而且对检测中大物体的过采样效果

2、Copy-Pasting Strategies:将小物体在图片中复制多分,在保证不影响其他物体的基础上,增加小物体在图片中出现的次数(把小目标扣下来贴到原图中去),提升被anchor包含的概率。

如上图右下角,本来只有一个小目标,对应的anchor数量为3个,现在将其复制三份,则在图中就出现了四个小目标,对应的anchor数量也就变成了12个,大大增加了这个小目标被检出的概率。从而让模型在训练的过程中,也能够有机会得到更多的小目标训练样本。

具体的实现方式如下图:图中网球和飞碟都是小物体,本来图中只有一个网球,一个飞碟,通过人工复制的方式,在图像中复制多份。同时要保证复制后的小物体不能够覆盖该原来存在的目标。

网上有人说可以试一下lucid data dreaming Lucid Data Dreaming for Multiple Object Tracking ,这是一种在视频跟踪/分割里面比较有效的数据增强手段,据说对于小目标物体检测也很有效。

基于无人机拍摄图片的检测目前也是个热门研究点(难点是目标小,密度大)。 相关论文: The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking(数据集) Drone-based Object Counting by Spatially Regularized Regional Proposal Network Simultaneously Detecting and Counting Dense Vehicles from Drone Images Vision Meets Drones: A Challenge(数据集)

1: 2: 3: 4: 5: 6: 7:

知网论文检测会校测小标题

paperpass是以句子为单位,而且不能识别目录、标题、参考文献,会通通标红,并且的确会如你所说,出现你根本没有抄过的、无关的文章;知网是以段落为单位,目录、标题、参考文献可以自动识别。两者算法也不同。因此,paperpass的重复率一定是高于知网的。也就是说paperpass比知网严格。你用paperpass测出来18%,学校用知网要求20%,肯定能过的。即使你没有把参考文献贴进去。因为知网不会把你的参考文献作为抄袭率。

在知网检测,论文的标题是会被检测的,不用影响最后的检测结果,关键就是看你论文内容的查重结果。

一、论文查重查哪些内容整体一般情况下一篇论文主要包括:封面、扉页、原创性说明、摘要、英文摘要、图标及公式说明、论文正文、参考文献、附录、研究成果、致谢。二、毕业论文论文查重哪些部分首先一篇完整的毕业论文主要包括以下内容:封面、声明、中英文摘要、目录、主要符号对照表、正文、致谢、参考文献、附录、原创性声明或者授权声明、个人简历、导师简介、学习期间发表的学术论文等部分组成。其中正文部分,通常是由引文、摘要、各部分章节、总结等部分组成。大多数高校在每年毕业季时,都会统一发通知说明学校的毕业论文规范和查重说明,学校会统一下发论文样式等内容,一般会详细说明查重的范围。要是学校有具体的要求,那提交到学校的时候必须按照学校所要求的来。三、论文查重具体查什么论文查重,在上传查重系统检测时,是全文上传的。通常论文查重也是全文内容都需要查重,但查重重点一般为论文正文内容,部分高校会明确规定只查重论文正文,对于这种情况,类似于学客行论文官网论文查重时仅需上传论文正文即可。根据论文的章节分章之后,在各章节分别检测查重,得出章节查重率,以及全文查重率。章节区分一般以论文的目录为基准,论文的目录、参考文献、摘等内容都可以被论文查重系统所识别。论文查重主要查的内容:正文部分,至于摘要、文献类会自动识别计入查重率,图表类是不会检测出。以上论文查重都查哪些部分内容,希望对你有所了解。学客行论文重查免费好用,希望对你有所帮助。

当你写论文时,一篇文章中总会有一个题目,无论是杂志文章,还是我们考试的作文,甚至是毕业论文都是有标题的。毕业论文上传到查重系统进行检测时,是否应该上传论文标题?对于这位有疑问的同学,可能是这个原因,论文查重系统是检测在论文正文内容,而不是题目,所以我不加题目也无所谓。当你提前提交论文给院校核对毕业论文进行查重时,需要检测表示内容由你决定。所以检测是否上传题目由你决定。不过我建议在上传论文的时候,最好加上论文的标题,因为每天发给毕业论文查重机构检测的论文有几百篇,那么多论文里你的文章都没有标题,查重后很难知道哪篇论文是你的。为了更方便的得到结果,我们还是在查重的时候加上论文标题。在学校检测大家论文的时候,论文的题目基本都是要求上传的。学校的毕业论文检测的时候,当然一切按照学校的要求进行。毕竟你的论文通过与否,能否顺利毕业,都是由学校来决定的。学校查重前,建议你提前检测检查论文。成绩出来后,我可以提前修改论文检测后的重复文字部分,直接提交学校查重。大部分成绩不合格,重复率达不到规定值。为了论文顺利通过,顺利毕业,选择提前对毕业论文进行查重,这样会让之后通过学校的查重更加有信心。

小目标检测论文推荐

一、图片输入层面 基于以上结论,采用多尺度训练过程中,要在避免那些极小的和极大的(多尺度后)带来的不好的影响时,考虑保证目标有足够的多样性。所以在进行多尺度训练过程中,将每种输入尺度下,不满足要求的proposal以及anchor忽略。论文中使用了三种尺度如图所示,比一般的多尺度训练的尺度跨度要大。 二、 Neck部分(采用金字塔结构改进方案的) 一般意义的FPN网络结构是最右边似的结构,而本文中采用的结构则是 该方法首先无疑是增加了计算量,优点就是最终输出的每一层的特征不是一个线性的变换(应该想表述的说不是从一层特征直接到另一层特征),而是使用共享的多层特征。最终相比RetinaNet提升一个点左右吧,效果一般。VisDrone2020检测的冠军团队采用了这个结构 该文章利用多个TUM模块试图更充分构建的特征金字塔的网络结构,靠前的TUM提供浅层特征,中间的TUM提供中间层特征,靠后的TUM提供深层特征,通过这种方式能够多次将深层浅层特征融合,参数量多了。和RetinaNet对比可以看到,512输入,都不采用multi-scale推理,mAP由33提升到,小目标精度也提升了一点;以参数量和计算量堆砌的精度提升,不是好方法。 文章认为不同层的重要程度应该和目标的绝对尺度分布有关系,所以在FPN自上而下融合的时候,加入了一个尺度因子用来平衡金字塔不同层的重要性。个人感觉意义不大,实际提升也不明显。 三、 Head部分的改进方案 在VisDrones上的冠军方案和若干其他方案都采用了这种“双头部”的方案。soft-NMS似乎可以提升几个点。 四、 小目标目前检测不好,主要原因不是小,应该是小且和背景接近,对比度不高。所以可以借鉴伪装物体检测的思路;

论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :

小目标检测综述论文

一、图片输入层面 基于以上结论,采用多尺度训练过程中,要在避免那些极小的和极大的(多尺度后)带来的不好的影响时,考虑保证目标有足够的多样性。所以在进行多尺度训练过程中,将每种输入尺度下,不满足要求的proposal以及anchor忽略。论文中使用了三种尺度如图所示,比一般的多尺度训练的尺度跨度要大。 二、 Neck部分(采用金字塔结构改进方案的) 一般意义的FPN网络结构是最右边似的结构,而本文中采用的结构则是 该方法首先无疑是增加了计算量,优点就是最终输出的每一层的特征不是一个线性的变换(应该想表述的说不是从一层特征直接到另一层特征),而是使用共享的多层特征。最终相比RetinaNet提升一个点左右吧,效果一般。VisDrone2020检测的冠军团队采用了这个结构 该文章利用多个TUM模块试图更充分构建的特征金字塔的网络结构,靠前的TUM提供浅层特征,中间的TUM提供中间层特征,靠后的TUM提供深层特征,通过这种方式能够多次将深层浅层特征融合,参数量多了。和RetinaNet对比可以看到,512输入,都不采用multi-scale推理,mAP由33提升到,小目标精度也提升了一点;以参数量和计算量堆砌的精度提升,不是好方法。 文章认为不同层的重要程度应该和目标的绝对尺度分布有关系,所以在FPN自上而下融合的时候,加入了一个尺度因子用来平衡金字塔不同层的重要性。个人感觉意义不大,实际提升也不明显。 三、 Head部分的改进方案 在VisDrones上的冠军方案和若干其他方案都采用了这种“双头部”的方案。soft-NMS似乎可以提升几个点。 四、 小目标目前检测不好,主要原因不是小,应该是小且和背景接近,对比度不高。所以可以借鉴伪装物体检测的思路;

案例描述不是记录流水帐,而只是对于非常典型的代表性的情景进行勾画。这是我为大家整理的案例综述论文范文,仅供参考!

语文教学案例分析研究

摘 要:我国语文教学的困难和问题,主要出在教学内容上,而不仅仅是教学方法上。本文将用分析法,从课堂的导入、教学过程、教学内容的达成和对教学的思考四个方面,对郑桂华老师《陋室铭》课例进行研讨,和大家一起共同学习郑桂华老师丰富的教学经验和高超的教学能力。

关键词:分析法:郑桂华;语文教学;教学案例;分析

郑桂华老师是课程与教学论专业语文教育方向的博士,本人有幸现场聆听到郑老师执教的《陋室铭》,给了我极大的震撼,给了我实实在在的收获、语文的收获。感触之余,写了下面这篇小文。我将从以下四个方面展开分析讨论:关于本节课的导入;关于课堂教学过程;关于教学内容的达成;关于对教学的思考。我坚信,研习郑老师这节课,将改变我们上课的方式,理解新课程带给我们的实惠。

一、 关于本节课的导入

王荣生教授曾这样评价郑桂华老师:郑桂华的课有行云流水般的家常味,真实、真切,让人感受课堂的美好。①我深有同感,郑老师在唠家常的同时是在“收买人心”,拉近与学生的关系,营造一个轻松活跃的课堂氛围,我们可以先来欣赏一下她独特的导入:

(课间,教师走进教室,还未上课,学生三三两两的在交谈)

师:(问坐在前排的同学)你们班有多少同学呀?

生:62.师:你们班的语文科代表是谁呀?

生:(科代表举手示意)老师,是我。

师:你叫什么名字呀?

(此时教室已经安静下来,学生都坐在自己的座位上)

生:我叫李月菡。

师:好名字。可是你知道父母为什么要给你取这个名字呢?

生:不知道。

师:我猜想啊。“李”是你家的姓,“月”是月亮,“菡”就是菡萏,也就是荷花的意思,你父母取名是寓意你像月亮一样洁白,像荷花一样美丽。老师说得不错吧。

生:好像有这么一层含义。那老师你叫什么名字呢?

师:我姓郑,叫桂华。你们能说说名字的含义吗?

生:我猜想是这样的:“郑”是应该是姓,“桂”是“桂林山水甲天下”的“桂”,我猜老师是桂林人,老师像桂林山水一样的漂亮。“华”是中华的“华”,就是要热爱自己的祖国。

师:大家看看我,就知道我并不漂亮,我也不是桂林人,我是陕西人。

生:我想“桂”是桂花的“桂”,寓意是桂花一样的清香,“华”是春华秋实的“华”,意思是你的父母希望你做一个踏实的人。

师:这位同学好有学问啊,用了成语春华秋实,那你为什么不用华而不实呢?

生:华而不实是贬义词。

师:华而不实是贬义词就不能用啊,好聪明。(同学们都笑了)。“郑”郑和的郑,是我家的姓,但是和郑和没关系啊,虽然我很想有点关系,但不是一个地方的。“桂华”其实就是“桂花”。一是古代花者,华也,“华”跟“花”是想通的。二来是我是在秋天生的,桂花也在秋天开放。“华”也许和刚才同学说的“春华秋实”有关,因为父母希望我们做个一个春华秋实的的踏实的人,不做华而不实的人。可见,父母给我们取名字是有讲究的。其他同学还愿意分享自己名字的学问吗?(依次有几位同学起来分享自己名字的寓意,课堂气氛非常活跃。此时,上课铃想了起来)

看似闲庭漫步的唠家常,其实是实实在在的“春华秋实”,这节课的导入不是给人以震撼的视频画面,不是语句优美的散文诗,也不是为了“传道授业解惑”而预设的教学情境,就是简简单单的交谈,现实生活中的普通的沟通和交流。也就是这种交流,消除了老师和学生彼此之间的陌生感、畏惧感,为课堂上的交流扫清心理障碍。为此,郑老师的良苦用心得到了学生的回应,整节课几乎全部学生都举手发言,分享自己的想法。也许,这就是郑桂华老师借班上课的底气:不惧怕学生语文基础不好、学习不主动、上课发言少。但是,面对一群愿说、能说、会说的学生时,郑老师又是如何解决的呢?接下来我们从教学过程和教学内容的达成加以分析。

二、 关于课堂教学过程

上面的“开场白”虽然没有进入教学情境,但是学生的思维都已经聚焦在老师身上,接下来就是学生在老师的指引下学习的过程。我们先看一下本节课的教学流程:

王荣生教授说“流程”是课堂教学从起点到终点的过程,即课堂教学的连贯过程。②郑老师这节课符合“流程”的教学观,就是“根据学生的学情导向这节课的终点”,也就是“学生随着老师走”。教学伊始,教师的发问埋下了一个“炸弹”,“同学们,知道今天要上的课文吗?”“知道。”“预习过吗?”“预习了!”“预习到什么程度了?”“会背!会翻译了!”我想此时所有听课的老师都在为郑老师捏一把汗,按照郑老师本人的话来说就是:遇到大麻烦了。文言文预习到会背会翻译了,那这课还有什上的呢?恰恰这就是郑老师的睿智之处――关注学情,顺势而导,导出了“子云宅”的问题。接下来的课便是顺风顺水,由“子云宅”引出押韵,押韵引出朗读,朗读引出写作意图,环环相扣,层层剖析,学生的思维已完全被郑老师掌控了,也深深被郑老师渊博的学识而折服。

这样的教学丝毫没有拖泥带水的感觉,更像是随着学生学习的情况而进行的行云流水般的自然,不搪塞,不僵硬。

三、 关于教学内容的达成

郑老师善于找到教学的突破口。当得知学生已经预习的很充分时,教师立即改变了教学重心,再讲学生已经掌握的只是已经没有太多的意义。那么怎么知道学生掌握了哪些知识,哪些没掌握呢?此时,郑老师就来检测一下学生预习的情况。这样就检测出了“子云宅”的问题,给这节课找了一个突破口,化解了老师重复讲解学生已学知识的尴尬局。教师化解了挑战顺势而导,开始了精彩的课堂,

课堂有高度,有深度。就在“子云宅”这个问题上深究一下,其他老师上课

时一般不会苦口婆心的绕一大弯子,要么直接告诉学生是为了押韵的需要,或者就不涉及这个问题,反正课文也没这个知识点。郑老师却不这样做,而是提示和指导学生朗读,激励学生自己感悟发现问题,挖出有利于教学的知识。这样不得不说老师的备课的认真。我们可以来看一张老师的幻灯片: “馨”属于“青部”,“下平”9 《广韵》

“琴”属于“侵部”,“下平”12 《广韵》

按照《广韵》中的要求:不在同一部的字是不能押韵的。

在引入“押韵”后,郑老师好像意犹未尽的样子,又引出了“要是“馨”算押韵,那么“琴”字应该算押韵的,这是怎么回事呢?”的问题。现在看来,这完全是郑老师给这个课堂布的一个大局,从教师准备的课件来看就会明白了。学生给老师挑战,老师给学生一大疑难,这样老师才能镇得住课堂,学生才会跟着老师的节奏继续学习。

德国教育家第斯多惠(FriedriehAdolfwi]helmDisterwegl790一1866年)阐述了他对教学艺术的深刻见解:“教学的艺术不在于传授的本领,而在于关于激励、唤醒、鼓舞。而没有兴奋的情绪怎么能激励,没有主动性怎么能唤醒沉睡的人,没有生气勃勃的精神,怎么能鼓舞人呢?只有生气才能产生生气,死气只能从死气而来。所以你要尽可能多地习惯于蓬勃的生气”。③这种“激励、唤醒、鼓舞”艺术在这节课堂教学内容的达成中无疑能够得到很好的验证。

四、 关于教学的思考

1、 语文“教什么”

语文“教什么”,钱梦龙老师认为认为,教语文第一就是要教会学生抓住文章的灵魂。教会学生抓住文章的灵魂,也就教会学生读文章的方法,其中之一就是教会学生朗读课文,培养学生的语感。这篇《陋室铭》是较短的文言文,又是篇韵文,朗读肯定是十分重要的。郑老师在指导学生如何朗读的时候却不是从读入手,而是从押韵入手。这样学生就理解了如何押韵,怎样押韵,读起来就更有自己的感觉,更容易体悟文章内容。

语文的“教”要关注学情。老师面对的一群基础扎实、能说会道、高度自觉的学生时,重讲文言词汇和翻译之类的学生已经掌握的知识,课堂效果肯定是热闹非凡。只是这样的课堂会是无趣的,具有了表演性质,也没了本真,学生在课堂是得不到实惠,得不到成长。或许,老师也不一定能驾驭这样的课堂。真实的课堂,真实的教学,需要关注学生的学情,这样学生才可能学有所得,获得进步。

语文“教是为了不教”,要突破“教课文教知识” 的局限。在实际教学中,教师要发觉每一篇课文独特的“语文价值”。本节课中,需要探讨的就是作者写陋室的意图。由于时间问题,郑老师没把这个问题深谈下去,可是在学生心中种了“问题”,从“铭” 的解释开始,教师就一直在引导学生对“陋室”的探讨,特别是选用刘禹锡《秋词》来加以印证,学生也明白了古人失意时的自勉和自我肯定的价值。

2、 备课“背什么”

课堂上教师的课堂呈现直接关系着学生学习的行为。目前对语文信息的展示泛滥成灾,并且都只是停留在表层信息的咀嚼,语文课有两个极端:教师讲的内容学生都懂和教师讲的学生都不懂。这两种课堂,学生都不愿意听,不感兴趣。郑老师的课没有落入这两个极端,是因此教师明白了学生的需求,真正从学生出发设计教学,从学生的实际情况从发,关注学生的成长。 那么,教师的备课就着重从学生的学情出发,备学生,备教材,预设学生的需求。只有这样,学生在课堂上才会都有事可做,学有所得。

3、 课堂教学的预设与生成

充分的预设,是课堂教学成功的保障。只有课前精心预设,才能在课堂上动态生成。然而课堂教学是千变万化的,再好的预设也不可能预见课堂上可能出现的所有情况。课堂上出现了意料之外的情况,教师可以而且应该调整预设,给生成腾出空间,机智地驾驭课堂,让课堂呈现别样的精彩。感受课堂教学活跃的气氛同时,更要关心学生是不是驻留了与教学内容相应的语文体验。关注语文课程目标的有效达成。因此,课前教师应对教学目标、教学内容、教学过程、教学方法预先设计,并在实际教学中,根据学情的变化,对目标、内容、过程、方法的适当调整。课堂教学中需要教师运用教学机智和合理调控,发掘有价值的问题,精当的点拨或讲解,使课堂闪光,使学生顿悟,使学生在知识、能力或方法上实现自我建构。

参考文献:

[1] 王荣生.听王荣生教授评课[M].上海:华东师范大学出版社,2007:84.

[2] 谢利民,郑百伟.现代教学基础理论[M].上海:上海教育出版社,2003:331一332,344.

[3] 钱理群,孙绍振,王富仁. 解读语文[M].福州:福建人民出版社,2010:278-287.

[4] 新课程实施过程中培训问题研究课题组编写.新课程的理念与创新[M].北京师范大学出版社,2001:82- 83,59.

[5] 周敏.语文课程“动姿化”知识教学研究[M].长沙:湖南师范大学出版社,

[6] 李字辉.关心教学组织形式的建构[J].天津师范大学学报(基础教育版),2006,(9).

[7] 刘济良.论科学技术对人的异化与教育对人的价值世界的重建[J].教育理论与实践,2003,

[8] 周相玲.关心型师生关系的研究「J].长春:东北师范大学硕十学位论文,2007.

注解:

① 王荣生.听王荣生教授评课[M].上海:华东师范大学出版社,2007:84.

② 王荣生.听王荣生教授评课[M].上海:华东师范大学出版社,2007:84.

③ 谢利民,郑百伟.现代教学基础理论[M].上海:上海教育出版社,2003:331一332,344.

中学班级管理案例研究

〔摘 要〕面对新课程改革下学生学习压力大,教学管理难的情况下。本文结合自己教育教学实践体会,分析其教育对象,收集生活中的教育教学案例20多篇,并从教育理论的角度进行分析提升,形成理论,形成了一个个的教育故事,以理论来指导自己的教育教学,使自己的教育教学水平进一步得到提升。

〔关键词〕班级管理 教学案例

时间过得飞快,转眼间又是一年,回顾2011―2012学年度是忙碌的一年,紧张的一年,也是收获的一年,有着许多故事的一年。

一、后进生转化

2012年03月06日

我听了魏书生的报告我感受最深的是:后进生的转化:后进生的转化不能叫来一批评就完事,应该给孩子制定出可以够得着的计划,慢慢的是孩子有信心,一点点的进步。

二、赏识别人

2012年03月08日

今天一大早我带学生刚跑完操,接下来同学们回教室早读。我一到教室就发现孩子们闹哄哄,有吃的、有喝的、有交作业的,当然大部分已开始读书。但我总觉得不对劲,于是我到一班去看了一下,很静都在学习。然后我回到教室,我没有发火,而是很平和的在每个小组找了一个代表,让他们悄悄地到一班看一下,接下来我什么也没说,我就会办公室了,等过了2分钟后,我再去教室时孩子们很安静都在学习,我很高兴。

三、看到的并不是那样

2012年03月10日

今早上我读了一则小故事,故事大概内容是这样的:两个天使来到人间,第一天来到一个富人家里,富人很冷淡的接待了她们,而且晚间让她们住到了冰冷的地下室了。老天使发现墙上有一个洞,就使法把洞补了。第二天来到一个穷人家里,穷人很热情的用仅剩的一点粥接待了她们,而且腾出自己的屋子让她们住。第三天一大早她们发现穷人夫妇抱头痛哭,他们的牛死了。小天使问老天使:“富人很冷淡的对我们,而且晚间让我们住到了冰冷的地下室,你都帮他补了墙洞。这家穷人对我们这么好,你为什么不帮他们。”老天使说:“并不是你看到的那样,我补墙是因为我看到墙里全是金银财宝,我不想让他得到。我没有救他们的牛,是因为昨晚老天要索回穷人夫人的命,我让牛代替了”。

于是我想到了我们老师、孩子和家长之间,并不是个人看到的那样,需要相互多沟通,才能了解孩子。

四、压不住的火

2012年3月16日下午辅导课,我很耐心的、认真的讲课,因为我觉得该班孩子基础差。可中间有2个孩子不认真听,不知在说什么。我不停地暗示,多次用目光提示,可是始终没能起作用。终于我被激怒,我觉得课堂是神圣的,不认真,且做了暗示不停止,是对我的不尊重。我毫不客气的用书抽了几下,当中进行了批评。2012年3月17日早上,我再次上课,化学课我做实验,氢氧化钡与氯化铵的吸热反应,我很有意的让每个学生感受的,在更有意识的让批评的两个孩子感受,消除孩子的心理感。我觉得孩子很容易接受,我们彼此的隔阂也近而消失,我心里也觉得轻松了好多。

五、众口难调

2012年3月24日晚,刚下班回家,接到了一个电话,该电话来自与我们班家长。正是这个电话让我一夜难眠。原因是这样的:2012年3月24日下午学校给我们开了上学期质量分析会,学生从一位老师那里看到了各科平均成绩,因为一科成绩比平行班差了4分,孩子回家告诉家长,家长从孩子那里得到了一些情况,于是就给我这个班主任打电话。说孩子这课听不懂,孩子上课都是自学,就谈了一些老师的问题。我安抚了家长,可此事却让我很为难,一直到晚上怎么也睡不着。第二天一大早,我就到学校,分别了解了10多位同学的意见(有年级的第1名,有班上最后一名)。有认可的,有觉得不好的,真是众口难调,老师难当呀。最后,我拨通了家长的电话:

1、该老师是我们的把关老师,没有问题。

2、该老师知识面宽,采用发散是教学,是您的孩子上高中不适应。

3、请你放心,相信我们的老师。

六、不要太护自己的孩子

2012年4月11日。我吃过饭,提前到了教室,不巧的是我发现四个学生在教室打牌。我当时很生气,为了教育四个孩子,吓唬吓唬,我让四个学生收拾书包,将他们带到了德育处。在德育处老师的教育下,四个孩子认识到了自己的错误,并答应回家后写出深刻检查,让家长签字。可谁知,四人离开学校后,商量不告诉家长。第二天一大早 ,四个人一起去了德育处,没有来教室。于是我一一打电话告知家长:孩子没到校。三个家长都很同情理,说回家批评教育。可以一家长很不讲理,他已经知道孩子在德育处,反过来问我,那我孩子如果昨天不回家怎么办?我一听就火了。我毫不客气的告诉他:

1、你已经知道了孩子在德育处,反过来问我,孩子如果不回家怎么办?想干什么?这是要挟老师。

2、你这是在护孩子,不找孩子的错。

3、我是不是以后每天的把你的孩子送回家,万一哪天他没回家怎么办?

4、你的孩子谁以后还敢管。

我觉得老师管你的孩子才是负责的,你不找自己还的错,太护孩子了,这样会害了孩子。请不要太维护自己的孩子。

七、勿以善小而不为 勿以恶小而为之

2012年12月16日,今天一天没课,本应该是“幸福”的一天,但并不是那样的,对我来说是阴暗一天,我比较狠心的一天。下午第一节课――物理,张老师检查作业,发现6个学生没写被赶了出来。本班学生一直很乖,作业都能按时完成,每次家长会我都以表扬为主,也很少发现学生什么缺点,对学生一直也很放心。本以为很小的一件事,但我的发现是吃惊的,几个学生从期中考完事,就没有认真写物理作业。

今天天气很冷(3度),我就把学生的练习册从第1页到80页逐页翻阅,发现一处就折一页,20页为低线,结果没有一个合格(都超过20页)。于是我狠心的将他们站在外面,要求叫家长,6个孩子都站在外面冻的发抖,我心里也不忍,那天晚上我也替他们担心了一晚,怕他们因为我而生病,还好第2天孩子们都来了才算放心。。目的是从小事教育他们,任何事都要认真,任何小事都不能原谅,要在学生中威严。当然最终我也达到了自己的目的,我觉得勿以善小而不为,勿以恶小而为之。

总之,作好班级管理工作绝非一朝一日的事。但我认为:只要持之以恒从实际工作中的点滴出发,相信您的班级管理定能有起色!

目标检测与跟踪小论文

小目标问题在物体检测和语义分割等视觉任务中一直是存在的一个难点,小目标的检测精度通常只有大目标的一半。

CVPR2019论文: Augmentation for small object detection 提到了一些应对小目标检测的方法,笔者结合这篇论文以及查阅其它资料,对小目标检测相关技巧在本文进行了部分总结。

小目标的定义: 在MS COCO数据集中,面积小于 32*32 的物体被认为是小物体。

小目标难以检测的原因: 分辨率低,图像模糊,携带的信息少。由此所导致特征表达能力弱,也就是在提取特征的过程中,能提取到的特征非常少,这不利于我们对小目标的检测。

1、由于小目标面积太小,可以放大图片后再做检测,也就是在尺度上做文章,如FPN(Feature Pyramid Networks for Object Detection),SNIP(An Analysis of Scale Invariance in Object Detection – SNIP)。

Feature-Fused SSD: Fast Detection for Small Objects, Detecting Small Objects Using a Channel-Aware Deconvolutional Network 也是在多尺度上做文章的论文。

2、在Anchor上做文章(Faster Rcnn,SSD, FPN都有各自的anchor设计),anchor在设置方面需要考虑三个因素:

anchor的密度: 由检测所用feature map的stride决定,这个值与前景阈值密切相关。

anchor的范围: RetinaNet中是anchor范围是32~512,这里应根据任务检测目标的范围确定,按需调整anchor范围,或目标变化范围太大如MS COCO,这时候应采用多尺度测试。

anchor的形状数量: RetinaNet每个位置预测三尺度三比例共9个形状的anchor,这样可以增加anchor的密度,但stride决定这些形状都是同样的滑窗步进,需考虑步进会不会太大,如RetinaNet框架前景阈值是时,一般anchor大小是stride的4倍左右。

该部分anchor内容参考于:

3、在ROI Pooling上做文章,文章SINet: A Scale-Insensitive Convolutional Neural Network for Fast Vehicle Detection 认为小目标在pooling之后会导致物体结构失真,于是提出了新的Context-Aware RoI Pooling方法。

4、用生成对抗网络(GAN)来做小目标检测:Perceptual Generative Adversarial Networks for Small Object Detection。

1、从COCO上的统计图可以发现,小目标的个数多,占到了,但是含有小目标的图片只有,大目标所占比例为,但是含有大目标的图像却有。这说明有一半的图像是不含小目标的,大部分的小目标都集中在一些少量的图片中。这就导致在训练的过程中,模型有一半的时间是学习不到小目标的特性的。

此外,对于小目标,平均能够匹配的anchor数量为1个,平均最大的IoU为,这说明很多情况下,有些小目标是没有对应的anchor或者对应的anchor非常少的,即使有对应的anchor,他们的IoU也比较小,平均最大的IoU也才。

如上图,左上角是一个anchor示意图,右上角是一个小目标所对应的anchor,一共有只有三个anchor能够与小目标配对,且配对的IoU也不高。左下角是一个大目标对应的anchor,可以发现有非常多的anchor能够与其匹配。匹配的anchor数量越多,则此目标被检出的概率也就越大。

实现方法: 1、Oversampling :我们通过在训练期间对这些图像进行过采样来解决包含小对象的相对较少图像的问题(多用这类图片)。在实验中,我们改变了过采样率和研究不仅对小物体检测而且对检测中大物体的过采样效果

2、Copy-Pasting Strategies:将小物体在图片中复制多分,在保证不影响其他物体的基础上,增加小物体在图片中出现的次数(把小目标扣下来贴到原图中去),提升被anchor包含的概率。

如上图右下角,本来只有一个小目标,对应的anchor数量为3个,现在将其复制三份,则在图中就出现了四个小目标,对应的anchor数量也就变成了12个,大大增加了这个小目标被检出的概率。从而让模型在训练的过程中,也能够有机会得到更多的小目标训练样本。

具体的实现方式如下图:图中网球和飞碟都是小物体,本来图中只有一个网球,一个飞碟,通过人工复制的方式,在图像中复制多份。同时要保证复制后的小物体不能够覆盖该原来存在的目标。

网上有人说可以试一下lucid data dreaming Lucid Data Dreaming for Multiple Object Tracking ,这是一种在视频跟踪/分割里面比较有效的数据增强手段,据说对于小目标物体检测也很有效。

基于无人机拍摄图片的检测目前也是个热门研究点(难点是目标小,密度大)。 相关论文: The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking(数据集) Drone-based Object Counting by Spatially Regularized Regional Proposal Network Simultaneously Detecting and Counting Dense Vehicles from Drone Images Vision Meets Drones: A Challenge(数据集)

1: 2: 3: 4: 5: 6: 7:

运动目标检测与跟踪算法研究 视觉是人类感知自身周围复杂环境最直接有效的手段之一, 而在现实生活中 大量有意义的视觉信息都包含在运动中,人眼对运动的物体和目标也更敏感,能 够快速的发现运动目标, 并对目标的运动轨迹进行预测和描绘。 随着计算机技术、 通信技术、图像处理技术的不断发展,计算机视觉己成为目前的热点研究问题之 一。 而运动目标检测与跟踪是计算机视觉研究的核心课题之一, 融合了图像处理、 模式识别、人工智能、自动控制、计算机等众多领域的先进技术,在军事制导、 视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实 用价值和广阔的发展前景。 1、国内外研究现状 运动目标检测 运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。 根据运动目标与摄像机之间的关系, 运动目标检测分为静态背景下的运动目标检 测和动态背景下的运动目标检测。 静态背景下的运动目标检测是指摄像机在整个 监视过程中不发生移动; 动态背景下的运动目标检测是指摄像机在监视过程中发 生了移动,如平动、旋转或多自由度运动等。 静态背景 静态背景下的运动目标检测方法主要有以下几种: (1)背景差分法 背景差分法是目前最常用的一种目标检测方法, 其基本思想就是首先获得一个 背景模型,然后将当前帧与背景模型相减,如果像素差值大于某一阈值,则判断 此像素属于运动目标,否则属于背景图像。利用当前图像与背景图像的差分来检 测运动区域,一般能够提供比较完整的特征数据,但对于动态场景的变化,如光 照和外来无关事件的干扰等特别敏感。 很多研究人员目前都致力于开发不同的背 景模型,以减少动态场景变化对运动目标检测的影响。背景模型的建立与更新、 阴影的去除等对跟踪结果的好坏至关重要。 背景差分法的实现简单,在固定背景下能够完整地精确、快速地分割出运动 对象。不足之处是易受环境光线变化的影响,需要加入背景图像更新机制,且只 对背景已知的运动对象检测比较有效, 不适用于摄像头运动或者背景灰度变化很 大的情况。 (2)帧间差分法 帧间差分法是在连续的图像序列中两个或三个相邻帧间, 采用基于像素的时 间差分并阈值化来提取图像中的运动区域。 帧间差分法对动态环境具有较强的自 适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产 生空洞现象。因此在相邻帧间差分法的基础上提出了对称差分法,它是对图像序 列中每连续三帧图像进行对称差分,检测出目标的运动范围,同时利用上一帧分 割出来的模板对检测出来的目标运动范围进行修正, 从而能较好地检测出中间帧 运动目标的形状轮廓。 帧间差分法非常适合于动态变化的环境,因为它只对运动物体敏感。实际上 它只检测相对运动的物体,而且因两幅图像的时间间隔较短,差分图像受光线 变化影响小,检测有效而稳定。该算法简单、速度快,已得到广泛应用。虽然该 方法不能够完整地分割运动对象,只能检测出物体运动变化的区域,但所检测出 的物体运动信息仍可用于进一步的目标分割。 (3)光流法 光流法就充分的利用了图像自身所携带的信息。在空间中,运动可以用运动 场描述,而在一个图像平面上,物体的运动往往是通过图像序列中图像灰度分布 的不同来体现,从而使空间中的运动场转移到图像上就表示为光流场。所谓光流 是指空间中物体被观测面上的像素点运动产生的瞬时速度场, 包含了物体表面结 构和动态行为等重要信息。 基于光流法的运动目标检测采用了运动目标随时间变 化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动 和景物三位结构的丰富信息。 在比较理想的情况下,它能够检测独立运动的对象, 不需要预先知道场景的任何信息,可以很精确地计算出运动物体的速度,并且可 用于动态场景的情况。 但是大多数光流方法的计算相当复杂,对硬件要求比较高, 不适于实时处理,而且对噪声比较敏感,抗噪性差。并且由于遮挡、多光源、透明 性及噪声等原因,使得光流场基本方程——灰度守恒的假设条件无法满足,不能 正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。 动态背景 动态背景下的运动目标检测由于存在着目标与摄像机之间复杂的相对运动, 检测方法要比静态背景下的运动目标检测方法复杂。常用的检测方法有匹配法、 光流法以及全局运动估计法等。 2、运动目标跟踪 运动目标跟踪是确定同一物体在图像序列的不同帧中的位置的过程。 近年来 出现了大批运动目标跟踪方法,许多文献对这些方法进行了分类介绍,可将目标 跟踪方法分为四类:基于区域的跟踪、基于特征的跟踪、基于活动轮廓的跟踪、 基于模型的跟踪,这种分类方法概括了目前大多数跟踪方法,下面用这种分类方 法对目前的跟踪方法进行概括介绍。 (1)基于区域的跟踪 基于区域的跟踪方法基本思想是: 首先通过图像分割或预先人为确定提取包 含目标区域的模板,并设定一个相似性度量,然后在序列图像中搜索目标,把度 量取极值时对应的区域作为对应帧中的目标区域。 由于提取的目标模板包含了较 完整的目标信息,该方法在目标未被遮挡时,跟踪精度非常高,跟踪非常稳定, 但通常比较耗时,特别是当目标区域较大时,因此一般应用于跟踪较小的目标或 对比度较差的目标。该方法还可以和多种预测算法结合使用,如卡尔曼预测、粒 子预测等,以估计每帧图像中目标的位置。近年来,对基于区域的跟踪方法关注 较多的是如何处理运动目标姿态变化引起的模板变化时的情况以及目标被严重 遮挡时的情况。 (2)基于特征的跟踪 基于特征的跟踪方法基本思想是:首先提取目标的某个或某些局部特征,然 后利用某种匹配算法在图像序列中进行特征匹配,从而实现对目标的跟踪。该方 法的优点是即使目标部分被遮挡,只要还有一部分特征可以被看到,就可以完成 跟踪任务,另外,该方法还可与卡尔曼滤波器结合使用,实时性较好,因此常用 于复杂场景下对运动目标的实时、 鲁棒跟踪。 用于跟踪的特征很多, 如角点边缘、 形状、纹理、颜色等,如何从众多的特征中选取最具区分性、最稳定的特征是基 于特征的跟踪方法的关键和难点所在。 (3)基于活动轮廓的跟踪 基于活动轮廓的跟踪方法基本思想是:利用封闭的曲线轮廓表达运动目标, 结合图像特征、曲线轮廓构造能量函数,通过求解极小化能量实现曲线轮廓的自 动连续更新,从而实现对目标的跟踪。自Kass在1987年提出Snake模型以来,基 于活动轮廓的方法就开始广泛应用于目标跟踪领域。相对于基于区域的跟踪方 法,轮廓表达有减少复杂度的优点,而且在目标被部分遮挡的情况下也能连续的 进行跟踪,但是该方法的跟踪结果受初始化影响较大,对噪声也较为敏感。 (4)基于模型的跟踪 基于模型的跟踪方法基本思想是: 首先通过一定的先验知识对所跟踪目标建 立模型,然后通过匹配跟踪目标,并进行模型的实时更新。通常利用测量、CAD 工具和计算机视觉技术建立模型。主要有三种形式的模型,即线图模型、二维轮 廓模型和三维立体模型口61,应用较多的是运动目标的三维立体模型,尤其是对 刚体目标如汽车的跟踪。该方法的优点是可以精确分析目标的运动轨迹,即使在 目标姿态变化和部分遮挡的情况下也能够可靠的跟踪, 但跟踪精度取决于模型的 精度,而在现实生活中要获得所有运动目标的精确模型是非常困难的。 目标检测算法,至今已提出了数千种各种类型的算法,而且每年都有上百篇相 关的研究论文或报告发表。尽管人们在目标检测或图像分割等方面做了许多研 究,现己提出的分割算法大都是针对具体问题的,并没有一种适合于所有情况的 通用算法。 目前, 比较经典的运动目标检测算法有: 双帧差分法、 三帧差分法(对 称差分法)、背景差法、光流法等方法,这些方法之间并不是完全独立,而是可 以相互交融的。 目标跟踪的主要目的就是要建立目标运动的时域模型, 其算法的优劣直接影响 着运动目标跟踪的稳定性和精确度, 虽然对运动目标跟踪理论的研究已经进行了 很多年,但至今它仍然是计算机视觉等领域的研究热点问题之一。研究一种鲁棒 性好、精确、高性能的运动目标跟踪方法依然是该研究领域所面临的一个巨大挑 战。基于此目的,系统必须对每个独立的目标进行持续的跟踪。为了实现对复杂 环境中运动目标快速、稳定的跟踪,人们提出了众多算法,但先前的许多算法都 是针对刚体目标,或是将形变较小的非刚体近似为刚体目标进行跟踪,因而这些 算法难以实现对形状变化较大的非刚体目标的正确跟踪。 根据跟踪算法所用的预 测技术来划分,目前主要的跟踪算法有:基于均值漂移的方法、基于遗传算法的 方法、基于Kalman滤波器的方法、基于Monto Carlo的方法以及多假设跟踪的方 法等。 运动检测与目标跟踪算法模块 运动检测与目标跟踪算法模块 与目标跟踪 一、运动检测算法 1.算法效果 算法效果总体来说,对比度高的视频检测效果要优于对比度低的视频。 算法可以比较好地去除目标周围的浅影子,浅影的去除率在 80%以上。去影后目标的 完整性可以得到较好的保持,在 80%以上。在对比度比较高的环境中可以准确地识别较大 的滞留物或盗移物。 从对目标的检测率上来说,对小目标较难进行检测。一般目标小于 40 个像素就会被漏 掉。对于对比度不高的目标会检测不完整。总体上来说,算法在对比度较高的环境中漏检率 都较低,在 以下,在对比度不高或有小目标的场景下漏检率在 6%以下。 精细运动检测的目的是在较理想的环境下尽量精确地提取目标的轮廓和区域, 以供高层 进行应用。同时在分离距离较近目标和进行其它信息的进一步判断也具有一定的优势。 反映算法优缺点的详细效果如下所示: 去影子和完整性 效果好 公司内视频 左边的为去影前,右边的 为去影后的结果,可以看出在 完整 性和去影率上 都有所 突 出。 这两个视频的共周特点 城市交通 是,影子都是浅影子,视频噪 声不太明显。目标与背景的对 比度比较高。 效果差 这两个视频的特点是影子 都是深影子。虽然影子没有去 掉,但是物体的完整性是比较 高的。主要原因就是场景的对 路口,上午 十点 比度比较高。 滞留物检测和稳定性 效果好 会议室盗移 效果好的原因,一是盗移或 滞留目标与背景对比度较大,二 是目标本身尺寸较大。 另外盗移物或滞留物在保持 各自的状态期间不能受到光照变 化或其它明显运动目标的干扰, 要不然有可能会造成判断的不稳 定。 效果差 会议室 遗留 物 大部分时间内,滞留的判断 都是较稳定的,但是在后期出现 了不稳定。主要原因是目标太小 的原故。 因此在进行滞留物判断时, 大目标,对比度较高的环境有利 于判断的稳定性和准确性。 漏检率 效果好 城市交通 在对比度高的环境下, 目标相对都较大的情况下 (大于 40 个像素) 可以很 , 稳定的检测出目标。 在这种 条件下的漏检率通常都是 非常低的,在 以下。 效果差 行人-傍晚 和“行人”目录下 的 其 它 昏 暗 条件 下的视频 在对 比度较低的 情况 下,会造成检测结果不稳 定。漏检率较高。主要原因 是由于去影子造成的。 这种 对比度下的漏检率一般在 6%以下。 除了 对比度低是 造成 漏检的原因外, 过小的目标 也会造成漏检,一般是 40 个像素以下的目标都会被 忽略掉。 算法效率内存消耗(单位:b) .MD_ISRAM_data .MD_ISRAM_bss .MD_SDRAM_data 0x470 0x24 0x348 .MD_SDRAM_bss .MD_text 0x1a8480 0x6d40 速度 ms 运动区域占 2/3 左右时 CPU 占用率 一帧耗时 Max:57% Min: Avg: Max:23 Min: Avg:15 运动区域占 1/3 左右时 Max:45% Min: Avg:20% Max:18 Min: Avg:8 检测参数说明 检测参数说明 检测到的滞留物或盗走物的消失时间目前分别设定在 200 帧和 100 帧, 可以通过参数来 自行调整。 目前目标与背景的差异是根据局部光照强度所决定的, 范围在 4 个像素值以上。 目前参 数设置要求目标大小要在 20 个像素以上才能被检测到,可以通过参数来自行调整。 目标阴影的去除能力是可以调整的, 目前的参数设置可以去除大部分的浅影子和较小的 光照变化。 适用环境推荐光照条件较好(具有一定的对比度)的室内环境或室外环境。不易用它去检测过小的目 标,比如小于 40 个像素的目标。室外环境不易太复杂。输出目标为精细轮廓目标,可以为 后面高层应用提供良好的信息。 二、目标跟踪 稳定运行环境要求此版本跟踪算法与运动检测算法紧密结合, 对相机的架设和视频的背景环境和运动目标 数量运动方式有一定要求: 背景要求: 由于运动跟踪是基于运动检测的结果进行的, 所以对背景的要求和运动检测一样, 背景要求: 运动目标相对于背景要有一定反差。 运动目标:由于运动检测中,对较小的目标可能过滤掉。所以运动目标的大小要符合运动检 运动目标: 测的要求。运动目标的速度不能太大,要保证前后帧运动目标的重合面积大于 10 个像素。此阈值可修改(建议不要随意修改,过小,可能把碎片当成原目标分 裂出来的小目标,过大,可能失去跟踪。当然可试着调节以适应不同场景)。该 算法对由于运动检测在地面上产生的碎片抗干扰性比较差, 运动目标和碎片相遇 时,容易发生融合又分离的现象,造成轨迹混乱。消失目标和新生目标很容易当 成同一目标处理,所以可能出现一个新目标继承新生目标的轨迹。 运动方式: 运动目标的最大数量由外部设定。 但运动跟踪对运动目标比较稀疏的场景效果比 运动方式: 较好。 算法对由于运动检测在运动目标上产生的碎片有一定的抗干扰。 算法没对 物体的遮挡进行处理。对于两运动目标之间的遮挡按融合来处理。 拍摄角度: 拍摄角度:拍摄视野比较大,且最好是俯视拍摄。

能不能给我发一份呢?

相关百科

热门百科

首页
发表服务