计算机视觉论文速递专栏有段时间没有更新论文速递了,这段时间的论文很多,但比较亮眼的论文并也不多。为了方便大家阅读,我已经将其中的目标检测(ObjectDetection)论文整理出来。也推荐大家关注计算机视觉论文速递,可以更快了解到CV的好内容!
自适应特征融合(AdaptivelySpatialFeatureFusion:ASFF).捕捉到题目中重点:Learningspatialfusion即论文主要是提出一种新的自适应融合策略,实现特征在空间上的融合,在单阶段目标检测中取得了较好的效果.这种策略作者将它命名为AdaptivelySpatialFeatureFusion(ASFF).1...
ASFF代码可以参考论文作者在github上的代码论文地址简要介绍文章所提及的yolov3baseline就不提了,简单介绍一下ASFF。金字塔特征表示是解决目标检测中目标尺度变化的常用手段。然而,不同特征尺度之间的不一致是基于特征金字塔的单镜头检测...
目标检测中特征融合技术(YOLOv4)(下)ASFF:自适应特征融合方式ASFF来自论文:《LearningSpatialFusionforSingle-ShotObjectDetection》,也就是著名的yolov3-asff。金字塔特征表示法(FPN)是解决目标检测尺度变化挑战的常用方法。
因此这篇论文提出了一种新的数据驱动的金字塔特征融合方式,称之为自适应空间特征融合(ASFF)。它学习了在空间上过滤信息以抑制梯度反传的时候不一致的方法,从而改善了特征的比例不变性,并且推理开销降低。借助ASFF策略和可靠的YOLOV3
论文指出,在Faster-RCNN系列的标检测或分割算法中,RPN网络得到的ROI需要经过ROIPooling或ROIAlign提取ROI特征,这一步操作中每个ROI所基于的特征都是单层特征,FPN同样也是基于单层特征,因为检测头是分别接在每个尺度上的。
对ASFF层输出的每一层特征图xin,进行GA分支推理,并且经过Feature_adaption,得到最终的bbox预测输出output,由于wh预测肯定是大于0的,故作者采用了exp函数强制大于0.此时就得到了wh_pred(batch,4,2,h,w)和output(batch,4,5+class,h,w)。
ASFF这篇论文被很多人认为是YOLO中最强的改进版本,不仅仅是他提出的ASFF模块,更因为他有一个非常强的、融合了很多trick的baseline。上表中的BoF代表的就是以上解读的这篇:《BagofFreebiesforTrainingObjectDetectionNeuralNetworks》,可以通过对比看到提高了大约4个百分点。
计算机视觉论文速递专栏有段时间没有更新论文速递了,这段时间的论文很多,但比较亮眼的论文并也不多。为了方便大家阅读,我已经将其中的目标检测(ObjectDetection)论文整理出来。也推荐大家关注计算机视觉论文速递,可以更快了解到CV的好内容!
自适应特征融合(AdaptivelySpatialFeatureFusion:ASFF).捕捉到题目中重点:Learningspatialfusion即论文主要是提出一种新的自适应融合策略,实现特征在空间上的融合,在单阶段目标检测中取得了较好的效果.这种策略作者将它命名为AdaptivelySpatialFeatureFusion(ASFF).1...
ASFF代码可以参考论文作者在github上的代码论文地址简要介绍文章所提及的yolov3baseline就不提了,简单介绍一下ASFF。金字塔特征表示是解决目标检测中目标尺度变化的常用手段。然而,不同特征尺度之间的不一致是基于特征金字塔的单镜头检测...
目标检测中特征融合技术(YOLOv4)(下)ASFF:自适应特征融合方式ASFF来自论文:《LearningSpatialFusionforSingle-ShotObjectDetection》,也就是著名的yolov3-asff。金字塔特征表示法(FPN)是解决目标检测尺度变化挑战的常用方法。
因此这篇论文提出了一种新的数据驱动的金字塔特征融合方式,称之为自适应空间特征融合(ASFF)。它学习了在空间上过滤信息以抑制梯度反传的时候不一致的方法,从而改善了特征的比例不变性,并且推理开销降低。借助ASFF策略和可靠的YOLOV3
论文指出,在Faster-RCNN系列的标检测或分割算法中,RPN网络得到的ROI需要经过ROIPooling或ROIAlign提取ROI特征,这一步操作中每个ROI所基于的特征都是单层特征,FPN同样也是基于单层特征,因为检测头是分别接在每个尺度上的。
对ASFF层输出的每一层特征图xin,进行GA分支推理,并且经过Feature_adaption,得到最终的bbox预测输出output,由于wh预测肯定是大于0的,故作者采用了exp函数强制大于0.此时就得到了wh_pred(batch,4,2,h,w)和output(batch,4,5+class,h,w)。
ASFF这篇论文被很多人认为是YOLO中最强的改进版本,不仅仅是他提出的ASFF模块,更因为他有一个非常强的、融合了很多trick的baseline。上表中的BoF代表的就是以上解读的这篇:《BagofFreebiesforTrainingObjectDetectionNeuralNetworks》,可以通过对比看到提高了大约4个百分点。