Pytorch——目标检测问题

214 阅读1分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第29天,点击查看活动详情


前言

今天,我们介绍目标检测问题,目标检测问题的方法和目标检测问题中的难点。


  • 1.1. 目标检测问题介绍

  • 在计算机视觉领域,我们怎样去定义“观察”(see)这个概念,和我们人类的理解一致呢?

    • 1982年Daviad Marr: To know what is where by looking(识别、检测、分割
    • 这个物体在这个真实世界当中的3D信息(SLAM)
    • 这个场景正在发生什么,希望计算机能够根据图像或者视频,我们回答一些问题(时间、问答
  • 目标检测是在图片中可变数量的目标进行查找和分类。 A{8B}R3~RNBFVRJ0MGQ$`(Q.png

    • 目标种类与数量问题
    • 目标尺度问题(可能大也可能小,要求在检测的时候适应这种问题)
    • 外在环境干扰问题(分辨率,噪声,明暗度等)
  • 1.1.1 目标检测 VS 图像分类

1.png

  • 目标检测需要拿到物体的坐标,在目标检测中主要市通过矩形框的方式来进行描述,对于一个矩形框将它表达成了四个值,一般是描述成一个左上角的坐标再加上宽和高,或者表达成一个中心点的坐标再加上宽和高,或者表达成一个左上角的坐标再加上右下角的坐标

  • 目标检测还需要拿到物体的类别,也就是说检测问题也会完成一个分类

  • 1.1.2 目标检测 VS 图像分割

image.png

  • 目标检测定位图像的力度会更粗一点,如果想要定位物体更精确的信息,需要通过分割的方法来完成。

  • 1.2 目标检测问题方法

传统目标检测方法到深度学习目标检测方法的变迁。

image.png

发展到现在,目标检测算法主要分为两个比较大的分支:

  • 1.2.1 Anchor based 目标检测问题方法
    • 算法基本流程
    • 4.png
    • 基于深度学习分目标检测问题建模
      • 理解Anchor的概念
      • 5.png
    • 目前分为两大类
      • One stage
        • SSD系列
        • YOLO系列
      • Two stage
        • FasterRCNN系列
        • MaskRCNN系列
  • Anchor based存在哪些问题?

    • 目标和anchor box匹配只看两个框重叠的大小
    • 对于anchor box的大小也是人为定义的
    • Anchor box数量太多带来大量的负样本
  • Anchor based VS Anchor Free

  • Anchor based:Anchor是目标检测中的一个重要概念,通常是人为设计的一组框,作为分类(classification)和框回归(bounding box regression)的基准框

  • Anchor Free: 通过每一个点进行匹配,无Anchor的过程

  • 1.2.2 Anchor Free 目标检测问题方法
  • 如何对目标检测问题的真值,进行表示?

    • YOLO V1(非常快)中的回归网络(中心点坐标、长和宽)
    • 基于多关键点联合表达的方法
      • CornerNet、CenterNet、ExtremeNet、RepPoints、FoveaBox、PLN
      • CenterNet:keypoint Triplets for Object Detection
    • 基于单中心点预测的方法
      • CenterNet:Objects as points:中心点+宽度+高度
      • CSP:中心点+高度
      • FCOS:中心点+到框的2个问题
  • 算法性能的评价

    • TP:标注框重叠率很高
    • FP:重叠率低(甚至没有重叠)和重复检测的框
    • precision 和recall
    • AP和mAP
  • 1.3 目标检测问题中的难点

  • 小目标检测问题

    • 由于目标太小,在进行下采样的时候,下采样比例非常大,就不太合适,需要利用浅层的网络进行检测,浅层的网络可能提取出来鲁棒性不是很好
    • 正负样本失衡
  • 遮挡目标检测问题

    • 损失很多的目标信息
    • 加入attention
  • 密集场景下的目标检测问题

    • 经常会漏检
  • 倾斜、变形物体检测问题

    • 采用四边形,一个矩形加一个角度

9JQ4ZCQY3M({Q$KEN%9BFQX.png