携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第29天,点击查看活动详情
前言
今天,我们介绍目标检测问题,目标检测问题的方法和目标检测问题中的难点。
-
1.1. 目标检测问题介绍
-
在计算机视觉领域,我们怎样去定义“观察”(see)这个概念,和我们人类的理解一致呢?
- 1982年Daviad Marr: To know what is where by looking(识别、检测、分割)
- 这个物体在这个真实世界当中的3D信息(SLAM)
- 这个场景正在发生什么,希望计算机能够根据图像或者视频,我们回答一些问题(时间、问答)
-
目标检测是在图片中可变数量的目标进行查找和分类。
- 目标种类与数量问题
- 目标尺度问题(可能大也可能小,要求在检测的时候适应这种问题)
- 外在环境干扰问题(分辨率,噪声,明暗度等)
-
1.1.1 目标检测 VS 图像分类
-
目标检测需要拿到物体的坐标,在目标检测中主要市通过矩形框的方式来进行描述,对于一个矩形框将它表达成了四个值,一般是描述成一个左上角的坐标再加上宽和高,或者表达成一个中心点的坐标再加上宽和高,或者表达成一个左上角的坐标再加上右下角的坐标
-
目标检测还需要拿到物体的类别,也就是说检测问题也会完成一个分类
-
1.1.2 目标检测 VS 图像分割
-
目标检测定位图像的力度会更粗一点,如果想要定位物体更精确的信息,需要通过分割的方法来完成。
-
1.2 目标检测问题方法
传统目标检测方法到深度学习目标检测方法的变迁。
发展到现在,目标检测算法主要分为两个比较大的分支:
-
1.2.1 Anchor based 目标检测问题方法
- 算法基本流程
- 基于深度学习分目标检测问题建模
- 理解Anchor的概念
- 目前分为两大类
- One stage
- SSD系列
- YOLO系列
- Two stage
- FasterRCNN系列
- MaskRCNN系列
- One stage
-
Anchor based存在哪些问题?
- 目标和anchor box匹配只看两个框重叠的大小
- 对于anchor box的大小也是人为定义的
- Anchor box数量太多带来大量的负样本
- 等
-
Anchor based VS Anchor Free
-
Anchor based:Anchor是目标检测中的一个重要概念,通常是人为设计的一组框,作为分类(classification)和框回归(bounding box regression)的基准框
-
Anchor Free: 通过每一个点进行匹配,无Anchor的过程
-
1.2.2 Anchor Free 目标检测问题方法
-
如何对目标检测问题的真值,进行表示?
- YOLO V1(非常快)中的回归网络(中心点坐标、长和宽)
- 基于多关键点联合表达的方法
- CornerNet、CenterNet、ExtremeNet、RepPoints、FoveaBox、PLN
- CenterNet:keypoint Triplets for Object Detection
- 基于单中心点预测的方法
- CenterNet:Objects as points:中心点+宽度+高度
- CSP:中心点+高度
- FCOS:中心点+到框的2个问题
-
算法性能的评价
- TP:标注框重叠率很高
- FP:重叠率低(甚至没有重叠)和重复检测的框
- precision 和recall
- AP和mAP
-
1.3 目标检测问题中的难点
-
小目标检测问题
- 由于目标太小,在进行下采样的时候,下采样比例非常大,就不太合适,需要利用浅层的网络进行检测,浅层的网络可能提取出来鲁棒性不是很好
- 正负样本失衡
-
遮挡目标检测问题
- 损失很多的目标信息
- 加入attention
-
密集场景下的目标检测问题
- 经常会漏检
-
倾斜、变形物体检测问题
- 采用四边形,一个矩形加一个角度