跟李沐学AI随记-16-物体检测算法（R-CNN,SSD,YOLO）区域卷积神经网络（region-based CNN或

区域卷积神经网络（region-based CNN或regions with CNN features，R-CNN）

--引入ROI池化层

Fast-RCNN

对整张图片用CNN提取特征，然后再使用ROI池化层，对每个锚框生成固定长度的特征。（例如，在图像中生成了100个锚框，ROI池化层为2×2的，最后经过初步特征提取后输出100*4的向量）

用CNN生成特征图，再根据原始锚框的位置，在其在特征图上的映射确定位置，再在特征图上进行ROI池化

Mask-RCNN

如果在训练集中还标注了每个目标在图像上的像素级位置，那么Mask R-CNN能够有效地利用这些详尽的标注信息进一步提升目标检测的精度。（利用FCN来利用像素信息）

Mask R-CNN将兴趣区域汇聚层替换为了 兴趣区域对齐层，使用双线性插值（bilinear interpolation）来保留特征图上的空间信息，从而更适于像素级预测。兴趣区域对齐层的输出包含了所有与兴趣区域的形状相同的特征图。

单发多框检测（SSD） one-stage

接近顶部的多尺度特征图较小，但具有较大的感受野，它们适合检测较少但较大的物体。简而言之，通过多尺度特征块，单发多框检测生成不同大小的锚框，并通过预测边界框的类别和偏移量来检测大小不同的目标，因此这是一个多尺度目标检测模型。

YOLO