two-stage:
two-stage算法会先使用一个网络生成proposal,如selective search和RPN网络,
RPN出现后,ss方法基本就被摒弃了。RPN网络接在图像特征提取网络backbone后,会设置`RPN
loss`(bbox regression loss+classification loss)对RPN网络进行训练,RPN生成的proposal再送到
后面的网络中进行更精细的bbox regression和classification。
two-stage算法主要是RCNN系列,包括RCNN, Fast-RCNN,Faster-RCNN。之后的Mask-RCNN
融合了Faster-RCNN架构、ResNet和FPN(Feature Pyramid Networks)backbone,以及FCN里的
segmentation方法,在完成了segmentation的同时也提高了detection的精度。
one-stage:
One-stage追求速度舍弃了two-stage架构,即不再设置单独网络生成proposal,而
是直接在feature map上进行密集抽样,产生大量的先验框,如YOLO的网格方法。这些先验框`没
有经过两步处理`,且框的尺寸往往是人为规定。
one-stage算法最典型的是YOLO,该算法速度极快