目标检测中的分类和回归的应用

315 阅读3分钟

🍊作者简介:秃头小苏,致力于用最通俗的语言描述问题

🍊专栏推荐:深度学习网络原理与实战

🍊近期目标:写好专栏的每一篇文章

🍊支持小苏:点赞👍🏼、收藏⭐、留言📩

 

  通过上文的讲述,我认为你已经对分类和回归有了一定的了解。那么接下来我将来谈谈分类和回归是怎么应用到RCNN的目标检测算法中的。🌻🌻🌻

  首先来思考目标检测的需求是什么?——目标检测即是要检测出图片中物体的位置和类别,并用矩形框框选出来。如下图所示:

  接着我们考虑实现目标检测的需求能否直接用回归算法来实现?——在我看来,仅靠回归算法是不能完成任务的,严谨点说是很难完成任务的,因为目标检测需要检测矩形框中物体的类别,而识别物体类别显然采用分类算法更合适。🥗🥗🥗但是回归算法能很好的画出包围物体的矩形框,首先明确一点,我们绘制一个矩形框需要四个参数{\rm{(}}{{\rm{x}}{center}},{y{center}},h,w) 即矩形框中心点坐标和矩形框的高和宽。显然,这四个参数值是任意的,是连续的数据,因此我们使用回归来进行预测。🌵🌵🌵

  下面来考虑实现目标检测的需求能否直接用分类算法来实现?——在我看来,这个是可以的,但是实现起来比较复杂。具体的我们可以采用滑动窗口来实现,参考下图:我们会使用一个个滑动窗口遍历下图,直至发现矩形框中框住物体,其实很明显,这种方式存在很大缺陷,即物体的大小和矩形框大小不一致,不能框住整个物体。有人可能想到,那我们采用不同尺寸的矩形框来遍历整个图像,这样就可以了,这个思路的确很棒,但是对于任意一幅图像,物体的大小千差万别,设置多少不同尺寸的矩形框合适呢,这很难确定,而且这样做的准确率也不高。因此仅使用分类算法来实现目标检测效果也不好。🌵🌵🌵

  既然单独使用分类和回归都不能很好的完成目标检测任务,我们应很自然的想到能否可以将二者结合使用从而达到更好的效果呢?答案是肯定的,在目标检测算法中,基本都采用了这种多任务的方式,即既采用分类又采用了回归。这里说说大体的思路,以RCNN为列,分类主要就用来检测矩形框中物体的类别,而回归往往用来对矩形框进行微调以使矩形框能更好的包裹物体,有关RCNNd的介绍可以参考我的这篇博文。🍊🍊🍊