什么是物体检测中的YOLOv7?

630 阅读5分钟

任何具有计算机视觉中级知识的人都会听说过YOLO算法。YOLO是You Only Look Once的缩写,而v7指的是该算法的第七个版本。

YOLO是一种物体检测算法,使用PyTorch作为其编码基础。它以在实时环境中检测物体而闻名。

YOLO是一个伟大的算法,它为许多现实生活中的计算机视觉问题提供了解决方案。YOLO已经被用于检测交通信号、考试监考、游戏瞄准器和各种工业自动化工具。

在这篇文章中,我们将学习YOLO系列的第七个版本,假设你了解机器学习、深度学习和神经网络的基础知识。

What is YOLOv7

如果你不知道这些主题,请查看这篇文章。在进入YOLO之前,让我们了解什么是物体检测。

物体检测

**物体检测是一个涉及检测图像和视频中物体的过程。**物体检测回答用户提出的两个问题。物体在哪里,以及它是什么样的一个物体。找到物体位置的过程称为检测,而找到物体类型的过程称为识别。

对象检测可分为两类:两阶段对象检测一阶段对象检测。这里的 "阶段 "是指必须发生的过程。

例如,两阶段物体检测的两个过程是检测物体可能存在的边界盒区域,并根据提供的物体类别对该物体进行分类。一些常用的两阶段物体检测算法包括RCNN、Fast RCNN、Faster RCNN、Mask RCNN和RFCNN。

一阶段物体检测过程无非是将、检测物体可能存在的边界盒区域,并根据物体类别对该物体进行分类合并为一个阶段。

YOLO 这样的算法通过做一个端到端的神经网络,可以同时做检测和预测类的概率,使之成为可能。这个过程在很大程度上提高了速度和准确性。成本也被降低了。另一个著名的单阶段算法是SSD。

现在你已经了解了什么是物体检测,让我们深入了解一下YOLOv7。

YOLOv7

自2015年发布YOLOv1以来,该算法在计算机视觉界获得了巨大的人气。此外,该模型的更新版本YOLOv2、YOLOv3、YOLOv4、YOLOv5、YOLOv6,以及最近发布的YOLOv7,到目前为止都已经发布。

在我们深入讨论这个话题之前,我们应该知道互联网上有两个版本的YOLOv7,而我们要谈的是 "官方Yolov7算法"。YOLOv5的开发者Academia Sinica是开发Yolov7官方算法的同一个团队。

请注意,YOLOv5一直是YOLO系列中最成功和最常用的版本之一。因此,同一个团队创造了更新的版本是考虑学习它的一个理由。

Yolov7是一个实时物体检测器,目前以其令人难以置信的功能彻底改变了计算机视觉行业。 与之前的版本相比,官方的YOLOv7提供了令人难以置信的速度和准确性。Yolov7的权重是使用微软的COCO数据集训练的,没有使用预训练的权重。

YOLOv7的意义

2022年7月6日,一篇新的论文《YOLOv7: Trainable Bag-Of-Freeebies Sets New Stat-of-The-Art for Real-Time Object Detectors》发布。论文链接可在此获得。如果你有兴趣,请查看该论文。

Bag of Freebies模型这个词指的是在不实际增加训练成本的情况下通过改进来提高模型的准确性。较早的版本如YOLOv4也使用了 "赠品袋 "模型。

论文指出,该模型可以有效地预测从5FPS到160FPS的视频输入。 在所有实时物体检测器中,YOLOv7的平均精度(AP)得分最高,达到56.8%,创造了令人印象深刻的记录。

Yolov7的表现超过了基于变压器的物体检测器和基于卷积的物体检测器。Yolov7超越的一些物体检测器是YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR、Deformable DETR、DINO-5scale-R50、ViT-Adapter-B等。

由于其令人难以置信的速度和准确性,对于相同的数据集,运行该模型的成本已经减少了50%。神经网络隐藏层的参数也减少了40%。

模型的扩展从未如此简单。他们在某种程度上能够在进行复合扩展的同时保持原有的模型设计和结构。

YOLOv7已经实现了比YOLOv4高1.5倍的AP。这是一个大问题,因为YOLOv7的参数比YOLOv4少75%,计算速度比YOLOv4低36%。

Academia Sincara论文的实现可以在GitHub上找到。请在这里查看。

最后的思考

Yolov7仍然是一个发展中的算法,处于早期阶段。开发者面临的问题有很大的改进和纠正空间。一旦该算法成为主流,它将对解决一些计算机视觉问题有不可思议的好处。

这篇文章提供了Yolov7的概况。 我希望你能理解Yolov7是什么以及为什么它是一个大问题。祝你在未来的编码工作中一切顺利。编码愉快