标注
标注是制作自定义数据集中不可或缺的一个步骤,如何方便高效的进行,是我们需要关注的点,本文分享2款开源的标注工具,也是目前使用最多、效率较高的图形化标注工具。它们是LabelImg和CVAT。
LabelImg
LabelImg是一款开源的图形化的图片标注工具,使用python和Qt编写,同时支持windows、linux和macOS,项目地址: github.com/tzutalin/la…
LabelImg操作还是很方便的,它提供了默认的class,如果你不需要这些类型的话,可以将其删除

接下来就可以打开exe文件,点击Open导入图片,按下快捷键w,选定目标后,会弹出输入框,写上class名称,就可以了,如果有多个目标,那就继续标

labelImg还支持文件夹的导入,在标完一张后,在左侧选择Next Image就可以切换到下一张继续了。输出格式部分,目前labelImg支持YOLO和PascalOVC2种格式,前者标签信息是存储在txt文件中,而后者是存储在xml中
打完标签后,就可以进行保存了,图片和标签文件我们分开存放,但是文件名是对应的,只是扩展名不同

最后来看看标签文件的内容

一行代表一个目标,格式是
class x_center y_center width height
第一列是class的索引,计数从0开始,比如这里的0代表的是basketball,1代表的是face;后4列是x_center/image_width、y_center/image_height、width/image_width、height/image_height,取值范围是0 ~ 1
CVAT
CVAT是Computer Vision Annotation Tool的缩写,intel公司开发的开源工具,使用也非常简单,能够帮助你快速创建自己的数据集。
CVAT还提供了一个网站,你可以访问 cvat.org/
注册登录后,创建一个task

为简单示例,这里上传几张口罩的图片进行测试

高级设置部分,一般没特别要求,都可以不设

创建好后,在Tasks栏目下就可以看到了

进去之后就可以进行标注了

一张图片标注结束后,点击左上角的保存,然后点击图片上方的右箭头,进行下一张图片的标注,一直到所有图片处理完毕
最后来到Tasks,导出数据集,目前CVAT支持的格式有COCO 1.0、PASCAL VOC 1.1、MOT 1.1、ImageNet 1.0、YOLO 1.1等

这里导出了份PASCAL VOC 1.1格式的数据集

如果需要搭建本地CVAT的话,也是可以的,参考官方给出的搭建文档
github.com/openvinotoo…