语义分割数据集

Mask都是单通道的：channel=1，每个像素范围为[0, 255]

PASCAL VOC数据集：

— PASCAL Voc2012 
   |     |— JPEGimages   # 存放所有图像的RGB图像文件，每个图像文件以JPEG格式存储，共17125张。例：2007_000032.jpg                   
   |     |— Annotations  # 存放所有图像的语义分割标注文件：每个XML文件中包含了图像的尺寸信息和每个像素的标注。例：2007_000032.xml
   |     |— ImageSets 
   |     |     |— Segmentation  # 包含train.txt、val.txt、trainval.txt，分别存放的是训练集图像的文件名、验证集图像的文件名、训练图像+验证图像的文件名。     
   |     |— SegmentationClass  # 存放对应JPEGimages中每张图像的Mask.png，使用颜色来区别不同的语义类别。例：2007_000032.png

MS COCO数据集：

— COCO 
   |     |— Images     # 存放所有图像的RGB图像文件。例：000000000001.jpg   
   |     |— Annotations   # 存放所有图像的语义分割标注文件：每个XML文件中包含了图像的尺寸信息和每个像素的标注(每一个目标都记录了多边形坐标)。例：000000000001.json         
   |     |— ImageSets    # 包含train.txt、val.txt、test.txt，分别存放的是训练集图像的文件名、验证集图像的文件名、测试图像的文件名。

语义分割评价指标

图片.png

红色是GT，黄色是预测。TP：对的判对；FN：对的判错；FP：错的判对。

Dice系数：

Dice：衡量重叠度的度量方式，多用在医学图像分割领域。

$Dice=\frac{2(A∩B)}{A+B}=\frac{2TP}{2TP+FP+FN}$

mDice：Dice在所有类别上的平均值。

交并比：

IoU：衡量重叠度的度量方式。

$IoU=\frac{A∩B}{A∪B}=\frac{TP}{TP+FP+FN}$

mIoU：IoU在所有类别上的平均值。

Dice和IoU：Dice系数对预测结果和真实标签的交集和并集的贡献是相等的，而IoU更加关注预测结果和真实标签的交集。因此Dice更加敏感于小目标，而IoU更适用于大目标。

像素准确率：比较特殊，是针对每张图像为单位的。

PA（aAcc/Global Accuracy/Overall Accuracy）：表示全局准确性，不考虑类别，仅考虑所有样本的分类好坏。

$PA=\frac{预测正确的像素个数}{总像素个数}=\frac{TP+TN}{TP+FP+FN+TN}$

类别像素准确率：

$CPA=\frac{预测为该类别的像素个数}{真实属于该类别的像素个数}=\frac{TP}{TP+FP}$

类别平均像素准确率：

MPA：首先求每个类别的CPA，再对他们求和后平均。

二维豪斯多夫距离（Hausforff ditance）：

$H(d)=min⁡(∣x1−x2∣+∣y1−y2∣)$

其中， $(x1, y1)$ 和 $(x2, y2)$ 表示两个像素点的坐标， $|x1 - x2|$ 和 $|y1 - y2|$ 表示对应坐标轴上的距离。这个公式表示了二维医学图像中两个像素点之间在横轴和纵轴上的绝对距离之和，即像素级别的豪斯多夫距离。

10. 语义分割评价指标

语义分割数据集

语义分割评价指标