跟李沐学AI随记-17-语义分割、转置卷积&FCN

90 阅读1分钟

目标检测、语义分割、实例分割的区别:

  • 目标检测是为了定位和区分类别,用方框框出来

  • 语义分割可以看成更精细化的目标检测,但是是顺着物体的边缘的

  • 实例分割将图像中的物体划分为个体。更为精细化的语义分割

image.png

image.png 经典语义分割数据集: Pascal VOC2012 语义分割数据集

转置卷积(transposed convolution):增加上采样中间层特征图的空间维度,用于逆转下采样导致的空间尺寸减小。

基本操作:得到四个大一点的矩阵再相加

image.png

对其进行padding和stride设计时比较有意思

  • stride反而会增大图像,padding会减小图像的size~与卷积作用时相逆

image.png

重新排列输入和核

image.png 形状换算:

  • 在实际任务中考虑shape时要多加注意

image.png

重点:让高宽成倍增加时,K=2p+s-----FCN有用到

FCN

  • 语义分割的奠基性工作
  • 用转置卷积来替换CNN最后的全连接层,从而实现每个像素的预测。
  • 1*1卷积层不会对空间信息产生变化,只是针对通道
  • 去除了池化层

image.png