CUT——基于对比学习的I2I

543 阅读1分钟

CUT

Contribution

  • 提出基于对比学习的图像翻译框架,通过最大化互信息实现对应的像素块映射到学习的特征空间中的相似点
  • 在Unpaired image translation中实现单侧翻译,同时提高了质量并减少了训练时间
  • 方法甚至可以扩展到每个“域”只有一张训练图像

Related Work

Relationship preservation

输入图像中感知相似的斑块在输出中应该相似,相关工作有DistanceGAN、HarmonicGAN等

Method

image.png CUT只需要学习一个方向的映射,并避免使用逆辅助发生器和鉴别器,节省空间、时间

  • Generation:生成器分为两部分GencGdecG_{enc}-G_{dec}

  • Mutual information maximization image.png 正负样本:正样本匹配的图像块、负样本同一张图片内随机图像块 损失函数: image.png

  • Multilayer, patchwise contrastive learning

采用多层、不同空间位置的特征图块计算对比损失PatchNCE

image.png 为了增加负样本数量,可以增加来自其他图片的像素块,externalNCE 损失

image.png

  • Final objective

image.png

Experiments

image.png

image.png removing the identity loss [Id], using less negatives [Negs], using only the last layer of the encoder [Layers], and varying where patches are sampled, internal [Int] vs external [Ext].

image.png