图1. 基于循环一致对抗网络的不配对图像转译。不需要配对,就可以使两组图像之间的风格互相迁移。
图2. X → Y;Y → X 原理
损失函数
→ :对应图 2. 中的(a)上线、(b),期望将“Mona的印象派油画” 的风格变成 “手机拍摄的风景照”风格。
~ :真图,如“Mona的印象派油画”
~ :真图,如“手机拍摄的风景照”
:生成器
:生成器 通过源域输入 ~ 生成的假图 ~,期望像“手机拍摄的风景照”
:分类器
:判断真实图像 为“手机拍摄的风景照”的概率
:判断假图 为“手机拍摄的风景照”的概率
step 1. 需要训练出强的分类器 。判断 为“手机拍摄的风景照”的概率 越大越好,同时判断生成器 生成的假图 为“手机拍摄的风景照”的概率 越小越好。此时损失函数越大越好,最大化损失函数 。
step 2. 在强 基础下,需要训练出强的生成器 。生成器以源域 作为输入,生成假图 。期望分类器 判断生成器 生成的假图 为“手机拍摄的风景照”的概率越大越好。此时损失函数越小越好,最小化损失函数 。
在 step 1. 和 step 2. 的交替训练下,会鼓励 生成越来越像 “手机拍摄的风景照” 的假图。
→ :对应图 2. 中的中的(a)下线、(c),意为将 “手机拍摄的风景照” 的风格变成 “Mona的印象派油画”风格。
:生成器 通过源域输入 ~ 生成的假图 ~,期望像“Mona的印象派油画”
:分类器
:判断真实图像 为“Mona的印象派油画”的概率
:判断假图 为“Mona的印象派油画”的概率
对该公式同理 step 1. & step 2.
step 3. 还原原图。对 → 而言,为了使生成器 生成的假图 “手机拍摄的风景照” 仍保留源域图像 “Mona的印象派油画”的信息。将假图 “手机拍摄的风景照” 放入生成器 中生成图像 “Mona的印象派油画” ,该 “Mona的印象派油画”应与源域图像 “Mona的印象派油画”相近。对 → 同理。
cycle-consistency loss的作用
-
使生成器生成的图像仍保留原始图像的信息
-
间接实现了 pix2pix 的
paired image translation
功能 -
防止模式崩溃(这里指:总生成相同的图像,找到使生成器能够欺骗判别器的“捷径”,总是生成相同的图像。加入cycle loss后可以监督生成器生成与x近似的,而不会永远生成同一张图)