DeeptransMap: a considerably deep transmission estimation network for single ima

由于标题字数限制，论文完整标题如下： DeeptransMap: a considerably deep transmission estimation network for single image dehazing

Multimedia Tools and Applications 2019

Jing Huang, Wen Jiang, Lin Li, Yuanqiao Wen, Gaojing Zhou

简介

文章提出了一个DeeptransMap网络结果，其分为两个子网络PrismNet和SausageNet-72。其中PrismNet是一个自编码器，使用一个无监督loss来提取有雾图像的信息。SausageNet-72由文章自己设计的模块组成，文中给出了相关网络结构。文章使用了 $L_2$ 损失。

Motivation

文章指出了过去的算法中存在的两个问题：

人工设计的雾相关特征可能不能够适应所有的场景，即雾相关先验不能适应所有场景。例如DCP不能对白色天空区域或者白色物体适用。
合成雾的数据集训练后的网络不能很好的迁移到真实世界的有雾数据集中，即去雾算法缺乏一定的鲁棒性。

文章给出了部分设计理由：

原始数据的基础信息可以通过无监督的表示学习来精确挖掘。
深度学习模型的表示能力可以通过增加网络大小来提高，从而进一步增强鲁棒性和准确性。

Model

如图所示。DeeptransMap网络分为PrismNet和SausageNet-72两个部分。Hazy image输入到PrismNet得到中间变量Haze-relevant features，再堆叠Hazy image以后输入到SausageNet-72得到Transmission map。

PrismNet

如图所示。Hazy image切块后，输入到自编码器网络中。网络的目标是重建该图像块。其网络为4层全连接网络，有两层隐藏层，其中隐藏层的尺寸分别为s*s和t*t，其中r>s>t。网络得到的Haze-relevant feature maps即为有雾图像提取的特征。其训练采用 $l_2$ 损失。

文章认为采取这种自编码器网络能够有效的自动提取图像的重要信息，提高后续去雾算法的效率和精度，这种特征比以往人工设计的特征更加有效和更自适应。

SausageNet-72

上图为SausageNet-72的网络结构。其主要由IK Block和Transition IK Block组成。

图为SausageNet-72中的重要模块IK Block和Transition IK Block。Transition IK Block仅仅比IK Block在短连接上多了一个Pconv。其中， PGconv指pointwise group convolution（分组1*1卷积），Shuffle指channel shuffle operation（通道随机混合），Dwconv指 depthwise convolution（分通道卷积），Pconv指point convolution（1*1卷积），GAP指global average pooling， Scale指channel-wise scaling operation。其训练采用 $l_2$ 损失。

文章采用和MSCNN中相同的方法来估计大气光值A，最终通过以下公式恢复去雾结果：