神经风格转换的开山之作,理解本文的方法对读懂后续改进的论文有重要意义。
Method
模型完整结构如下所示:

内容表示
Lcontnet(p,x,l)=21∑i,j(Fijl−Pijl)2用于监督生成图x和内容参考图p对应第l层特征图。
风格表示
CNN可以提取特征,而这些特征的相关性由Gram Matrix衡量:
Gl=Fl(Fl)T
它实际上是不减去均值的协方差计算公式。
Al和Gl分别是原风格图和生成图在第l层特征图的Gram矩阵,每层对loss的贡献El公式如下所示:
El=4Nl2Ml21i,j∑(Gijl−Aijl)2
N,M应该是特征图的长和宽。
风格迁移
Ltotal=αLcontent(p,x)+βLstyle(a,x)
优缺点分析
优点
- 适用于任何风格
- 可以控制风格化的程度
缺点
- 缺乏通用性,不同内容图片的风格化每次都需要重新训练
- 速度慢,每次重新训练都需要大概1H