2021 ECCV
Abstract
作者提出了一种新的基于风格相似性的图像搜索框架ALADIN,并在基于风格的视觉搜索任务上达到SOTA。其次,作者还贡献了一个新的数据集。
Introduction
该框架的优势在于通过弱监督学习艺术风格相似性,不用大量标记。 贡献点主要有三:
Related Work
Learning Fine-Grained Style Similarity
整个网络由编码器和解码器构成,但不是传统的E-D结构。首先特征编码分为了两路,并且style编码利用了多阶段的特征图。最后的MLP是用Style Embedding结合对比学习的策略完成弱监督任务。
My
感觉基于风格的视觉搜索任务就是用网络提取的风格特征做聚类,找出和提供图片的同类;粗粒度和细粒度的区别在于细粒度对各类间距有更严苛的要求。