开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第27天,点击查看活动详情
论文--[1] Dai Y , Liu J , Sun Y , et al. IDM: An Intermediate Domain Module for Domain Adaptive Person Re-ID[J]. ICCV, 2021.
摘要
无监督域自适应行人重识别(UDA re-ID)的目的是传递有标记的源域知识,以提高模型在无标记目标域上的可识别性。从一个新颖的角度来看,我们认为可以利用源域和目标域之间的桥接来处理UDA的reid任务,并且我们专注于显式地建模适当的中间域来描述这种桥接。具体来说,我们提出了一个中间域模块(Intermediate Domain Module, IDM),通过使用两个域因子混合源域和目标域的隐藏表示,实时生成中间域的表示。基于“最短测地路径”的定义,即两个极值域之间沿最短测地路径的中间域可以起到较好的桥接作用,我们提出了这这些中间域应满足的两个性质。为了保证这两个性质能够更好地表征合适的中间域,我们在中间域的预测空间和特征空间上增加了桥接损失,并在两个域因子上增加了多样性损失。桥接损失的目的是引导适当的中间域的分布,以保持与源域和目标域的正确距离。多样性损失作为一种正则化来防止生成的中间域对源域和目标域的过拟合。
贡献
首先明确考虑如何利用中间域的特征作为桥梁,更好地将源知识传递到目标域。具体来说,提出了即插即用的IDM模块来实时生成中间域,该模块将源域和目标域平滑地连接起来,更好地适应这两个极端,从而减轻UDA的reID任务。
为了使IDM模块学习到更合适的中间域,提出了中间域的两个性质,并设计了桥梁损失和多样性损失来满足这些性质。(3)在所有常见的UDA再识别任务上,我们的方法大大超过了当前的技术水平。
方法
骨干网络为ResNet50,记为f(.),在全局池化层GAP之后添加一个混合分类器φ(·),其中混合分类器由批处理归一层和Cs + Ct维全连接(FC)层以及softmax激活函数组成。Ct是像现有的基于聚类的UDA re-ID方法一样,在每个训练历元开始时对目标域特征进行DBSCAN聚类时的聚类数。聚类之后,为目标数据
分配伪标签
。
图2 (a)总体训练方案为源数据和目标数据联合训练。
l 输入为包含n个源域样本和n个目标样本的mini-batch
l 中间域模块(IDM)可以在ResNet-50这样的深度网络的任何阶段后插入。ResNet-50主干包含5个阶段,阶段0由第一个Conv、BN和Max Pooling层组成,阶段1/2/3/4对应于其他4个卷积块。将建议的IDM模块插入ResNet-50的第m阶段之后(即阶段-0/1/2/3/4).如图2 (a)所示,IDM模块被插入到阶段1和阶段2之间,其中源和目标域的隐藏表示与IDM模块混合,生成新的中间域的表示。
l 接下来,源、目标和中间域的所有表示都被提交到阶段2,直到网络结束。
l 将ReID损失LReID(包括分类损失和三元组损失)强加于源域和目标域的特征(fs, ft)和预测器(ϕs, ϕt)。
l 为了使IDM模块生成更合适的中间域表示,提出了两个桥接损失和一个多样性损失。分别将桥接损失 (、
)施加在中间域的特征finter和中间域预测器ϕinter上。采用多样性损失Ldiv对从IDM模块获得的域因子进行强化,以防止模块对两个极端域中的任何一个过拟合。
IDM模块仅用于训练,测试时将被丢弃。
实验
数据集:Market-1501,DukeMTMC-reID,MSMT17,PersonX,Unreal
Backbone:ibn_resnet50
结果: