2021ICCV行人重识别文章精读之02.Joint Noise-Tolerant Learning and Meta Camera Shift Adaptat

138 阅读3分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第11天,点击查看活动详情

论文--Yang F ,  Zhong Z ,  Luo Z , et al. Joint Noise-Tolerant Learning and Meta Camera Shift Adaptation for Unsupervised Person Re-Identification[J]. CVPR,2021.

摘要

本文研究无监督行人重识别(re-ID)。常用的方法是通过聚类获得伪标签,并利用伪标签对模型进行优化。虽然这种方法显示出了很好的准确性,但它受到了1)聚类产生的噪声标签和2)摄像机移动引起的特征变化的阻碍。前者会导致不正确的优化,从而影响模型的准确性。后者将导致将不同相机的类内样本分配给不同的伪标签,使模型对相机变化敏感。在本文中提出了一个统一的框架来解决这两个问题--一种动态对称交叉熵损失(DSCE)来处理噪声样本,以及一种相机感知元学习算法(MetaCam)来适应相机移动。DSCE可以减轻噪声样本的负面影响,并适应每一步聚类后簇的变化。MetaCam通过将训练数据分割成元训练和基于摄像机id的元测试来模拟跨摄像机约束。利用元训练和元检验的交互梯度,实现了对相机不变特征的学习。在三个re-ID基准上的大量实验表明了所提出的DSCE和MetaCam的有效性和互补性。可用于完全无监督的 re-ID 和领域自适应 re-ID

贡献

提出了一种动态对称损失(DSCE),它使模型在簇变化的背景下训练时对噪声标签具有鲁棒性,从而提高了模型的性能。

提出了一种相机感知元学习算法(MetaCam),以适应相机引起的变化。通过模拟训练过程中的跨摄像机搜索过程,MetaCam可以有效提高模型对摄像机变化的鲁棒性。

引入了一个统一的框架,可以联合利用提出的DSCE和MetaCam,能够学习一个更健壮的re-ID模型。

方法

图片.png 图2. 本文无监督 re-ID 训练框架包括两个训练阶段,即挖掘伪标签阶段和元优化。 第一阶段基于 DBSCAN 为样本分配伪标签。 第二阶段根据相机标签将训练数据分为元训练和元测试集,并使用提出的元学习策略优化模型。 这种相机感知元学习 (MetaCam) 鼓励模型学习相机不变的特征

两个阶段的迭代:

挖掘伪标签--首先提取所有训练样本的特征,然后使用DBSCAN为它们指定伪标签

元优化--使用生成的伪标签来训练模型

实验

数据集:Market-1501,DukeMTMC-reID,MSMT17

骨干网络:resnet-50

图像:256×128

训练次数:40epoch

结果:

图片.png