腾讯优图再次刷新三大ReID公开数据集纪录,首位命中率最高近99%

299 阅读4分钟


近日,腾讯优图实验室在行人重识别(

ReID)
技术上再次取得突破,
通过引入跨场景
ReID,
ReID模型性能刷新了三大
权威主流
ReID公开数据集CUHK03,DUKE-MTMC和Market1501的记录
,算
法关键指标首位命中率(
RANK1 Accuracy)
平均精度均值(
Mean Average Precision)
获得业内最好成绩。

1: ReID公开数据集性能比较

Market1501

DukeMTMC

CUHK03

RANK1

MAP

RANK1

MAP

RANK1

MAP

Tencent YouTu

98.99%

97.16%

95.15%

91.10%

95.79%

95.00%

YITU

98.60%

96.60%

94.75%

90.02%

95.00%

94.23%

HaiGe

97.54%

94.77%

94.37%

89.77%

94.40%

91.20%

ZTE

97.32%

94.66%

92.46%

87.65%

89.79%

87.99%

Dahua Tech

96.76%

91.98%

91.52%

83.96%

87.73%

85.72%

Pensees

96.73%

89.89%

92.01%

82.51%

84.57%

82.81%

WINSENSE

96.59%

91.77%

91.79%

83.81%

82.79%

81.91%

CloudWalk

96.40%

91.14%

91.74%

83.31%

82.28%

81.06%

Alibaba

96.35%

90.58%

90.31%

81.46%

82.00%

80.57%

数据来源于网络

行人重识别(
Person ReID)
指对不同摄像机捕捉到的行人图像建立身份对应关系(即关联行人
ID),对行人
实现
在整个场景下的行动路线的全面刻画
。简单来说,在看不到人脸的复杂多场景下也能通过体态等对人进行识别。
相较于人脸识别技术,
ReID对人体图像的遮挡、朝向和清晰度具有较高的鲁棒性,对摄像头的清晰度、架设位置、角度没有硬性要求
。正因此
ReID
技术成为继人脸识别技术后计算机视觉领域又一热门课题。

鉴于
ReID技术的技术优势和在各个领域的广泛应用前景,近年来,
腾讯优图
在这一方向上做出了大量技术投入和全面的技术布局,在
CVPR
TPAMI
AAAI
IJCAI等国际顶级学术会议和期刊上发表了超过15篇相关领域学术论文。


图一:
行人
ReID示意图

虽然
ReID技术
已经过多年的演进,但现实中复杂多变的场景,也让跨场景识别
cross-domain person re-identification)
成为
ReID技术的
一大
难题
,此次腾讯优图刷新三大数据集所引入的
跨场景
ReID
,便是在此难点上进行了技术突破。

跨场景识别
的难点在于,
不同场景由于环境光照、摄像头角度、背景等因素,例如室内大型商场、小型门店的侧面和高俯角相机
室外道路、社区的强光和夜晚环境等
,都会对
人体图像的视觉特征
造成影响
。如何让
ReID技术适应复杂多变的场景,实现跨场景行人图像的检索,是一项重大的技术挑战,也是实现室内外行人动线联动、全城联动的关键性技术
。突破此技术难点
对拓展
ReID的落地场景和业态,实现大规模行人识别有巨大的作用。


图二:
公开数据集
MSMT17中的室内外行人图像视觉差异

为解决
ReID技术
难点,腾讯优图
通过在遮挡匹配、全角度匹配、跨域检索等业务问题上的针对性优化,以及在模型结构、损失函数、训练算法等各项技术上
大量积累和创新,提出
一种
跨场景行人重识别
技术框架,采用基于图卷积和孪生网络的模型,使得神经网络对多朝向、多姿态等跨场景的人体具有更强的识别能力。这一技术能够为不同场景、不同拍摄角度和光照条件的行人视觉特征学习统一的特征表达,有效提升了
ReID技术在行人图像室内外、跨场景的相互检索的精度。


图三:跨场景行人重识别

通过引入跨场景
ReID
,腾讯优图在三个数据集中刷新业内最好的水平,其中
Market-1501
数据集的
RANK1
达到
98.99%
RANK1和MAP
作为衡量
ReID技术水平的核心指标
首位命中率高,
意味着算法能够在众多图像中准确找出最容易识别或匹配的那张。

在此基础上,
腾讯
优图的
ReID算法在多场景行人图像相互检索也处于业界领先水平,在跨场景ReID数据集MSMT-17上超越已有算法达到
业内顶尖
水平。

2:跨场景行人重识别性能比较

RANK1

MAP

Tencent YouTu

83.54%

62.00%

ABDNET (TAMU/中科大)

82.30%

60.80%

OSNET

78.70%

52.90%

DG-NET (NVIDIA/悉尼大学)

77.20%

52.30%

DLCE

60.48%

31.58%

腾讯优图
ReID技术
不仅
在相关数据集上已经取得
了领先
的性能,依托
ReID技术的应用系统
已在多种场景达到商用水平并实现广泛落地。未来,随着跨场景行人重识别能力的逐步成熟,
腾讯
优图的
ReID技术
也将
在更多的场景和业态实现价值。