G2A-VReID数据集:由西北工业大学和西安电子科技大学联合创建 第一个针对地面到空中场景的视频重识别数据集

138 阅读3分钟

2024/8/14 , 由西北工业大学和西安电子科技大学联合创建 G2A-VReID,这是目前第一个针对地面到空中场景的视频重识别数据集。

一、目前遇到的挑战

1、无法在不同平台(如地面视频和空中视频)中识别个体。

2、视角变化剧烈、标注身份数量庞大、丰富的户外场景以及分辨率差异巨大。

G2A-VReID数据集:一个大规模的基于地面到空中视频的人体重识别基准数据集,该数据集包含185,907张图像和5,576个轨迹,涵盖2,788个不同的身份,解决地面到空中场景下视频重识别数据集和方法的缺乏,同时改善跨平台任务中视觉特征的对齐。

数据集地址:G2A-VReID|视频人物再识别数据集|跨平台识别数据集

二、让我们来看一下这个数据集:

G2A-VReID数据集具有以下特点:

1、剧烈的视角变化;

2、大量标注的身份;

3、丰富的户外场景;

4、分辨率差异巨大。

首先,通过一种新的跨平台视频行人重识别基准方法,通过视觉-语言模型(即CLIP)将跨平台视觉对齐问题转化为视觉-语义对齐(涉及学习特定身份的描述标记和共享文本提示)。

其次,应用一种参数高效的视频集级适配器模块,将基于图像的基础模型适配到视频重识别任务,称为VSLA-CLIP。

然后,为了减少跨平台任务中的语义差距,通过平台桥接提示(PBP)提供指令,使模型能够识别不同平台之间的差异,并获得用于视觉特征对齐的精确和针对性的信息。

三、让我们一起展望数据集的应用场景:

经常看到新闻

爱好登山的市民,特意为自己安排了一次登山旅行,在周末独自一人去攀登郊外的一座山。不幸的是,他在山上迷路了,手机也没信号,联系不上。家人和朋友急得像热锅上的蚂蚁,赶紧报警求助。

这时候,警方和救援队需要尽快找到这位失踪的登山者。但是,山区地形复杂,植被茂密,单纯靠人力搜索效率太低,而且时间紧迫,每分每秒都可能关乎生命安全。

通过 G2AVReID数据集训练的智能系统 : 警方可以出动无人机,飞到山区上空进行搜索。同时,警方通过系统的人物识别系统,在无人机传回的画面中快速识别失踪者。

具体来说,如果失踪者之前在社交媒体上分享过自己的照片,或者有其他已知的照片,警方就可以用这些照片作为参照,结合G2AVReID数据集训练出的模型,在无人机拍摄的视频中寻找相似的人物特征。

另外:如果无人机在某个山谷发现了一个人影,但是距离太远,看不清面容,这时候识别系统就能发挥作用了。系统会分析这个人的体型、衣着颜色、运动模式等特征,与失踪者的已知特征进行比对,从而快速判断这个人是不是失踪者。

使用G2AVReID数据集训练的系统,不仅增强了识别的准确性,还提升了救援成功率,从而保护我们的生命安全。

免费数据集下载网站,请打开:遇见数据集

www.selectdataset.com/