UCF101数据集标签错误解决方案

318 阅读2分钟

一、背景

视频分类包括人类行为识别和通用的多标签视频分类等研究内容。用的多标签视频分类以2016年谷歌发布的youtube-8M数据集为代表,其中很多视频属于多个类别,并且在类别上不限于人类行为。人类行为识别主要研究分类视频中包含的人类行动,一般一个视频中只包含一类人类行为,UCF101数据集就是其中的典型代表。UCF-101(2012)包含13,320个视频(共27个小时),101个人类行为类别,如运动、乐器和人物交互等。

简单介绍一下UCF101数据集,主要由一下特点:

  • 内含13320 个短视频
  • 视频来源:YouTube
  • 视频类别:101 种
  • 主要包括这5大类动作 :人和物体交互,只有肢体动作,人与人交互,玩音乐器材,各类运动

二、问题描述与解决

最近在用ECO视频理解方案,进行数据处理时,发现了一个标签和视频名对应不上的问题,然后导致程序运行错误,问题描述如下:

出现问题后,逐步排查代码,发现代码没有问题,让我百思不得其解,最后偶然发现是“v_HandStandPushups_g08_c01”与UCF101视频数据集中“v_HandstandPushups_g08_c01.avi”,名字不一样;其实问题重点是“HandstandPushups”这一类中视频名字与标签信息中名字都不相等,其中ucfTrainTestlist/trainlist01.txt中是“v_HandStandPushups”,S是大写,ucf101文件夹下视频名字是“v_HandstandPushups”,s一个是小写;具体如下:

1.其中ucfTrainTestlist/trainlist01.txt标签信息

UCF101视频信息:

 

2.解决办法:把所有label名字换乘与视频列表名字相同即可。