Google发布辨识模型的新版数据集 加速物体辨识的研究

317 阅读2分钟

Google最近发布了新版本的Landmarks-v2,用于训练地标识别模型,比以前版本的数据集更大,包含超过20万个不同的地标,超过500万张图像,第一版除此之外,谷歌还宣布了两个新的Kaggle挑战,地标识别2019和地标检索2019,以加速对象识别的研究,对象识别技术Detect-to-Retrieve开源。

Google标志性建筑是世界上最大的地标识别数据集。创建Landmarks-v2数据集的挑战之一是为地标生成卷标。由于该标记不太可能标记数百万具有里程碑意义的图像,因此Google与世界各地的摄影师合作。为了解决这个问题,每位摄影师都熟悉他们所在位置的地标,让这些sbf胜博发摄影师能够标记出这些图像。

Google宣布的两项新的Kaggle挑战邀请机器爱好者和研究人员参与。地标识别2019的目标是识别输入图像的地标。 Landmark Retrieval 2019挑战是找到目标的所有图像。总的来说,这两项挑战将获得5万美元的奖金。获奖团队将被邀请参加CVPR 2019研讨会,以公布用法。

此外,谷歌还开源了Detect-to-Retrieve,这是一种用于对象识别的新技术。 Google使用对象检测模型的边界框来为包含目标类别对象的图像区域提供额外的权重。这种方法有很大改进。该模型的准确性,谷歌发布的模型是通过原始的Google-Landmarks数据集进行训练的,该数据集包含86,000个图像。