Github上10个开源好用的人脸识别数据集

2,839 阅读5分钟

在本文中,我们列出了 10 个可用于启动人脸识别项目的人脸数据集。

1| Flickr-Faces-HQ 数据集 (FFHQ)

Flickr-Faces-HQ 数据集(FFHQ)是一个由人脸组成的数据集,在年龄、种族和图像背景方面比 CELEBA-HQ 数据集包含更多的变化,并且对眼镜、太阳镜、帽子等配饰的覆盖范围也更好。图像是从 Flickr 抓取的,然后自动对齐和裁剪。

大小:数据集由 70,000 张 1024×1024 分辨率的高质量 PNG 图像组成,并且在年龄、种族和图像背景方面包含相当大的变化。

项目:该数据集最初是作为生成对抗网络 (GAN) 的基准创建的。

2| Tufts-Face人脸数据库

Tufts 人脸数据库是最全面的大规模人脸数据集,包含 7 种图像模式:可见光、近红外、热、计算机草图、LYTRO、录制的视频和 3D 图像。

大小:数据集包含超过 10,000 张图像,其中包括来自 15 个以上国家的 74 名女性和 38 名男性,年龄范围在 4 至 70 岁之间。

项目:该数据库可供全球研究人员使用,以便对草图、热、NIR、3D 人脸识别和异性恋人脸识别的面部识别算法进行基准测试。

3| 真假人脸检测

该数据集包含专家生成的高质量 photoshopped 人脸图像,其中图像由不同的人脸合成,由眼睛、鼻子、嘴巴或整张脸分开。

大小:数据集大小为215MB

项目:此数据集可用于区分真假图像。

4| Google面部表情比较数据集

谷歌的这个数据集是一个大规模的面部表情数据集,它由人脸图像三元组和指定的人类注释组成,每个三元组中的两个人脸在面部表情方面形成最相似的一对。

大小:数据集大小为 200MB,其中包括 500K 三元组和 156K 人脸图像。

项目:该数据集旨在帮助研究人员研究与面部表情分析相关的主题,例如基于表情的图像检索、基于表情的相册摘要、情感分类、表情合成等。

5| 带有标记的地标点的人脸图像

Face Images with Marked Landmark Points 是一个 Kaggle 数据集,用于预测人脸图像上的关键点位置。

大小:数据集大小为 497MP,包含 7049 张人脸图像和多达 15 个标记在其上的关键点。

项目:该数据集可用作多个应用程序的构建块,例如跟踪图像和视频中的人脸、分析面部表情、检测畸形面部迹象以进行医学诊断和生物识别或面部识别。

6| 野外家园 (LFW) 数据集中的标记人脸

野外标记人脸 (LFW) 数据集是一个人脸照片数据库,旨在研究无约束人脸识别问题。 Labeled Faces in the Wild 是人脸验证的公共基准,也称为配对匹配。

大小:数据集的大小为 173MB,它包含从网络收集的 13,000 多张人脸图像。

项目:数据集可用于人脸验证和其他形式的人脸识别。

7| UTKFace 大规模人脸数据集

UTKFace 数据集是一个年龄跨度大的大规模人脸数据集,年龄范围从 0 到 116 岁。 这些图像涵盖了姿势、面部表情、光照、遮挡、分辨率等方面的巨大变化。

大小:数据集包含超过 2 万张带有年龄、性别和种族注释的图像。

项目:该数据集可用于各种任务,例如面部检测、年龄估计、年龄进展、年龄回归、地标定位等。

8| 带有面部关键点的YouTubeFaces数据集

该数据集是 YouTube Faces Dataset 的处理版本,主要包含公开可用并从油管下载的名人短视频。 每个名人都有多个视频(每个名人最多 6 个视频)。

大小:数据集大小为10GB,包含大约1293个视频,每个原始视频最多240帧的连续帧。 整个单幅图像帧共有 155,560 张图像。

项目:该数据集可用于识别无约束视频中的人脸。

9| 大规模 CelebFaces 属性 (CelebA) 数据集

CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集,拥有超过 200K 的名人图像,每个图像有 40 个属性注释。 该数据集中的图像涵盖了大的姿势变化和背景杂波。

大小:数据集大小为 200K,其中包括 10177 个身份,202599 个人脸图像,5 个地标位置,每张图像 40 个二进制属性注释。

项目:该数据集可用作以下计算机视觉任务的训练和测试集:人脸属性识别、人脸检测、地标(或面部部分)定位以及人脸编辑和合成。

10| 耶鲁人脸数据库

耶鲁人脸数据库包含 15 个人的 165 张 GIF 格式的灰度图像。 每个主体有 11 张图像,每种不同的面部表情或配置各一张:中心光、带眼镜、快乐、左光、不带眼镜、正常、右光、悲伤、困倦、惊讶和眨眼。

大小:数据集的大小为 6.4MB,包含 5760 张单光源图像,每个图像在 576 个查看条件下看到的 10 个对象。

项目:数据集可用于人脸识别、分身列表对比等。