
获得徽章 0
- 【今天Reddit上的这个帖子,你一定要紧盯】
Reddit的机器学习和计算机视觉版块,今天出了一篇热帖。有位兄台称他手里有个700万+张图像的超大数据集,这些图像分为“裸体”“暗示”“非裸体”三类,都是过去10年辛苦收集的用户上传的图像,而且都手工打上了标签。
图像标签分为“animate”和“INANIMATE”两种,前者指出现人体私密部位的图像,后者指出现情趣工具等模拟人体隐私部位的图像,每种下面又分为18岁以下禁止观看、16岁以下禁止观看和12岁以下禁止观看。当然这位仁兄发帖不是为了炫耀福利的,而是想用这个数据集做个AI模型,可自动判定哪些图像不能像16岁以下的用户展示,在帖子里想让大家支招怎么做。
结果评论区最火热的回复却是求数据集的,并且声称是为了科学,但从这条评论热点最高来看,大家还是很想要这个数据集的。
可以关注这个帖子,说不准哪天这老哥就给分享了。
帖子地址:
www.reddit.com
展开评论15