利用UMAP与Prodigy技术检测图像数据异常

7 阅读1分钟

Prodigy是一款用于收集机器学习模型训练数据的现代化标注工具,由spaCy的开发者创建。在本视频中,将演示如何使用Prodigy在Google QuickDraw数据集中查找有问题的样本。我们将利用一项涉及UMAP的技术,以半自动化的方式发现异常图像。

[00:00] 引言 [04:04] 使用Quick!Draw! [07:27] 在Jupyter中探索数据 [11:05] UMAP聚类分析 [14:48] 在Jupyter中使用UMAP [18:27] 介绍Prodigy工具 [19:10] 项目设置 [23:30] 使用Prodigy进行标注 [27:25] Prodigy输出结果 [30:54] 在Prodigy中手动进行哈希处理 [33:13] 进行更多标注 [35:18] 经验总结

PRODIGY相关资源

本教程相关资源