Prodigy是一款用于收集机器学习模型训练数据的现代化标注工具,由spaCy的开发者创建。在本视频中,将演示如何使用Prodigy在Google QuickDraw数据集中查找有问题的样本。我们将利用一项涉及UMAP的技术,以半自动化的方式发现异常图像。
[00:00] 引言 [04:04] 使用Quick!Draw! [07:27] 在Jupyter中探索数据 [11:05] UMAP聚类分析 [14:48] 在Jupyter中使用UMAP [18:27] 介绍Prodigy工具 [19:10] 项目设置 [23:30] 使用Prodigy进行标注 [27:25] Prodigy输出结果 [30:54] 在Prodigy中手动进行哈希处理 [33:13] 进行更多标注 [35:18] 经验总结
PRODIGY相关资源
- 官网与文档:prodi.gy
- 在线演示:prodi.gy/demo
- 论坛:support.prodi.gy
本教程相关资源
- 代码与数据:github.com/explosion/p…...
- Jupyter Notebook:github.com/explosion/p…...
- UMAP文档:umap-learn.readthedocs.io/en/...
- Google Quick! Draw!:quickdraw.withgoogle.com/
- 自定义Prodigy配方文档:prodi.gy/docs/custom…