Prodigy是一款现代的标注工具,用于为机器学习模型收集训练数据,由spaCy的开发者开发。在本视频中,将展示如何使用Prodigy通过Python编写完全自定义的标注工作流程,如何接入您自己的机器学习模型,以及如何为特定用例混合搭配不同的界面。我们将创建一个图像描述数据集,使用PyTorch实现的图像描述模型来建议描述,并进行错误分析,以找出模型预测正确之处以及需要改进的地方。
分步指南
- 01:59 – 创建手动图像描述标注方案
- 13:26 – 接入PyTorch实现的图像描述模型并纠正其输出
- 19:41 – 添加回调函数以统计修改的描述并输出结果
- 26:33 – 添加错误分析和工作流以审查标注
PRODIGY资源
- 网站与文档:prodi.gy
- 在线演示:prodi.gy/demo
- 自定义方案文档:prodi.gy/docs/custom…
- 论坛:support.prodi.gy
- 方案脚本:github.com/explosion/p…...
本教程相关资源
- 代码:github.com/explosion/p…...
- PyTorch教程与模型:github.com/yunjey/pyto…...
- 图像数据集:www.kaggle.com/alessiocorr…...
关注我们
- Ines Montani: / _inesmontani
- Explosion: / explosion_ai
致谢
- 缩略图猫图像 #1:unsplash.com/photos/E9kV…
- 缩略图猫图像 #2:unsplash.com/photos/_Mty…