Prodigy 是一款现代化的标注工具,用于收集机器学习模型的训练数据。本文将展示如何使用 Prodigy 在 Python 中编写完全自定义的标注工作流,如何接入自己的机器学习模型,以及如何针对特定用例混合搭配不同界面。具体操作包括:创建一个图像描述数据集,使用基于 PyTorch 实现的图像描述模型来生成建议描述,并进行错误分析,以找出模型的正确预测和需要改进之处。
分步指南
- 01:59 – 创建手动图像标注的 recipe
- 13:26 – 接入基于 PyTorch 实现的图像描述模型并修正其输出
- 19:41 – 添加回调函数以统计修改过的描述并输出结果
- 26:33 – 添加用于错误分析和审核标注的工作流
相关资源
- Prodigy 官网与文档:prodi.gy
- 在线演示:prodi.gy/demo
- 自定义 recipes 文档:prodi.gy/docs/custom…
- 论坛:support.prodi.gy
- Recipe 脚本代码库:github.com/explosion/p…
- 本教程代码:github.com/explosion/p…
- PyTorch 教程与模型:github.com/yunjey/pyto…
- 图像数据集:www.kaggle.com/alessiocorr…FINISHED