Prodigy 是一款现代化的标注工具,用于为机器学习模型收集训练数据,由 spaCy 的开发者打造。本视频将展示如何使用 Prodigy 配合 spaCy 的跨度分类器(Span Categorizer)。具体操作包括标注食品食谱,并探讨如何借助模式和临时模型来保证标注一致性、加速标注流程。
[00:00] 简介 [00:28] spancat 工作原理 [01:23] NER 与 spancat 的对比 [02:42] 食品食谱数据集 [04:29] JSONL 文件 [05:09] spaCy 项目 [05:21] spans.manual [07:20] Prodigy 中的指令文件 [08:45] Prodigy 中的模式文件 [10:15] 训练临时模型 [11:35] spans.correct [12:30] data-to-spacy [12:57] 结语
PRODIGY
● 网站与文档:prodi.gy
● 在线演示:prodi.gy/demo
● 论坛:support.prodi.gy
本教程资源
● Spancat 博客文章:explosion.ai/blog/spanca…
● spaCy 项目:github.com/explosion/p…...
● Food.com 数据集:www.kaggle.com/datasets/ir…...
关注我们
● 某机构:twitter.com/explosion_a…
● 提供 spaCy 定制解决方案:explosion.ai/custom-solu…