spaCy 是一个用于 Python 高级自然语言处理的开源库。本视频展示了如何在 spaCy 中创建一个自定义的实体链接模型,以将文本中不同的人物“Emerson”的提及消歧并链接到知识库中的唯一标识符。这是通过在 Prodigy 中从头开始标注一些文本来训练机器学习模型实现的。你可以按照此笔记本来操作:github.com/explosion/p…...
分步教程
- 00:00 – 实体链接挑战简介
- 04:52 – 设置知识库
- 10:30 – 使用 Prodigy 标注训练数据
- 19:19 – 将训练数据解析为 spaCy 所需的格式
- 23:12 – 创建并训练实体链接组件
- 25:36 – 在未见数据上测试实体链接组件
SPACY 与 PRODIGY
- spaCy: spacy.io
- 免费在线课程: course.spacy.io
- Prodigy 网站与文档: prodi.gy
本教程
- 代码与数据: github.com/explosion/p…...
- spaCy 中的实体链接 (spaCy IRL 演讲): • Sofie Van Landeghem: Entity linking functi...
- 实体链接文档: spacy.io/usage/train…...