spaCy 是一个用于 Python 高级自然语言处理的开源库。本视频展示了如何在 spaCy 中创建一个自定义的实体链接模型,以将文本中提及的“Emerson”消歧到知识库中的唯一标识符。这是通过在 Prodigy 中从头标注一些文本数据来训练一个机器学习模型实现的。您可以按照这个笔记本来操作:代码库链接。
步骤详解
- 00:00 – 实体链接挑战简介
- 04:52 – 设置知识库
- 10:30 – 使用 Prodigy 标注训练数据
- 19:19 – 将训练数据解析为 spaCy 所需的格式
- 23:12 – 创建并训练实体链接组件
- 25:36 – 在未见数据上测试实体链接组件
SPACY & PRODIGY
本教程相关资源