使用spaCy训练自定义实体链接模型

4 阅读1分钟

spaCy 是一个用于 Python 高级自然语言处理的开源库。本视频展示了如何在 spaCy 中创建一个自定义的实体链接模型,以将文本中不同的人物“Emerson”的提及消歧并链接到知识库中的唯一标识符。这是通过在 Prodigy 中从头开始标注一些文本来训练机器学习模型实现的。你可以按照此笔记本来操作:github.com/explosion/p…...

分步教程

  • 00:00 – 实体链接挑战简介
  • 04:52 – 设置知识库
  • 10:30 – 使用 Prodigy 标注训练数据
  • 19:19 – 将训练数据解析为 spaCy 所需的格式
  • 23:12 – 创建并训练实体链接组件
  • 25:36 – 在未见数据上测试实体链接组件

SPACY 与 PRODIGY

本教程