丹麦自然语言处理框架DaCy技术解析

47 阅读1分钟

DaCy

DaCy是基于SpaCy构建的丹麦语自然语言处理框架。其最大管道在丹麦语的命名实体识别、词性标注和依存句法分析任务上实现了业界领先性能。该仓库包含使用DaCy的材料、结果复现指南以及包使用说明,同时还包含针对丹麦语NLP管道的偏见性和鲁棒性行为测试。

🔧 安装

关于如何安装该软件包的说明

安装指南

👩‍💻 教程

快速入门使用本软件包的教程

使用DaCy

核心功能模块

  • 命名实体识别
  • 命名实体链接
  • 词性标注
  • 依存句法分析
  • 句子分割
  • 名词短语提取
  • 词形还原
  • 共指消解
  • 情感分析(包含主观性/极性/情绪检测)
  • 基于词典的情感分析
  • 仇恨言论检测

技术支持