spaCy-LLM v0.2.0:关系抽取与SpanCat新任务

3 阅读1分钟

v0.2.0 发布:为 REL 和 spancat 新增任务,支持从文件读取提示模板,以及多项改进与错误修复

✨ 新特性和改进

  • 新增:关系抽取任务 spacy.REL.v1 (#114)
  • 新增spacy.SpanCat.v1 任务,用于处理重叠跨度的实体识别 (#101)
  • 新增:可将提示模板设置为字符串,或从文件(如 Jinja 模板)中读取,使用 spacy.FileReader.v1 (#95)
  • 改进:NER 任务 spacy.NER.v2 的提示效果 (#99)
  • 新增:在任务 spacy.NER.v2spacy.SpanCat.v1 中支持描述标签 (#84)
  • 改进:REST 后端 spacy.REST.v1 的错误处理和重试机制 (#110)
  • 安装选项spacy-llm 现在可以安装所有依赖:
    • 使用 spacy-llm[minichain]spacy-llm[langchain] 分别安装 MiniChain 和 LangChain 依赖
    • 使用 spacy-llm[transformers] 在 GPU 上本地运行模型
  • 改进:类型检查增强,确保任务和后端之间的兼容性 (#83)
  • 使用 Task 抽象:替代之前的 templateparse 两个函数,使配置更易读 (#91)

🔴 错误修复

  • 修复缓存中不正确的文档身份检查 (#104)
  • 修复对 .pipe() 的多进程支持 (#117)

📖 文档和示例

  • 新增使用示例:
    • 在单个流水线中执行多个任务
    • 使用大语言模型进行关系抽取
    • 通过 LangChain 使用某机构的模型
    • 通过 MiniChain 使用某机构的模型

👥 贡献者

@adrianeboyd, @bdura, @honnibal, @ines, @kabirkhan, @ljvmiranda921, @rmitsch, @svlandegFINISHED