v0.2.0 发布:为 REL 和 spancat 新增任务,支持从文件读取提示模板,以及多项改进与错误修复
✨ 新特性和改进
- 新增:关系抽取任务
spacy.REL.v1(#114) - 新增:
spacy.SpanCat.v1任务,用于处理重叠跨度的实体识别 (#101) - 新增:可将提示模板设置为字符串,或从文件(如 Jinja 模板)中读取,使用
spacy.FileReader.v1(#95) - 改进:NER 任务
spacy.NER.v2的提示效果 (#99) - 新增:在任务
spacy.NER.v2和spacy.SpanCat.v1中支持描述标签 (#84) - 改进:REST 后端
spacy.REST.v1的错误处理和重试机制 (#110) - 安装选项:
spacy-llm现在可以安装所有依赖:- 使用
spacy-llm[minichain]或spacy-llm[langchain]分别安装 MiniChain 和 LangChain 依赖 - 使用
spacy-llm[transformers]在 GPU 上本地运行模型
- 使用
- 改进:类型检查增强,确保任务和后端之间的兼容性 (#83)
- 使用 Task 抽象:替代之前的
template和parse两个函数,使配置更易读 (#91)
🔴 错误修复
- 修复缓存中不正确的文档身份检查 (#104)
- 修复对
.pipe()的多进程支持 (#117)
📖 文档和示例
- 新增使用示例:
- 在单个流水线中执行多个任务
- 使用大语言模型进行关系抽取
- 通过 LangChain 使用某机构的模型
- 通过 MiniChain 使用某机构的模型
👥 贡献者
@adrianeboyd, @bdura, @honnibal, @ines, @kabirkhan, @ljvmiranda921, @rmitsch, @svlandegFINISHED