spaCy-LLM v0.5:链式思考增强命名实体识别

3 阅读1分钟

v0.5.0: 改进的用户API和用于更精确命名实体识别的新型链式思考提示技术

✨ 新特性与改进

  • 新增:更精确的链式思考(CoT)命名实体识别提示,使用 spacy.NER.v3#180
  • 新增:任务特定的组件工厂,用于 llm_nerllm_spancatllm_relllm_textcatllm_sentimentllm_summarization#243#283
  • 新增:实现了 add_label 功能,可以直接在 Python 代码中更轻松地使用 LLM 组件,而不必(一定)通过配置系统(#277
  • 针对某机构 OpenAI 模型的新 v2 模型版本,为温度(temperature)和最大令牌数(max_tokens)设置了合理的默认值(#236
  • 添加了忽略某机构 Cohere 偶发阻塞错误的功能(#233
  • 支持 Pydantic v1 和 v2(#261#275
  • 内部重构,包括重命名 v1 的 Jinja 模板(#242
  • 在调用之间清空 torch.cuda 的缓存(#242
  • 对测试套件和持续集成(CI)进行了多项改进

🔴 错误修复

  • 修复了某机构 Anthropic 的聊天端点问题(#230

⚠️ 向后不兼容的变更

尽管对内部模块进行了重大重构,但此版本不应引入任何面向用户功能的向后不兼容变更。 如果需要将 SpanCat 或 NER 任务从 v1 或 v2 更新到 v3,请查阅迁移指南。

📖 文档和示例

  • 更新了使用文档
  • 更新了 API 文档
  • 新增了使用 GPT 3.5 的链式思考示例
  • 新增了使用 Dolly 的文本分类示例

👥 贡献者

@adrianeboyd, @honnibal, @ines, @kabirkhan, @ljvmiranda921, @rmitsch, @svlandeg, @victorialslocum, @vinbo8FINISHED