Prodigy-PDF v0.4.0 发布,新增PDF数据提取与标注功能

4 阅读1分钟

版本亮点

此版本主要新增了两个核心功能模块,用于提升对PDF文件的处理能力。

新增功能

  • pdf.layout.fetch 功能:此功能用于自动提取PDF文档的版面布局信息,为后续的结构化分析提供数据基础。
  • pdf.spans.manual 功能:此功能支持用户对PDF文档中的特定文本片段(即文本跨度)进行手动标注,适用于需要精细化数据标注的场景。FINISHED