Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】

136 阅读1分钟

项目连接:可以直接fork使用
Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】

0.背景介绍

本项目将演示如何通过小样本样本进行模型微调,快速且准确抽取快递单中的目的地、出发地、时间、打车费用等内容,形成结构化信息。辅助物流行业从业者进行有效信息的提取,从而降低客户填单的成本。

数据集情况:
waybill.jsonl文件是快递单信息数据集:

{“id”: 57, “text”: “昌胜远黑龙江省哈尔滨市南岗区宽桥街28号18618391296”, “relations”: [], “entities”: [{“id”: 111, “start_offset”: 0, “end_offset”: 3, “label”: “姓名”}, {“id”: 112, “start_offset”: 3, “end_offset”: 7, “label”: “省份”}, {“id”: 113, “start_offset”: 7, “end_offset”: 11, “label”: “城市”}, {“id”: 114, “start_offset”: 11, “end_offset”: 14, “label”: “县区”}, {“id”: 115, “start_offset”: 14, “end_offset”: 20, “label”: “详细地址”}, {“id”: 116, “start_offset”: 20, “end_offset”: 31, “label”: “电话”}]}
{“id”: 58, “text”: “易颖18500308469山东省烟台市莱阳市富水南路1号”, “relations”: [], “entities”: [{“id”: 118, “start_offset”: 0, “end_offset”: 2, “label”: