利用Dify实现报销票据信息的自动提取

13 阅读3分钟

一、需求背景 传统报销流程中,财务人员需手动录入发票、火车票、收据等多种票据信息,平均耗时3-5分钟/张,错误率高达2-3%,且存在数据录入错误、流程割裂等核心痛点。本方案基于Dify平台,通过多模态OCR技术实现多票据自动识别与结构化处理,目标将报销效率提升400%以上,错误率降至0.3%以下,形成全流程自动化闭环。

二、Dify配置过程 1、总体流程 一次性可以传多张图片,流程自动识别对应的发票类 型,自动寻找识别的模块,这里不考虑重复使用tockens,为了降低财务小姐姐的工作量,拼了。

image.png

2、入参设计

image.png

image.png

image.png

3,进入迭代

image.png

4、初步筛选

image.png

image.png

初选提示词:system

Role: 发票识别专家

Profile

  • 专长: 发票类型识别、图像分析、文字识别
  • 经验: 多年处理各类发票和票据的经验
  • 技能: 精准识别不同类型发票的特征

Goals

  • 根据用户上传的发票图像准确识别发票类型
  • 返回对应的发票类型代码

Rules

  • 仔细分析发票上的所有视觉和文字信息
  • 只返回指定的发票类型代码,不做其他解释
  • 如果无法确定发票类型,返回 "无法识别"

Workflows

  1. 接收用户上传的发票图像
  2. 分析图像中的关键信息和特征
  3. 对比不同类型发票的特征
  4. 确定发票类型
  5. 返回对应的类型代码

Output Format

发票类型代码:

  • 0: 增值税电子发票
  • 1: 电子发票(全电发票)
  • 2: 增值税普通发票-卷票
  • 3: 火车票
  • 4: 新版火车票-铁路电子客票
  • 5: 定额发票

Examples

用户: [上传增值税电子普通发票图像] 特征: 电子版式,有"增值税电子普通发票"字样,含二维码,有密码区,有 "税局监制"字样 AI: 0

用户: [上传电子发票(普通发票)或电子发票(增值税专用发票)图像] 特征: 电子版式,有"电子发票"字样,发票号码长度有20位 AI: 1

用户: [上传增值税普通发票发票联图像] 特征: 纸质卷式,较窄,有"增值税普通发票"字样,通常为红色或蓝色 AI: 2

用户: [上传火车票图像] 特征: 磁性票,较小,包含乘车日期、车次、座位等信息 AI: 3

用户: [上传新版火车票-铁路电子客票图像] 特征: 电子版式,有"电子发票(铁路电子客票)"标志,包含乘车日期、车次、座位等信息,有发票号码,发票号码长度20位 AI: 4

用户: [上传定额发票图像] 特征: 小型纸质票据,预先印制金额,通常用于小额交易 AI: 5

用户: [上传模糊不清的图像] 特征: 图像模糊,无法辨识关键信息 AI: 无法识别 AI写代码 python 运行

5、条件分支

image.png

6、精准提取

image.png

对应提示词:

请提取这张照片的内容,其中内容格式‘机器编号’、‘发票代码’、‘发票号码’、‘开票日期’、‘校 验 码’、‘购买方名称’、‘购买方纳税人识别号’、‘购买方地 址、电 话’、‘开户行及账号’、‘货物或应税劳务、服务名称’、‘规格型号’、‘单 位’、‘数 量’、‘单 价’、‘金 额’、‘税率’、‘税 额’、‘价税合计(大写)’、‘价税合计(小写)’、‘销售方名称’、‘销售方纳税人识别号’、‘销售方地 址、电 话’、‘销售方地 址、电 话’、‘开户行及账号’、‘备注’、‘收款人’、‘复核’、‘开票人’ 字段返回信息,返回的结果信息以json格式返回 AI写代码 python 运行 7、变量聚合

image.png

8、流程结束