Dify 实战系列(1):特工证信息提取

0 阅读5分钟

在建筑、电力、化工等高危行业,特殊工种持证上岗是安全生产的底线要求。但传统的人工核验方式效率低、易出错。今天教大家用 Dify + 多模态大模型,零代码、3秒完成证件信息提取!

为什么需要智能证书识别

传统核验的痛点

| 痛点 | 具体表现 | | --- | --- | | 效率低下 | 人工录入一张证书需 2-3 分钟,高峰期排队严重 | | 错误率高 | 手写体、模糊照片导致识别错误,影响审核准确性 | | 管理困难 | 纸质证书存档繁琐,查询追溯耗时 | | 时效性差 | 证书过期无法及时预警,存在合规风险 |

智能识别的价值

  • 秒级识别:上传照片即可自动提取全部字段

  • 结构化输出:直接生成 JSON 数据,对接业务系统

  • 过期预警:自动判断证书有效期,提前提醒

  • 批量处理:支持同时上传多张证书,大幅提升效率

技术方案:Dify + 多模态大模型

核心工具介绍

Dify 是一款开源的 LLM 应用开发平台,通过可视化工作流编排,无需编写代码即可构建复杂的 AI 应用。

多模态大模型(如 GPT-5、Qwen3-VL、Qwen3.5-plus)具备强大的图像理解能力,可以直接识别图片中的文字和布局信息。

整体架构

整个识别流程仅需 3 个节点,5 分钟完成搭建:

| 节点 | 功能 | 说明 | | --- | --- | --- | | 🟢 开始 | 用户输入 | 接收证书图片上传 | | 🔵 LLM | 智能识别 | qwen3.5-plus 多模态模型提取信息 | | 🟠 结束 | 结果输出 | 返回结构化 JSON 数据 |

Dify工作流设计

准备工作

所需资源:

  • Dify 账号(社区版免费)或本地部署的Dify(可以参考我之前的文章)

  • 支持视觉的大模型 API(推荐 Qwen3-VL/Qwen3.5-Plus 或 Kimi K2.5)

  • 几张特殊工种证书样本(用于测试)

模型推荐:

| 模型 | 供应商 | 特点 | 成本 | | --- | --- | --- | --- | | qwen3.5-plus | 阿里云 | 中文识别优秀,性价比高 | ⭐ 推荐 | | Qwen3-VL-32B-Instruct | 硅基流动 | 视觉理解能力强 | 中等 | | GPT-5 | Open AI | 通用能力强 | 较高 |

💡 推荐方案:本文使用 qwen3.5-plus,该模型对中文证书识别效果出色,且成本低廉,适合生产环境部署。

步骤一:创建 Workflow 应用

  1. 登录 Dify 控制台,点击 【新建应用】

  2. 选择 【工作流】 类型

  3. 输入应用名称,如「特殊工种证书识别助手」

  4. 点击创建,进入工作流编排界面

步骤二:配置开始节点

拖入 【开始】 节点,添加文件上传字段:

步骤三:配置 LLM 识别节点

拖入 【LLM】 节点,连接开始节点:

关键配置项:

| 配置项 | 设置值 | | --- | --- | | 模型 | qwen3.5-plus | | 视觉 | 启用 | | 温度 | 0.7(默认) |

System Prompt 设计:

你是一位专业的特种作业证书识别专家。请仔细分析用户上传的证书图片,提取以下字段信息:

【必须提取的字段】
1. 证号/证书编号 (certNumber) - 如:T850529198809165816
2. 姓名 (name)
3. 性别 (gender) - 男/女
4. 作业类别 (jobType) - 如:电工作业、焊接与热切割作业等
5. 操作项目 (operationItems) - 如:低压电工作业、高压电工作业(可能有多项)
6. 初领日期 (firstIssueDate) - 格式:YYYY-MM-DD
7. 有效期限 (validityPeriod) - 完整文本,如"2024-08-09至2030-08-08"
8. 有效期起始日期 (validFrom) - 格式:YYYY-MM-DD
9. 有效期截止日期 (validUntil) - 格式:YYYY-MM-DD
10. 应复审日期 (reviewDate) - 格式:YYYY-MM-DD,如"2027-08-08"
11. 签发机关 (issuingAuthority) - 如:福建省应急管理厅
12. 照片是否存在 (hasPhoto) - true/false
13. 二维码是否存在 (hasQRCode) - true/false

【输出格式要求】
必须以 JSON 格式输出,不要包含任何解释性文字:

{
  "certNumber": "T850529198809165816",
  "name": "张三丰",
  "gender": "男",
  "jobType": "电工作业",
  "operationItems": ["低压电工作业"],
  "firstIssueDate": "2024-08-09",
  "validityPeriod": "2024-08-09至2030-08-08",
  "validFrom": "2024-08-09",
  "validUntil": "2030-08-08",
  "reviewDate": "2027-08-08",
  "issuingAuthority": "XXX省应急管理厅",
  "hasPhoto": true,
  "hasQRCode": true
}

【注意事项】
- 日期字段必须标准化为 YYYY-MM-DD 格式
- 证号通常以字母T开头,后面是18位数字
- 应复审日期一般在证书左下角,格式为"XXXX年XX月XX日前"
- 如某项信息缺失,使用 null 表示
- 确保证书编号完整,包括字母前缀

步骤四:配置输出节点

在LLM节点后增加 【输出】 节点:

完整工作流程图

完成! 现在点击「发布」,即可通过 API 或 Web 界面使用证书识别功能。

识别效果展示

点击dify 编辑界面右上角【测试运行】按钮,上传二张测试用的特工证,点击【开始运行】触发识别流程。

应用场景拓展

入场安全核验

  • 工人进场前,扫码上传证书

  • 系统自动核验真伪和有效期

  • 过期证书自动拦截,禁止入场

培训到期提醒

  • 扫描证书获取有效期

  • 提前 90 天发送续期提醒

  • 自动推送培训课程信息

人员资质档案

  • 批量导入历史证书

  • 建立电子资质档案库

  • 支持按工种、有效期等多维度查询

通过 Dify + 多模态大模型,我们零代码搭建了一套完整的特殊工种证书智能识别系统:

  • 3 秒完成单张证书信息提取

  • 95%+ 准确率,满足业务需求

  • JSON 结构化输出,无缝对接业务系统

  • 灵活扩展,支持多种证书类型

这套方案不仅适用于特工证识别,还可以扩展到身份证、驾驶证、营业执照等各类证件的智能识别场景。