在建筑、电力、化工等高危行业,特殊工种持证上岗是安全生产的底线要求。但传统的人工核验方式效率低、易出错。今天教大家用 Dify + 多模态大模型,零代码、3秒完成证件信息提取!
为什么需要智能证书识别
传统核验的痛点
| 痛点 | 具体表现 | | --- | --- | | 效率低下 | 人工录入一张证书需 2-3 分钟,高峰期排队严重 | | 错误率高 | 手写体、模糊照片导致识别错误,影响审核准确性 | | 管理困难 | 纸质证书存档繁琐,查询追溯耗时 | | 时效性差 | 证书过期无法及时预警,存在合规风险 |
智能识别的价值
-
秒级识别:上传照片即可自动提取全部字段
-
结构化输出:直接生成 JSON 数据,对接业务系统
-
过期预警:自动判断证书有效期,提前提醒
-
批量处理:支持同时上传多张证书,大幅提升效率
技术方案:Dify + 多模态大模型
核心工具介绍
Dify 是一款开源的 LLM 应用开发平台,通过可视化工作流编排,无需编写代码即可构建复杂的 AI 应用。
多模态大模型(如 GPT-5、Qwen3-VL、Qwen3.5-plus)具备强大的图像理解能力,可以直接识别图片中的文字和布局信息。
整体架构
整个识别流程仅需 3 个节点,5 分钟完成搭建:
| 节点 | 功能 | 说明 | | --- | --- | --- | | 🟢 开始 | 用户输入 | 接收证书图片上传 | | 🔵 LLM | 智能识别 | qwen3.5-plus 多模态模型提取信息 | | 🟠 结束 | 结果输出 | 返回结构化 JSON 数据 |
Dify工作流设计
准备工作
所需资源:
-
Dify 账号(社区版免费)或本地部署的Dify(可以参考我之前的文章)
-
支持视觉的大模型 API(推荐 Qwen3-VL/Qwen3.5-Plus 或 Kimi K2.5)
-
几张特殊工种证书样本(用于测试)
模型推荐:
| 模型 | 供应商 | 特点 | 成本 | | --- | --- | --- | --- | | qwen3.5-plus | 阿里云 | 中文识别优秀,性价比高 | ⭐ 推荐 | | Qwen3-VL-32B-Instruct | 硅基流动 | 视觉理解能力强 | 中等 | | GPT-5 | Open AI | 通用能力强 | 较高 |
💡 推荐方案:本文使用 qwen3.5-plus,该模型对中文证书识别效果出色,且成本低廉,适合生产环境部署。
步骤一:创建 Workflow 应用
-
登录 Dify 控制台,点击 【新建应用】
-
选择 【工作流】 类型
-
输入应用名称,如「特殊工种证书识别助手」
-
点击创建,进入工作流编排界面
步骤二:配置开始节点
拖入 【开始】 节点,添加文件上传字段:
步骤三:配置 LLM 识别节点
拖入 【LLM】 节点,连接开始节点:
关键配置项:
| 配置项 | 设置值 | | --- | --- | | 模型 | qwen3.5-plus | | 视觉 | 启用 | | 温度 | 0.7(默认) |
System Prompt 设计:
你是一位专业的特种作业证书识别专家。请仔细分析用户上传的证书图片,提取以下字段信息:
【必须提取的字段】
1. 证号/证书编号 (certNumber) - 如:T850529198809165816
2. 姓名 (name)
3. 性别 (gender) - 男/女
4. 作业类别 (jobType) - 如:电工作业、焊接与热切割作业等
5. 操作项目 (operationItems) - 如:低压电工作业、高压电工作业(可能有多项)
6. 初领日期 (firstIssueDate) - 格式:YYYY-MM-DD
7. 有效期限 (validityPeriod) - 完整文本,如"2024-08-09至2030-08-08"
8. 有效期起始日期 (validFrom) - 格式:YYYY-MM-DD
9. 有效期截止日期 (validUntil) - 格式:YYYY-MM-DD
10. 应复审日期 (reviewDate) - 格式:YYYY-MM-DD,如"2027-08-08"
11. 签发机关 (issuingAuthority) - 如:福建省应急管理厅
12. 照片是否存在 (hasPhoto) - true/false
13. 二维码是否存在 (hasQRCode) - true/false
【输出格式要求】
必须以 JSON 格式输出,不要包含任何解释性文字:
{
"certNumber": "T850529198809165816",
"name": "张三丰",
"gender": "男",
"jobType": "电工作业",
"operationItems": ["低压电工作业"],
"firstIssueDate": "2024-08-09",
"validityPeriod": "2024-08-09至2030-08-08",
"validFrom": "2024-08-09",
"validUntil": "2030-08-08",
"reviewDate": "2027-08-08",
"issuingAuthority": "XXX省应急管理厅",
"hasPhoto": true,
"hasQRCode": true
}
【注意事项】
- 日期字段必须标准化为 YYYY-MM-DD 格式
- 证号通常以字母T开头,后面是18位数字
- 应复审日期一般在证书左下角,格式为"XXXX年XX月XX日前"
- 如某项信息缺失,使用 null 表示
- 确保证书编号完整,包括字母前缀
步骤四:配置输出节点
在LLM节点后增加 【输出】 节点:
完整工作流程图
完成! 现在点击「发布」,即可通过 API 或 Web 界面使用证书识别功能。
识别效果展示
点击dify 编辑界面右上角【测试运行】按钮,上传二张测试用的特工证,点击【开始运行】触发识别流程。
应用场景拓展
入场安全核验
-
工人进场前,扫码上传证书
-
系统自动核验真伪和有效期
-
过期证书自动拦截,禁止入场
培训到期提醒
-
扫描证书获取有效期
-
提前 90 天发送续期提醒
-
自动推送培训课程信息
人员资质档案
-
批量导入历史证书
-
建立电子资质档案库
-
支持按工种、有效期等多维度查询
通过 Dify + 多模态大模型,我们零代码搭建了一套完整的特殊工种证书智能识别系统:
-
3 秒完成单张证书信息提取
-
95%+ 准确率,满足业务需求
-
JSON 结构化输出,无缝对接业务系统
-
灵活扩展,支持多种证书类型
这套方案不仅适用于特工证识别,还可以扩展到身份证、驾驶证、营业执照等各类证件的智能识别场景。