专为“把图片/PDF里的文字拖出来→重命名→生成Excel”而设计的工具,主打“零代码、框选即识别、一键批量”。下面把官方教程和实测要点浓缩成一份“速查手册”,拿到软件后按顺序操作即可。
一、操作流程(总览)
① 安装→② 选模式→③ 画区域采样→④ 批量导入→⑤ 识别+重命名→⑥ 导出Excel
二、详细步骤
咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统
百度网盘:pan.baidu.com/s/1mWsg7mDZ…
腾讯网盘:share.weiyun.com/a77jklXK
- 安装与启动
双击“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统.exe”,无需安装,右键“以管理员身份运行”可避免权限报错。 - 选择处理模式图片(JPG/PNG/TIFF)→“图片处理模式”;扫描型PDF(含多页)→“PDF处理模式”;混合文件可分批处理。
- 区域采样(关键步骤)
a. 把“样本文件”拖进预览区;b. 用“矩形工具”框选需要识别的区域,例如发票的“发票代码”、“金额”、“日期”三处;c. 每框完一次点“保存区域”,系统会提示给区域命名(此名字即Excel列名),同时把坐标写入ini模板;d. 支持“多页PDF只采第一页”或“每页都采”,在设置里勾选即可。
- 批量导入点击“导入文件夹”,选中存放待处理文件的目录;文件列表支持按文件名、页数排序,可二次剔除无需处理的文件。
- 识别与重命名规则设置:纯重命名:把识别结果按“区域名+连接符”拼成新文件名,例如“发票代码_金额_日期.pdf”;重命名同时写Excel:勾选“导出表格”,系统会在处理完成后自动生成.xlsx;若某区域识别为空,可设“跳过”或“fallback字段”,避免文件名为空。
- 导出Excel识别结束后点“导出表格”,可选择字段:原文件名、新文件名、各区域文字、置信度、页码;Excel已做“文本格式”处理,防止长数字被科学计数法。
三、高阶技巧
- 识别率优化:扫描件DPI建议200–400;手机拍照请保持光照均匀,避免阴影。在“图像预处理”里打开“自动去噪+倾斜校正”,对老旧扫描件提升明显。自建词库:把行业高频词(如“增值税专用发票”、“COVID-19”)写入userdict.txt,可大幅降低错字率。
- 多区域重叠/跨页若两个字段在视觉上有重叠,可在“区域优先级”里拖拽排序;系统按顺序识别,先命中者优先。
- 正则清洗在“字段后处理”里可写正则,例如把识别出的“¥1,234.56”只保留数字“1234.56”,方便后续做账。
四、常见故障排查
- 闪退/无反应 → 检查.net 4.8是否安装;PDF模式需 VC++2015-2022运行库。
- 识别结果空白 → 区域坐标采错或PDF为“文本型”,需先打印成图片再识别。
- 文件名乱码 → 系统区域设置改为“中文(简体,中国)”,重启软件即可。
- 导出Excel打不开 → 识别字段里出现非法字符(如/ \ ? *等),在“替换字符”里统一改成“_”。
五、适用场景速配
企业合同:提取“合同编号”、“签约方”、“签订日期”→重命名+台账
医院病历:提取“患者姓名”、“病历号”、“诊断”→按“病历号_姓名.pdf”归档
电商发货单:提取“订单号”、“物流公司”→批量重命名后上传ERP
财务发票:提取“发票代码”、“金额”、“校验码”→生成Excel供金税系统比对
六、版本更新记录(2025年)v3.6.0(2025-09-15)
- 新增“跨页表格合并”功能,可把多页同一区域识别结果拼成一行;
- 支持GPU加速(CUDA 11.8),批量速度提升约2.3倍;
- 修复“长文件名256字符截断”问题。