如何批量识别图片和PDF区域的文字内容，批量修改文件名或导出表格的详细步骤和注意事项

追你到天边Go

2026-01-21 231 阅读4分钟

专为“把图片/PDF里的文字拖出来→重命名→生成Excel”而设计的工具，主打“零代码、框选即识别、一键批量”。下面把官方教程和实测要点浓缩成一份“速查手册”，拿到软件后按顺序操作即可。

一、操作流程（总览）

① 安装→② 选模式→③ 画区域采样→④ 批量导入→⑤ 识别+重命名→⑥ 导出Excel

二、详细步骤

安装与启动
双击“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统.exe”，无需安装，右键“以管理员身份运行”可避免权限报错。
选择处理模式图片（JPG/PNG/TIFF）→“图片处理模式”；扫描型PDF（含多页）→“PDF处理模式”；混合文件可分批处理。
区域采样（关键步骤）

a. 把“样本文件”拖进预览区；b. 用“矩形工具”框选需要识别的区域，例如发票的“发票代码”、“金额”、“日期”三处；c. 每框完一次点“保存区域”，系统会提示给区域命名（此名字即Excel列名），同时把坐标写入ini模板；d. 支持“多页PDF只采第一页”或“每页都采”，在设置里勾选即可。

批量导入点击“导入文件夹”，选中存放待处理文件的目录；文件列表支持按文件名、页数排序，可二次剔除无需处理的文件。
识别与重命名规则设置：纯重命名：把识别结果按“区域名+连接符”拼成新文件名，例如“发票代码_金额_日期.pdf”；重命名同时写Excel：勾选“导出表格”，系统会在处理完成后自动生成.xlsx；若某区域识别为空，可设“跳过”或“fallback字段”，避免文件名为空。
导出Excel识别结束后点“导出表格”，可选择字段：原文件名、新文件名、各区域文字、置信度、页码；Excel已做“文本格式”处理，防止长数字被科学计数法。

三、高阶技巧

识别率优化：扫描件DPI建议200–400；手机拍照请保持光照均匀，避免阴影。在“图像预处理”里打开“自动去噪+倾斜校正”，对老旧扫描件提升明显。自建词库：把行业高频词（如“增值税专用发票”、“COVID-19”）写入userdict.txt，可大幅降低错字率。
多区域重叠/跨页若两个字段在视觉上有重叠，可在“区域优先级”里拖拽排序；系统按顺序识别，先命中者优先。
正则清洗在“字段后处理”里可写正则，例如把识别出的“￥1,234.56”只保留数字“1234.56”，方便后续做账。

四、常见故障排查

闪退/无反应 → 检查.net 4.8是否安装；
识别结果空白 → 区域坐标采错或PDF为“文本型”，需先打印成图片再识别。
文件名乱码 → 系统区域设置改为“中文（简体，中国）”，重启软件即可。
导出Excel打不开 → 识别字段里出现非法字符（如/ \ ? *等），在“替换字符”里统一改成“_”。

五、适用场景速配

企业合同：提取“合同编号”、“签约方”、“签订日期”→重命名+台账
医院病历：提取“患者姓名”、“病历号”、“诊断”→按“病历号_姓名.pdf”归档
电商发货单：提取“订单号”、“物流公司”→批量重命名后上传ERP
财务发票：提取“发票代码”、“金额”、“校验码”→生成Excel供金税系统比对

六、版本更新记录（2025年）v3.6.0（2025-09-15）

新增“跨页表格合并”功能，可把多页同一区域识别结果拼成一行；
支持GPU加速，批量速度提升约2.3倍；
修复“长文件名256字符截断”问题。