在日常工作中,我们常常需要对大量图片进行批量处理,例如提取图片中的文字内容、根据内容重命名图片,甚至将提取的信息导出为表格以便进一步分析。这些任务如果手动完成,不仅耗时耗力,还容易出错。幸运的是,借助“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统”,我们可以高效地完成这些任务。
一、应用场景
-
档案管理:在企业或机构的档案管理中,常常会有大量扫描后的图片格式档案,如合同、文件等。这些档案图片中包含着关键的信息,如合同编号、文件标题等,需要根据这些信息对图片进行重命名以便于管理和查找。
-
商品管理:在商品管理中,可以对带有商品标签的图片进行批量识别和重命名,根据标签上的商品名称、型号等信息来命名图片,方便后续的查找和管理。
-
文档存档:对于一些包含纸质文档扫描件且文档上有标注信息的图片,也可以按照标注进行命名。
二、具体操作步骤
1. 获取软件
- 安装与启动系统:咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统
百度网盘:pan.baidu.com/s/1mWsg7mDZ…
腾讯网盘:share.weiyun.com/a77jklXK
2. 识别区域采样
-
框选区域:将图片拖入软件界面,用鼠标框选需要识别的区域,并在右侧进行预览。
-
保存坐标:保存绘制区域的坐标,若有多个区域需要识别,可多次绘制并保存。
-
命名区域:为每个坐标区域采样后起不同的名字保存,这些名字将作为导出表格的列名。
3. 加载文件批量处理
-
点击“导入图片”按钮,选择待处理的图片文件所在的文件夹,将文件批量导入软件。
-
根据需求选择“区域识别重命名”或“区域识别导表格”功能。若选择“区域识别重命名”,软件会根据识别内容对文件进行批量改名。
4. 处理完成结果校验
- 识别完成后,需要对结果进行检查,查看文件名是否准确,表格内容是否完整、正确。如有错误,可根据具体情况调整识别区域或重新设置参数再次处理。
三、其他推荐方法
1. 使用Tesseract OCR配合Tesseract-gui
-
安装与配置:首先确保已经在电脑上安装并配置好Tesseract OCR和Tesseract-gui。
-
打开图片:启动Tesseract-gui,点击“打开图像”按钮,选择需要处理的照片文件。
-
设置识别区域:在“页面设置”中,通过设置“页面偏移”“宽度”“高度”等参数来确定识别区域。
-
进行识别:点击“识别”按钮,Tesseract OCR会对所选区域的文字进行识别。
-
保存识别结果:将识别结果保存为文本文件。
-
重命名图片与整理到Excel:根据识别出的内容,手动对图片进行重命名,并将文本文件中的内容复制到Excel软件中,手动整理成表格。
2. 使用Python脚本(基于PaddleOCR)
-
安装所需库:
bash复制
pip install paddlepaddle paddleocr pillow -
编写Python脚本:
Python复制
import os import paddleocr from PIL import Image def crop_image(image_path, left, top, right, bottom): image = Image.open(image_path) cropped_image = image.crop((left, top, right, bottom)) return cropped_image def ocr_and_rename_images(input_folder, left, top, right, bottom): ocr = paddleocr.PaddleOCR(use_angle_cls=True, lang='ch') for root, dirs, files in os.walk(input_folder): for file in files: if file.lower().endswith(('.jpg', '.png', '.jpeg')): cropped_image = crop_image(file_path, left, top, right, bottom) result = ocr.ocr(cropped_image, cls=True) if result: text = result[0][1][0] new_file_name = f"{text}{os.path.splitext(file)[1]}" new_file_path = os.path.join(root, new_file_name) os.rename(file_path, new_file_path) print(f"文件 {file} 已重命名为 {new_file_name}") if __name__ == "__main__": input_folder = "path/to/your/image/folder" left, top, right, bottom = 100, 200, 300, 400 ocr_and_rename_images(input_folder, left, top, right, bottom) -
运行脚本:将图片文件放入指定文件夹,运行脚本后,脚本会遍历文件夹中的图片文件,裁剪指定区域,识别文字,并根据识别结果重命名图片文件。
四、总结
通过“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统”,我们可以高效地完成批量图片的OCR识别、重命名以及信息导出任务。此外,使用Tesseract OCR和Python脚本也是不错的选择,可以根据具体需求灵活选择适合的方法。