如何使用“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统”进行图片批量处理

336 阅读4分钟

在日常工作中,我们常常需要对大量图片进行批量处理,例如提取图片中的文字内容、根据内容重命名图片,甚至将提取的信息导出为表格以便进一步分析。这些任务如果手动完成,不仅耗时耗力,还容易出错。幸运的是,借助“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统”,我们可以高效地完成这些任务。

一、应用场景

  1. 档案管理:在企业或机构的档案管理中,常常会有大量扫描后的图片格式档案,如合同、文件等。这些档案图片中包含着关键的信息,如合同编号、文件标题等,需要根据这些信息对图片进行重命名以便于管理和查找。

  2. 商品管理:在商品管理中,可以对带有商品标签的图片进行批量识别和重命名,根据标签上的商品名称、型号等信息来命名图片,方便后续的查找和管理。

  3. 文档存档:对于一些包含纸质文档扫描件且文档上有标注信息的图片,也可以按照标注进行命名。

二、具体操作步骤

1. 获取软件

  • 安装与启动系统:咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统

百度网盘:pan.baidu.com/s/1mWsg7mDZ…

腾讯网盘:share.weiyun.com/a77jklXK

2. 识别区域采样

  • 框选区域:将图片拖入软件界面,用鼠标框选需要识别的区域,并在右侧进行预览。

  • 保存坐标:保存绘制区域的坐标,若有多个区域需要识别,可多次绘制并保存。

  • 命名区域:为每个坐标区域采样后起不同的名字保存,这些名字将作为导出表格的列名。

3. 加载文件批量处理

  • 点击“导入图片”按钮,选择待处理的图片文件所在的文件夹,将文件批量导入软件。

  • 根据需求选择“区域识别重命名”或“区域识别导表格”功能。若选择“区域识别重命名”,软件会根据识别内容对文件进行批量改名。

4. 处理完成结果校验

  • 识别完成后,需要对结果进行检查,查看文件名是否准确,表格内容是否完整、正确。如有错误,可根据具体情况调整识别区域或重新设置参数再次处理。

三、其他推荐方法

1. 使用Tesseract OCR配合Tesseract-gui

  • 安装与配置:首先确保已经在电脑上安装并配置好Tesseract OCR和Tesseract-gui。

  • 打开图片:启动Tesseract-gui,点击“打开图像”按钮,选择需要处理的照片文件。

  • 设置识别区域:在“页面设置”中,通过设置“页面偏移”“宽度”“高度”等参数来确定识别区域。

  • 进行识别:点击“识别”按钮,Tesseract OCR会对所选区域的文字进行识别。

  • 保存识别结果:将识别结果保存为文本文件。

  • 重命名图片与整理到Excel:根据识别出的内容,手动对图片进行重命名,并将文本文件中的内容复制到Excel软件中,手动整理成表格。

2. 使用Python脚本(基于PaddleOCR)

  • 安装所需库

    bash复制

    pip install paddlepaddle paddleocr pillow
    
  • 编写Python脚本

    Python复制

    import os
    import paddleocr
    from PIL import Image
    
    def crop_image(image_path, left, top, right, bottom):
        image = Image.open(image_path)
        cropped_image = image.crop((left, top, right, bottom))
        return cropped_image
    
    def ocr_and_rename_images(input_folder, left, top, right, bottom):
        ocr = paddleocr.PaddleOCR(use_angle_cls=True, lang='ch')
        for root, dirs, files in os.walk(input_folder):
            for file in files:
                if file.lower().endswith(('.jpg', '.png', '.jpeg')):
                    cropped_image = crop_image(file_path, left, top, right, bottom)
                    result = ocr.ocr(cropped_image, cls=True)
                    if result:
                        text = result[0][1][0]
                        new_file_name = f"{text}{os.path.splitext(file)[1]}"
                        new_file_path = os.path.join(root, new_file_name)
                        os.rename(file_path, new_file_path)
                        print(f"文件 {file} 已重命名为 {new_file_name}")
    
    if __name__ == "__main__":
        input_folder = "path/to/your/image/folder"
        left, top, right, bottom = 100, 200, 300, 400
        ocr_and_rename_images(input_folder, left, top, right, bottom)
    
  • 运行脚本:将图片文件放入指定文件夹,运行脚本后,脚本会遍历文件夹中的图片文件,裁剪指定区域,识别文字,并根据识别结果重命名图片文件。

四、总结

通过“咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统”,我们可以高效地完成批量图片的OCR识别、重命名以及信息导出任务。此外,使用Tesseract OCR和Python脚本也是不错的选择,可以根据具体需求灵活选择适合的方法。