【识别内容改名】批量OCR识别图片文件或PDF文件指定区域内容并自动批量命名,具体操作办法

78 阅读3分钟

规模较大的鞋子电商公式,其商品库中存储着海量鞋子图片。图片名称毫无规律,常为类似 “pic_20240101_123.jpg” 这样的随机编号。运营人员若要找一款 “黑色牛皮休闲皮鞋,42 码” 的图片,得逐一打开查看,平均找一张图片要花好几分钟,严重影响工作效率。​

拍摄鞋子图片时,运营人员会在图片一角附上写有商品关键信息的小标签,涵盖鞋款名称、材质、尺码、颜色等。系统借助 OCR 技术识别标签内容,像识别出 “黑色牛皮休闲皮鞋_42 码_牛皮材质” 后,自动完成图片重命名,操作起来就会很方便,下面教会大家如何操作

第一步、获取工具

咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统

百度网盘:pan.baidu.com/s/1mWsg7mDZ…

腾讯网盘:share.weiyun.com/a77jklXK

第二步、对图片识别区域采样

框选区域:将图片拖入软件,用鼠标框选区域,右侧预览。

保存坐标:保存绘制区域,若有多个区域多次绘制并保存。

命名区域:为每个坐标区域采样后起不同的名字保存,这些名字将作为导出表格的列名。

第三步、加载文件并批量处理

点击“图片文件夹”按钮,将图片文件批量导入软件

第四步、选择【区域识别重命名】

根据需求选择“区域识别重命名”或“区域识别导表格”功能。

第五步、批量重命名和校核

重命名完成后,检查处理结果。如果发现有识别错误或重命名不符合要求的情况,可以返回相应步骤进行修正,然后重新执行识别、重命名和导出操作。


关于区域识别的注意事项:

​**字体类型:**不同字体的笔画结构、形状差异很大。一些艺术字体、手写体或变形字体,由于其独特的书写风格和不规则的形状,相较于标准印刷字体更难被识别。比如手写的草书,其笔画的连贯性和随意性使得识别算法难以把握每个字符的准确形态。

**文字大小:**文字过小会使图像中的文字细节难以分辨,识别精度下降;文字过大则可能超出识别区域或导致图像比例失调,同样影响识别效果。

**倾斜角度:**如果文字存在倾斜,在识别过程中算法需要先进行倾斜校正,否则会影响特征提取和字符匹配的准确性。比如扫描时文档放置倾斜,或者拍摄角度问题导致文字图像倾斜,都会给识别带来挑战。

​**文字排列方式:**不规则的文字排列,如竖排文字、弯曲排列等,与常见的横排规则文字不同,需要专门的算法处理,增加了识别的复杂性 。