使用Python的pytesseract库进行图片文字识别时遇到的问题

1,650 阅读1分钟

1.第一步使用pip install 下载pytesseract。

2.第二步开始运行的时候,发现如下的报错提示: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path。

后面查询资料发现pytesseract库需要集合引擎使用。所以下载安装如图软件,:

安装好以后,记得一个关键的操作: 在自己的python路径中找到这个文件夹:

进入找到py文件,修改cmd路径为自己的tesseract安装路径:

3.上面步骤操作后,程序跑起来,还是出现如下错误: pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/chi_sim.traineddata') 查询资料发现是没有下载chi数据库(自行百度下载对应版本的库安装到tessdata中)

程序运行成功。