如何用python实现ocr的功能?

574 阅读1分钟

要在Python中实现OCR功能,可以使用Tesseract OCR引擎。Tesseract是一个开源的OCR引擎,可以识别各种图像中的文字。

安装OCR引擎

首先,确保计算机已安装Tesseract OCR引擎。可以从以下链接下载并安装适合您操作系统的版本:github.com/tesseract-o…
windows的下载地址:
digi.bib.uni-mannheim.de/tesseract/t…

安装完成后,您可以使用Python的pytesseract库与Tesseract进行集成。pytesseract库提供了一个简单的接口,方便使用Tesseract进行图像文字识别。

安装OCR库

首先,确保您已经安装了pytesseract库。可以使用以下命令进行安装:

pip install pytesseract

编写python代码

安装完成后,您可以使用以下示例代码进行OCR识别:

import pytesseract
from PIL import Image

# 设置Tesseract的安装路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# 加载图像
image = Image.open('image.png')

# 使用Tesseract进行OCR识别
text = pytesseract.image_to_string(image)

# 打印识别结果
print(text)

在上面的示例中,我们首先导入pytesseract库和Image类(来自PIL库)。然后,我们使用pytesseract.pytesseract.tesseract_cmd来设置Tesseract的安装路径,确保Python可以找到Tesseract可执行文件。

接下来,我们使用Image.open函数加载要识别的图像文件。然后,我们使用pytesseract.image_to_string函数将图像传递给Tesseract进行OCR识别。最后,我们打印识别的文本结果。

请确保将代码中的image.png替换为您要识别的实际图像文件的路径。

下载中文语言包

如果是识别中文,需要下载对应的语言包
下载地址:
github.com/tesseract-o…
国内镜像:
gitcode.net/mirrors/tes…\

识别中文

修改上面的代码:

text = pytesseract.image_to_string(image,lang='chi_sim')