Python人工智能之图片识别,Python3一行代码实现图片文字识别

240 阅读5分钟

from PIL import Image

import pytesseract

#上面都是导包,只需要下面这一行就能实现图片文字识别

text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')

print(text)




我们以识别诗词为例  

下面是我们要识别的图片



![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/c69be1b98fd24be5984e144f07f1eeb3~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=DwDno7A1stkCWnru1UzioccUkv8%3D)  

###先看下效果图  

![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/37b8d3bac7df4b11bb18beea7d6bbdbb~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=X%2BjKDwuwLsOiUXpRaago5li14P0%3D)  

我们运行代码后识别的结果,有几个字没有正确识别,但是大多数字都能识别出来。



风急天高猿啸哀 渚芸胄芳少白鸟飞凤

无边落木萧萧下, 不尽长量工盲衮宕衮来

万里悲秋常1乍窨, 百年多病独登氤

艰难苦恨擎霜量 漂倒新停澍酉帆




##一行代码就能识别图片,我们背后要做些准备工作的



*   这里我们需要用到两个库:pytesseract和PIL

*   同时我们还需要安装识别引擎tesseract-ocr



###下面就来讲讲这几个库的安装,因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别



#一,pytesseract和PIL的安装  

安装这两个包可以借助pip



*   1,命令行安装  

    pip install PIL  

    pip install pytesseract

*   2,如果你用的pycharm编辑器,就可以直接借助pycharm实现快速安装。  

    在pycharm的Settings设置页按照下面步骤操作  

    ![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/7e8306d7643f4ce7b46e7cfde7e9c31b~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=vh6S5AJ5Ur2qB4uZwWqiEjIqygI%3D)  

    这样就能成功安装pytesseract,安装PIL只需要在上面第三步里搜索PIL并点击安装即可  

    ![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/4d4a4c34df274fd6a0f68ebc545babc3~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=YpmGoTqu5KM0uU37GrrXNZ%2BeiL0%3D)



这时我们安转好了库,运行下面代码



from PIL import Image

import pytesseract

text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')

print(text)




会报下面错误,错误原因是:没有安装识别引擎tesseract-ocr



![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/5fb0c90b96f94ca79a63cf53e84a1c5c~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=Vx5pldd5HWkJ36HPORnYq6n9us8%3D)  

##二,安装识别引擎tesseract-ocr



*   1.下载下面的安装包,然后直接点击安装即可  

    [tesseract-ocr安装包和中文语言包]( )



解压安装tesseract-ocr后做如下操作,就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。  

![在这里插入图片描述](https://p6-xtjj-sign.byteimg.com/tos-cn-i-73owjymdk6/b7c82fbce7724060a3c9cd757735963c~tplv-73owjymdk6-jj-mark-v1:0:0:0:0:5o6Y6YeR5oqA5pyv56S-5Yy6IEAg55So5oi3NTc5MjMwMTY3MDI=:q75.awebp?rk3s=f64ab15b&x-expires=1771405072&x-signature=8lGfiU9ERmnCnB2DknVx8o1YJaA%3D)



*   2,安装完成tesseract-ocr后,我们还需要做一下配置  

    在C:\\Users\\huxiu\\AppData\\Local\\Programs\\Python\\Python35\\Lib\\site-packages\\pytesseract找到pytesseract.py打开后做如下操作



CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

#tesseract_cmd = 'tesseract'

tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

如果你也是看准了Python,想自学Python,在这里为大家准备了丰厚的免费学习大礼包,带大家一起学习,给大家剖析Python兼职、就业行情前景的这些事儿。

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

四、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

五、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

成为一个Python程序员专家或许需要花费数年时间,但是打下坚实的基础只要几周就可以,如果你按照我提供的学习路线以及资料有意识地去实践,你就有很大可能成功! 最后祝你好运!!!

了解详情:docs.qq.com/doc/DSnl3ZG…