这是我参与2022首次更文挑战的第13天,活动详情查看:2022首次更文挑战
前言
Paddle ocr是百度开源的一个ocr框架,我们要借此机会搭建运行环境。
Mac安装
安装Anaconda
-
说明:使用paddlepaddle需要先安装python环境,这里我们选择python集成环境Anaconda工具包
- Anaconda是1个常用的python包管理程序
- 安装完Anaconda后,可以安装python环境,以及numpy等所需的工具包环境
-
Anaconda下载:
- 选择最下方的
Anaconda3-2021.05-MacOSX-x86_64.pkg下载
- 选择最下方的
-
下载完成后,双击.pkg文件进入图形界面
- 按默认设置即可,安装需要花费一段时间
-
建议安装vscode或pycharm等代码编辑器
打开终端并创建conda环境
-
打开终端
- 同时按下command键和空格键,在聚焦搜索中输入"终端",双击进入终端
-
将conda加入环境变量
-
加入环境变量是为了让系统能识别conda命令
-
输入以下命令,在终端中打开
~/.bash_profile:vim ~/.bash_profile -
在
~/.bash_profile中将conda添加为环境变量:# 先按i进入编辑模式 # 在第一行输入: export PATH="~/opt/anaconda3/bin:$PATH" # 若安装时自定义了安装位置,则将~/opt/anaconda3/bin改为自定义的安装目录下的bin文件夹# 修改后的~/.bash_profile文件应如下(其中xxx为用户名): export PATH="~/opt/anaconda3/bin:$PATH" # >>> conda initialize >>> # !! Contents within this block are managed by 'conda init' !! __conda_setup="$('/Users/xxx/opt/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)" if [ $? -eq 0 ]; then eval "$__conda_setup" else if [ -f "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh" ]; then . "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh" else export PATH="/Users/xxx/opt/anaconda3/bin:$PATH" fi fi unset __conda_setup # <<< conda initialize <<<- 修改完成后,先按
esc键退出编辑模式,再输入:wq!并回车,以保存退出
- 修改完成后,先按
-
验证是否能识别conda命令:
- 在终端中输入
source ~/.bash_profile以更新环境变量 - 再在终端输入
conda info --envs,若能显示当前有base环境,则conda已加入环境变量
- 在终端中输入
-
-
创建新的conda环境
# 在命令行输入以下命令,创建名为paddle_env的环境 # 此处为加速下载,使用清华源 conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/- 该命令会创建1个名为paddle_env、python版本为3.8的可执行环境,根据网络状态,需要花费一段时间
- 之后命令行中会输出提示信息,输入y并回车继续安装
-
激活刚创建的conda环境,在命令行中输入以下命令:
# 激活paddle_env环境 conda activate paddle_env # 查看当前python的位置 where python2. 安装PaddlePaddle
必须在虚拟环境下的python命令行进行执行,不然示例代码会无法运行成功的。
- 如果您的机器安装的是CUDA9或CUDA10,请运行以下命令安装
python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple- 如果您的机器是CPU,请运行以下命令安装, 需要在虚拟环境的python命令行下
./python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
3安装PadddleOCR
pip install "paddleocr>=2.0.1"
运行示例代码
在IDE上运行我们的示例代码。
from paddleocr import PaddleOCR, draw_ocr
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = '/Volumes/JackPanOther/lczy-documents/test/20220210173302.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
# 显示结果
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='/Users/jackpan/JackPanDocuments/paddle-ocr/PaddleOCR/doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('/Volumes/JackPanOther/lczy-documents/test/result.jpg')
可以在文件夹中看到我们识别的结果图片文件在路径/Volumes/JackPanOther/lczy-documents/test/result.jpg下