Paddle OCR环境安装步骤说明

1,019 阅读2分钟

这是我参与2022首次更文挑战的第13天,活动详情查看:2022首次更文挑战

前言

Paddle ocr是百度开源的一个ocr框架,我们要借此机会搭建运行环境。

Mac安装

安装Anaconda

  • 说明:使用paddlepaddle需要先安装python环境,这里我们选择python集成环境Anaconda工具包

    • Anaconda是1个常用的python包管理程序
    • 安装完Anaconda后,可以安装python环境,以及numpy等所需的工具包环境
  • Anaconda下载:

    • 选择最下方的Anaconda3-2021.05-MacOSX-x86_64.pkg下载
  • 下载完成后,双击.pkg文件进入图形界面

    • 按默认设置即可,安装需要花费一段时间
  • 建议安装vscode或pycharm等代码编辑器

打开终端并创建conda环境

  • 打开终端

    • 同时按下command键和空格键,在聚焦搜索中输入"终端",双击进入终端
  • 将conda加入环境变量

    • 加入环境变量是为了让系统能识别conda命令

    • 输入以下命令,在终端中打开~/.bash_profile

      vim ~/.bash_profile
      
    • ~/.bash_profile中将conda添加为环境变量:

      # 先按i进入编辑模式
      # 在第一行输入:
      export PATH="~/opt/anaconda3/bin:$PATH"
      # 若安装时自定义了安装位置,则将~/opt/anaconda3/bin改为自定义的安装目录下的bin文件夹
      
      # 修改后的~/.bash_profile文件应如下(其中xxx为用户名):
      export PATH="~/opt/anaconda3/bin:$PATH"
      # >>> conda initialize >>>
      # !! Contents within this block are managed by 'conda init' !!
      __conda_setup="$('/Users/xxx/opt/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
      if [ $? -eq 0 ]; then
              eval "$__conda_setup"
      else
              if [ -f "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh" ]; then
                      . "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh"
              else
                      export PATH="/Users/xxx/opt/anaconda3/bin:$PATH"
              fi
      fi
      unset __conda_setup
      # <<< conda initialize <<<
      
      • 修改完成后,先按esc键退出编辑模式,再输入:wq!并回车,以保存退出
    • 验证是否能识别conda命令:

      • 在终端中输入source ~/.bash_profile以更新环境变量
      • 再在终端输入conda info --envs,若能显示当前有base环境,则conda已加入环境变量
  • 创建新的conda环境

    # 在命令行输入以下命令,创建名为paddle_env的环境
    # 此处为加速下载,使用清华源
    conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    
    • 该命令会创建1个名为paddle_env、python版本为3.8的可执行环境,根据网络状态,需要花费一段时间
    • 之后命令行中会输出提示信息,输入y并回车继续安装
  • 激活刚创建的conda环境,在命令行中输入以下命令:

    # 激活paddle_env环境
    conda activate paddle_env
    # 查看当前python的位置
    where python
    

    2. 安装PaddlePaddle

    必须在虚拟环境下的python命令行进行执行,不然示例代码会无法运行成功的。

    • 如果您的机器安装的是CUDA9或CUDA10,请运行以下命令安装
    python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
    
    • 如果您的机器是CPU,请运行以下命令安装, 需要在虚拟环境的python命令行下
    ./python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
    

3安装PadddleOCR

pip install "paddleocr>=2.0.1"

运行示例代码

在IDE上运行我们的示例代码。

from paddleocr import PaddleOCR, draw_ocr
​
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = '/Volumes/JackPanOther/lczy-documents/test/20220210173302.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
    print(line)
​
# 显示结果
from PIL import Image
​
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='/Users/jackpan/JackPanDocuments/paddle-ocr/PaddleOCR/doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('/Volumes/JackPanOther/lczy-documents/test/result.jpg')

可以在文件夹中看到我们识别的结果图片文件在路径/Volumes/JackPanOther/lczy-documents/test/result.jpg