PaddleOCR

1.拉取镜像启动容器

如果cpu版本的用docker run sudo docker run --name ppocr -v $PWD:/paddle --shm-size=64G -p 8866:8866 -it registry.baidubce.com/paddlepaddle/paddle:2.1.3-gpu-cuda10.2-cudnn7 /bin/bash 如果Gpu参与用 sudo nvidia-docker run --name ppocr -v $PWD:/paddle --shm-size=64G -p 8866:8866 -it registry.baidubce.com/paddlepaddle/paddle:2.1.3-gpu-cuda10.2-cudnn7 /bin/bash

2.启动容器

docker start ppocr

3.进入容器

docker container exec -it ppocr /bin/bash

4. Hub Serving安装

pip install paddlehub -i mirror.baidu.com/pypi/simple

或加源拉取

pip install paddlehub==2.1.0 --upgrade -i mirror.baidu.com/pypi/simple

拉取paddlepaddle pip install paddlepaddle --upgrade -i pypi.tuna.tsinghua.edu.cn/simple

下载时出现Running pip as the ‘root‘ user can result in broken permissions and conflicting 创建一个虚拟环境 python -m venv tutorial-env 进入虚拟环境 source tutorial-env/bin/activate 再次检查一下pip版本号，版本号变回低版本重新更新pip 及重拉paddlehub

pip install --upgrade pip -i mirrors.aliyun.com/pypi/simple… --trusted-host mirrors.aliyun.com

pip install paddlehub==2.1.0 --upgrade -i mirror.baidu.com/pypi/simple

4.1 安装PaddleOCR whl包

pip install paddleocr>=2.0.1

创建目录 clone源码下载对应tar包

mkdir -p /home/PaddleOCR

4.1.1 先clone代码

cd /home 切换回目录下

【推荐】 git clone https://github.com/PaddlePaddle/PaddleOCR

如果无法访问github 的小伙伴们也可以通过gitee仓库里面将源码下载下来：

git clone https://gitee.com/paddlepaddle/PaddleOCR

4.1.2 下载依赖

pip install -r requirements.txt -i https://pypi.douban.com/simple

4.1.3 下载需要tar包

cd /home/PaddleOCR/deploy/hubserving/ocr_system


下载并解压检测模型

wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar && tar -xf ch_PP-OCRv3_det_infer.tar && rm -rf ch_PP-OCRv3_det_infer.tar

 下载并解压识别模型
 
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar && tar -xf ch_PP-OCRv3_rec_infer.tar && rm -rf ch_PP-OCRv3_rec_infer.tar

下载并解压方向分类器
 
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar && tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar && rm -rf ch_ppocr_mobile_v2.0_cls_infer.tar

4.1.4 修改模型路径

vim params.py

4.2 单张图片识别测试

回到cd /home/paddleOCR目录下

图片测试

用官方自带的图片来测试识别，官方自带图片目录为

/home/PaddleOCR/doc/imgs

python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system/ch_PP-OCRv3_det_infer/" --rec_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system//ch_PP-OCRv3_rec_infer/" --cls_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls true --use_gpu false

4.3 PaddleHub Server 服务部署

在上面的基础上回到/home/PaddleOCR路径执行 hub install deploy/hubserving/ocr_system/

如果urllib3报ssl错误 pip install 'urllib3<2.0'

报错ImportError: cannot import name 'RNNCell' from 'paddle.fluid.layers' (/usr/local/tutorial-env/lib/python3.7/site-packages/paddle/fluid/layers/init.py)

paddle新版本没有fluid

降版本会出现其他一些问题

zhuanlan.zhihu.com/p/652867620…

修改配置文件

回到/home/PaddleOCR路径下执行

hub serving start -c deploy/hubserving/ocr_system/config.json

PaddleOCR CentOS安装部署 doceker版