PaddleOCR
1.拉取镜像启动容器
如果cpu版本的 用docker run sudo docker run --name ppocr -v $PWD:/paddle --shm-size=64G -p 8866:8866 -it registry.baidubce.com/paddlepaddle/paddle:2.1.3-gpu-cuda10.2-cudnn7 /bin/bash 如果Gpu参与用 sudo nvidia-docker run --name ppocr -v $PWD:/paddle --shm-size=64G -p 8866:8866 -it registry.baidubce.com/paddlepaddle/paddle:2.1.3-gpu-cuda10.2-cudnn7 /bin/bash
2.启动容器
docker start ppocr
3.进入容器
docker container exec -it ppocr /bin/bash
4. Hub Serving安装
pip install paddlehub -i mirror.baidu.com/pypi/simple
或加源拉取
pip install paddlehub==2.1.0 --upgrade -i mirror.baidu.com/pypi/simple
拉取paddlepaddle pip install paddlepaddle --upgrade -i pypi.tuna.tsinghua.edu.cn/simple
下载时出现Running pip as the ‘root‘ user can result in broken permissions and conflicting 创建一个虚拟环境 python -m venv tutorial-env 进入虚拟环境 source tutorial-env/bin/activate 再次检查一下pip版本号,版本号变回低版本重新更新pip 及重拉paddlehub
pip install --upgrade pip -i mirrors.aliyun.com/pypi/simple… --trusted-host mirrors.aliyun.com
pip install paddlehub==2.1.0 --upgrade -i mirror.baidu.com/pypi/simple
4.1 安装PaddleOCR whl包
pip install paddleocr>=2.0.1
创建目录 clone源码 下载对应tar包
mkdir -p /home/PaddleOCR
4.1.1 先clone代码
cd /home 切换回目录下
【推荐】
git clone https://github.com/PaddlePaddle/PaddleOCR
如果无法访问github 的小伙伴们也可以通过gitee仓库里面将源码下载下来:
git clone https://gitee.com/paddlepaddle/PaddleOCR
4.1.2 下载依赖
pip install -r requirements.txt -i https://pypi.douban.com/simple
4.1.3 下载需要tar包
cd /home/PaddleOCR/deploy/hubserving/ocr_system
下载并解压检测模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar && tar -xf ch_PP-OCRv3_det_infer.tar && rm -rf ch_PP-OCRv3_det_infer.tar
下载并解压识别模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar && tar -xf ch_PP-OCRv3_rec_infer.tar && rm -rf ch_PP-OCRv3_rec_infer.tar
下载并解压方向分类器
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar && tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar && rm -rf ch_ppocr_mobile_v2.0_cls_infer.tar
4.1.4 修改模型路径
vim params.py
4.2 单张图片识别测试
回到cd /home/paddleOCR目录下
图片测试
用官方自带的图片来测试识别,官方自带图片目录为
/home/PaddleOCR/doc/imgs
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system/ch_PP-OCRv3_det_infer/" --rec_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system//ch_PP-OCRv3_rec_infer/" --cls_model_dir="/home/PaddleOCR/deploy/hubserving/ocr_system/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls true --use_gpu false
4.3 PaddleHub Server 服务部署
在上面的基础上 回到/home/PaddleOCR路径执行
hub install deploy/hubserving/ocr_system/
如果urllib3报ssl错误 pip install 'urllib3<2.0'
报错ImportError: cannot import name 'RNNCell' from 'paddle.fluid.layers' (/usr/local/tutorial-env/lib/python3.7/site-packages/paddle/fluid/layers/init.py)
paddle新版本没有fluid
降版本会出现其他一些问题
修改配置文件
回到/home/PaddleOCR路径下执行
hub serving start -c deploy/hubserving/ocr_system/config.json