RapidOCR-完全开源免费并支持离线部署的多平台多语言OCR SDK

2021-04-05 7,515 阅读3分钟

RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)

简体中文 | English

目录

RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)

商业支持

提供信创平台多架构，包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持，同时兼容ONNXRuntime/OpenVINO/NCNN。
有意者邮件联系: znsoft@163.com, 请先邮件咨询服务项目，即时回复联系方式。

简介

💖目前已知运行速度最快、支持最广，完全开源免费并支持离线快速部署的多平台多语言OCR。
中文广告：欢迎加入我们的QQ群下载模型及测试程序，QQ群号：887298230(已满)，2群(755960114)
缘起：百度paddlepaddle工程化不是太好，为了方便大家在各种端上进行ocr推理，我们将它转换为onnx格式，使用Python/C++/Java/Swift/C# 将它移植到各个平台。
名称来源：轻快好省并智能。基于深度学习技术的OCR技术，主打人工智能优势及小模型，以速度为使命，效果为主导。
使用：
- 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
- 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
如果该仓库有帮助到你，还请点个小星星⭐呗！

文档导航

Python范例
- rapidocr_openvino
C++范例(Windows/Linux/macOS)
- RapidOcrOnnx
- RapidOcrNcnn
Jvm范例(Java/Kotlin)
- RapidOcrOnnxJvm
- RapidOcrNcnnJvm
.Net范例(C#)
Android范例
网页版范例
- 网页版OCR
- 多语言网页版OCR
版面结构化
衍生项目
- RapidOCR HTTP服务/win32程序/易语言编写
垂直项目
- RapidVideOCR：基于RapidOCR，提取视频中的硬字幕
- LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
- 文档图像矫正-PaperEdge | Demo
- 图像文字擦除-CTRNet | Demo
模型相关
- 模型转换
- 模型下载及效果对比
常见问题 FAQ

近期更新(more)

🎮2023-03-11 v1.2.2 update:

修复实例化python中RapidOCR类传入参数错误

🧢2023-03-07 v1.2.1 update:

优化python下rapidocr系列包的接口传入参数，支持实例化类时，动态给定各个参数，更加灵活。
如果不指定，则用config.yaml下的默认参数。
具体可参见：传入参数

⛸2023-02-16 update:

优化ocrweb部分代码，可直接pip安装，快速使用，详情参见README。
优化python中各个部分的推理代码，更加紧凑，同时易于维护。

在线demo

自建在线demo
- 说明: 本在线demo不存储小伙伴们上传测试的任何图像数据，详情参见：ocrweb/README
- demo所用模型组合（最优组合）为:
```
ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
```
- 运行机器配置: 4核 AMD EPYC 7K62 48-Core Processor
- 示例图:
Hugging Face Demo
- 该demo依托于Hugging Face的Spaces构建，采用Gradio库生成，同时添加三个超参数:
  - box_thresh: 检测到的框是文本的概率，值越大，框中是文本的概率就越大
  - unclip_ratio: 控制检测到文本框的大小，值越大，检测框整体越大
  - text_score: 文本识别结果是正确的置信度，值越大，显示出的识别结果更准确
- 示例图：

TODO

iOS范例: 等待有缘人贡献代码
依据python版本重写C++推理代码，以提升推理效果，并增加对gif/tga/webp 格式图片的支持

原始发起者及初创作者