RapidOCR (捷智OCR- 信创级开源OCR - 为世界内容安全贡献力量)
简体中文 | English
目录
商业支持
- 提供信创平台多架构,包括Arm/X86/mips(龙芯)/RISC-V等信创CPU支持,同时兼容ONNXRuntime/OpenVINO/NCNN。
- 有意者邮件联系: znsoft@163.com, 请先邮件咨询服务项目,即时回复联系方式。
简介
- 💖目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
- 中文广告: 欢迎加入我们的QQ群下载模型及测试程序,QQ群号:887298230(已满),2群(755960114)
- 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用
Python/C++/Java/Swift/C#
将它移植到各个平台。 - 名称来源: 轻快好省并智能。基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。
- 使用:
- 如果仓库下已有模型满足要求 → RapidOCR部署使用即可。
- 不满足要求 → 基于PaddleOCR在自己数据上微调 → RapidOCR部署。
- 如果该仓库有帮助到你,还请点个小星星⭐呗!
文档导航
- Python范例
- C++范例(Windows/Linux/macOS)
- Jvm范例(Java/Kotlin)
- .Net范例(C#)
- Android范例
- 网页版范例
- 版面结构化
- 衍生项目
- 垂直项目
- RapidVideOCR:基于RapidOCR,提取视频中的硬字幕
- LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
- 文档图像矫正-PaperEdge | Demo
- 图像文字擦除-CTRNet | Demo
- 模型相关
- 常见问题 FAQ
近期更新(more)
🎮2023-03-11 v1.2.2 update:
- 修复实例化python中RapidOCR类传入参数错误
🧢2023-03-07 v1.2.1 update:
- 优化python下rapidocr系列包的接口传入参数,支持实例化类时,动态给定各个参数,更加灵活。
- 如果不指定,则用
config.yaml
下的默认参数。 - 具体可参见:传入参数
⛸2023-02-16 update:
- 优化ocrweb部分代码,可直接pip安装,快速使用,详情参见README。
- 优化python中各个部分的推理代码,更加紧凑,同时易于维护。
在线demo
- 自建在线demo
- 说明: 本在线demo不存储小伙伴们上传测试的任何图像数据,详情参见:ocrweb/README
- demo所用模型组合(最优组合)为:
ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
- 运行机器配置:
4核 AMD EPYC 7K62 48-Core Processor
- 示例图:
- Hugging Face Demo
- 该demo依托于Hugging Face的Spaces构建,采用Gradio库生成,同时添加三个超参数:
box_thresh
: 检测到的框是文本的概率,值越大,框中是文本的概率就越大unclip_ratio
: 控制检测到文本框的大小,值越大,检测框整体越大text_score
: 文本识别结果是正确的置信度,值越大,显示出的识别结果更准确
- 示例图:
- 该demo依托于Hugging Face的Spaces构建,采用Gradio库生成,同时添加三个超参数:
TODO
- iOS范例: 等待有缘人贡献代码
- 依据python版本重写C++推理代码,以提升推理效果,并增加对gif/tga/webp 格式图片的支持