随着人工智能发展,OCR可以说是应用最多的技术之一。不管是身份证信息录入、车牌识别、快递单识别、还是拍照翻译都离不开它。
OCR,即Optical Character Recognition,光学字符识别,是指利用如扫描仪、数码相机等电子设备检查纸上打印的字符,并确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
近日,Github上开源了一个超轻量级中文OCR 项目**:** chineseocr_lite ,目前已获星 3000+。
chineseocr_lite 基于 chineseocr 与 psenet 实现了中文自然场景文字检测及识别,它支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。此外,该项目支持linux/macos/windows 平台。
项目地址:
支持的功能
- 提供轻量的 backone 检测模型
-
- psenet(8.5M)
- crnn_lstm_lite (9.5M)
- 行文本方向分类网络(1.5M)
- 任意方向文字检测,识别时判断行文本方向
- crnn\crnn_lite lstm\dense 识别
- 支持竖排文本识别
- ncnn 实现 (支持lstm) nihui大佬实现的crnn_lstm推理
- 提供竖排文字样例以及字体库(旋转90度的字体)
- psenet ncnn核扩展实现,有效解决粘连文本检测问题
竖排字体样式
****生成的竖排文本样例
****识别效果展示
****ncnn 检测识别展示
—完—
往期精彩回顾
适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(pdf更新到25集)本站qq群1003271085,加入微信群请回复“加群”获取一折本站知识星球优惠券,请回复“知识星球”喜欢文章,点个在看