一、概述
二、数据集准备
1.现成的一些数据集
纯文本的数据集link:pan.baidu.com/s/1JgS1gSRc… password:wigu
YCG09的项目中使用的数据集url:pan.baidu.com/s/1QkI7kjah… (passwd:lu7m)
2.自己生成数据集
三、一些常见的算法
四、一些开源项目
-
- 基于darknet实现目标检测,提供识别点选验证码的实例和训练自己数据的API github.com/nickliqian/…
-
- SynText生成自然场景中的带文本图片 github.com/ankush-me/S…
中文字符版本 github.com/JarveeLee/S…
- SynText生成自然场景中的带文本图片 github.com/ankush-me/S…
-
- tesseract Google开源的一个OCR框架 code.google.com/p/tesseract…
-
- 文本生成图片(无标注信息,使用很简单) github.com/Belval/Text…
-
- 对比一些主流的OCR算法 github.com/senlinuc/ca…
-
- 中文OCR,应该比较容易跑起来 github.com/YCG09/chine…
-