ocr - WingDust的收藏集 - 掘金

ocr

更多收藏集

13篇文章 · 0订阅

🚀超越DeepSeek-OCR！OCR领域的革命性突破：Chandra OCR本地部署+真实测评！手写体、繁体字、数学公式、重叠文字全部完美识别，告别漏字漏页

这两年开源 OCR 模型真是井喷：DeepSeek-OCR、olmOCR、dots.ocr……名字越来越多，教程也越来越花。但很多朋友踩过的坑大同小异：一到长文档、多页 PDF、复杂排版（页眉页脚、多

win4r
5月前
616
点赞
评论

🚀超越DeepSeek-OCR！OCR领域的革命性突破：Chandra OCR本地部署+真实测评！手写体、繁体字、数学公式、重叠文字全部完美识别，告别漏字漏页

3B小模型吊打72B巨头！轻量级文档解析OCR，性能超Gemini，高效且精准！

在文档解析领域，传统方法要么依赖复杂多工具流水线，要么受限于大型多模态模型的低效性。近日，Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型：MonkeyOCR。它

开源星探
10月前
642
2
评论

256M参数多模态OCR神器，0.35秒解锁全文档奥秘！

当前主流OCR系统通常都需要1B+参数的大模型计算，近期刚好在抱抱脸上发现一款仅256M参数的轻量级全能型文档OCR模型工具。一个名为 SmolDocling 的 OCR 模型，轻量级、高速且支持完

开源星探
1年前
614
4
评论

OCR小白也能上手！Llama-OCR只需5行代码，轻松实现高质量识别！

最简单且高质量的OCR工具，它来了！一款基于 Llama 模型实现的开源OCR：Llama-OCR。对于经常需要将图片、收据或包含表格的 PDF 文档转换为可编辑的文本时候，这款工具就显得尤为重要

开源星探
1年前
1.3k
10
1

深入探索：AI 驱动的 PDF 布局检测引擎源代码解析 [译]

2023 年 12 月 10 日 • Shrijith Venkatramana 上周，PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器

宝玉的工程技术分享
2年前
1.8k
4
评论

Go调用C++动态库实现车牌识别

1. 前言很久没更新博客，这次正好趁着这次机会来更新一个稍微有点意思的内容，利用C++中Opencv、TensorRT等库编译出动态库供Go调用，再写个简单的api对上传的车辆图片进行车牌识别。究其

shelgi
2年前
4.3k
42
5

Go调用C++动态库实现车牌识别

《深入浅出OCR》第七章：文本识别后处理

本章将介绍常见的文字识别后处理方法，按照不同的目的将内容分为两部分：文本纠错和文本结构化。文本纠错的目标是纠正 OCR输出文本中错误的文字，而文本结构化则是从OCR输出文本中定位需要的信息，并按照应用

GoAI
2年前
3.2k
7
2

《深入浅出OCR》第七章：文本识别后处理

《深入浅出OCR》实战：基于PGNet的端到端识别

本篇为《深入浅出OCR》实战：基于PGNet的端到端识别，主要对端到端识别PGNet算法进行解读，配合PaddleOCR算法实现端到端算法实战。尽可能详细介绍代码及项目流程，如有错误请指正。

GoAI
2年前
3.7k
14
5

《深入浅出OCR》实战：基于PGNet的端到端识别

《深入浅出OCR》实战：基于CRNN的文字识别

上一篇作者着重介绍文字识别算法的发展、分类及各自领域经典算法，为了进一步熟悉文字识别流程，本次作者将以基于主流文字识别算法CRNN为例，全面对文字识别技术流程进行解读，方便学习者快速上手实战。

GoAI
2年前
1.8k
9
评论

《深入浅出OCR》实战：基于CRNN的文字识别

《深入浅出OCR》第四章：OCR文字识别

OCR（光学字符识别）是计算机视觉领域的重要应用之一。要对深度学习OCR文字识别方法进行介绍，本人将从经典算法结构、代码、论文解读等角度展开，配合作者总结的思维导图，深入浅出OCR知识。

GoAI
2年前
3.1k
11
3

《深入浅出OCR》第四章：OCR文字识别