首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ocr
订阅
WingDust
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
256M参数多模态OCR神器,0.35秒解锁全文档奥秘!
当前主流OCR系统通常都需要1B+参数的大模型计算,近期刚好在抱抱脸上发现一款仅256M参数的轻量级全能型文档OCR模型工具。 一个名为 SmolDocling 的 OCR 模型,轻量级、高速且支持完
OCR小白也能上手!Llama-OCR只需5行代码,轻松实现高质量识别!
最简单且高质量的OCR工具,它来了! 一款基于 Llama 模型实现的开源OCR:Llama-OCR。 对于经常需要将图片、收据或包含表格的 PDF 文档转换为可编辑的文本时候,这款工具就显得尤为重要
深入探索:AI 驱动的 PDF 布局检测引擎源代码解析 [译]
2023 年 12 月 10 日 • Shrijith Venkatramana 上周,PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器
Go调用C++动态库实现车牌识别
1. 前言 很久没更新博客,这次正好趁着这次机会来更新一个稍微有点意思的内容,利用C++中Opencv、TensorRT等库编译出动态库供Go调用,再写个简单的api对上传的车辆图片进行车牌识别。究其
《深入浅出OCR》第七章:文本识别后处理
本章将介绍常见的文字识别后处理方法,按照不同的目的将内容分为两部分:文本纠错和文本结构化。文本纠错的目标是纠正 OCR输出文本中错误的文字,而文本结构化则是从OCR输出文本中定位需要的信息,并按照应用
《深入浅出OCR》实战:基于PGNet的端到端识别
本篇为《深入浅出OCR》实战:基于PGNet的端到端识别,主要对端到端识别PGNet算法进行解读,配合PaddleOCR算法实现端到端算法实战。尽可能详细介绍代码及项目流程,如有错误请指正。
《深入浅出OCR》实战:基于CRNN的文字识别
上一篇作者着重介绍文字识别算法的发展、分类及各自领域经典算法,为了进一步熟悉文字识别流程,本次作者将以基于主流文字识别算法CRNN为例,全面对文字识别技术流程进行解读,方便学习者快速上手实战。
《深入浅出OCR》第四章:OCR文字识别
OCR(光学字符识别)是计算机视觉领域的重要应用之一。要对深度学习OCR文字识别方法进行介绍,本人将从经典算法结构、代码、论文解读等角度展开,配合作者总结的思维导图,深入浅出OCR知识。
《深入浅出OCR》第二章:OCR技术发展与分类
本篇为《深入浅出OCR》第二章:OCR技术发展与分类。本篇主要介绍传统OCR和深度学习OCR方法,从图像处理特征提取、文字检测与识别等角度展开详细介绍,配合作者总结思维导图,尽可能总结OCR全面知识。
AI辅助瞄准系统开发与实战(一)
前言 直接看效果,狗头: 之所以搞这个的话,当然主要一方面是因为确实有点意思在里面,此外在很久以前,也有很多的UP做过这样的玩意。当然更重要的是,这玩意在某宝上面竟然敢卖1.6K,这谁受得了。于是花了