首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
墨理学AI
掘友等级
算法工程师
|
感谢点赞支持
专注于AI领域前沿技术学习与分享:熟悉图像修复、超分重建、目标检测、模型部署等计算机视觉领域相关知识,热衷于为所有漫步于AI之路的小伙伴贡献自己一份微薄之力;
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
738
文章 730
沸点 8
赞
738
返回
|
搜索文章
赞
文章( 730 )
沸点( 8 )
LayoutLMv2:多模态预训练用于富含视觉元素的文档理解【论文翻译】
LayoutLMv2提出了空间感知的自注意机制,其中包括用于标记对的2-D相对位置表示。与LayoutLM用于模拟页面布局的绝对2-D位置嵌入不同,相对位置嵌入明确地提供了更广泛的上下文空间建模
《深入浅出OCR》实战:基于CRNN的文字识别
上一篇作者着重介绍文字识别算法的发展、分类及各自领域经典算法,为了进一步熟悉文字识别流程,本次作者将以基于主流文字识别算法CRNN为例,全面对文字识别技术流程进行解读,方便学习者快速上手实战。
《深入浅出OCR》第五章:OCR端到端识别
上一章我们介绍到OCR流程包括两阶段算法和端到端算法,本篇为 主要对深度学习端到端识别方法进行介绍,端到端算法具有模型小、速度快的特点,本人将从经典端到端识别算法结构、代码、论文解读等角度展开介绍。
《深入浅出OCR》实战:基于PGNet的端到端识别
本篇为《深入浅出OCR》实战:基于PGNet的端到端识别,主要对端到端识别PGNet算法进行解读,配合PaddleOCR算法实现端到端算法实战。尽可能详细介绍代码及项目流程,如有错误请指正。
《深入浅出OCR》第六章:OCR数据集与评价指标
本篇为《深入浅出OCR》第六章:OCR数据集与评价指标,主要介绍OCR数据集(规则与不规则、合成数据集)、数据生成、OCR数据评估指标等知识进行介绍,方便小白或AI爱好者快速了解OCR方向知识.
《深入浅出OCR》第七章:文本识别后处理
本章将介绍常见的文字识别后处理方法,按照不同的目的将内容分为两部分:文本纠错和文本结构化。文本纠错的目标是纠正 OCR输出文本中错误的文字,而文本结构化则是从OCR输出文本中定位需要的信息,并按照应用
《深入浅出OCR》前言知识(一):机器学习知识总结
本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程,具体章节如导图所示,将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开,本篇前言知识主要介绍机器学习基础。
LayoutLM【论文翻译】
Document AI,或称为文档智能,是一个相对较新的研究领域,涉及到自动读取、理解和分析商业文档的技术。我们如何在LayoutLM框架中扩展以共同建模文本和布局信息。
2023年,你才开始学习大数据么?
简单介绍下目前大数据的一些基本的知识,部分图是网络上的截图,主要是为了大家容易理解。 大数据的发展历程 两个很重要的概念 流处理 流处理的处理流程是:源源不断的实时数据 --> 持续不断的处理
OCR数据集 : Benchmarking Chinese Text Recognition: Datasets 【论文翻译】
文本识别在过去的十年中取得了快速的进展。根据主要特点,文本识别方法可以分为几个类别,包括基于CTC的方法、基于矫正的方法等。从这些类别中,我们选择了八种代表性的方法作为基线,这些方法大多用于文本识别
下一页
个人成就
文章被点赞
1,005
文章被阅读
127,249
掘力值
4,024
关注了
14
关注者
111
收藏集
1
关注标签
3
加入于
2021-06-22