首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
年轻人起来冲
掘友等级
算法工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
PRTR:Pose Recognition with Cascade Transformers
PRTR 是针对2D Pose Estimation 提出了基于 cascade transformer 结构的人体姿态估计网络,该网络首先使用 CNN 提取特征,然后使用 transformer 学
SETR:Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective wi
一直以来,分割都是在 FCN 的基础上搭建 Encoder-Decoder 进行的,基于 CNN 的缺点,虽然有设计方法取增大感受野、引入注意力机制,但还是没有背离这个规则
SOTR:Segmenting Objects with Transformers
SOTR 利用 transformer 将实例分割任务简化为 2 个过程,一是通过 transformer 预测每个实例的类别,二是通过多级上采样模块动态生成分割掩码 什么是 SOTR? SOTR 利
CRNN: An End-to-End Trainable Neural Network for Image-based Sequence Recognitio
传统的文本识别方法需要先对单个文字进行切割,然后再对单个文字进行识别。CRNN直接从整张图出发,将图片特征输入RNN进行序列学习,最后通过CTC计算损失 什么是 CRNN ? CNN 提取特征:使用轻
Swin Transformer:Hierarchical Vision Transformer using Shifted Windows
为解决原始transformer在全局上构建注意力的成本巨大问题,Swin Transformer引入WIndows的概念,在每个Windows内构建全局注意力,使得成本由平方变为线性。同时借鉴CNN
Segment Anything
SAM通过transformer将点、框、Mask、文本等prompt和图片进行编码学习,可以实现对图片任意目标的分割 什么是 SAM ? a)SAM 利用“图片-分割提示”实现对图片上任意目标的分割
DETR:End-to-End Object Detection with Transformers
将 transformers 运用到了 object detection 领域,取代了现在的模型需要手工设计的工作(非极大值抑制和 anchor generation),并且取得了不错的结果。在 ob
FOTS:Fast Oriented Text Spotting with a Unified Network
第一个端到端解决文本识别的模型,相比较两阶段的文本定位方法,它的检测速度更快,基本思路是通过文本检测分支实现文本行区域的提取,然后通过 RoIRotate 模块实现文本行的“摆正”,最后使用 CRNN
SAST:A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Mu
属于EAST的演进版本,还是类似 anchor-free 的方式预测文本行,除了输出 grid 的 score +边框预测外,还输出更多的文本实例信息,比如 grid 到实例矩形四角、中心点、四边的距
文本检测之DB和DB++
本文介绍两个文本检测模型: DB 及它的升级版本 DB++,主要的原理就是将“二值化”的过程做成网络可学习、可微分的一个模块,然后向网络中插入这个模块自适应去学习二值化阈值,最终预测文字区域的一个核心
下一页
个人成就
文章被点赞
2
文章被阅读
4,904
掘力值
74
关注了
0
关注者
0
收藏集
0
关注标签
13
加入于
2023-05-20