首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CV技术指南
CV技术指南
创建于2021-05-30
订阅专栏
本专栏文章来源于公众号CV技术指南
等 6 人订阅
共114篇文章
创建于2021-05-30
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
文字识别OCR开源框架的对比--Tesseract vs EasyOCR
前言: OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的。对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对我
CVPR2021 | 华为诺亚实验室提出Transformer in Transformer
前言: transformer用于图像方面的应用逐渐多了起来,其主要做法是将图像进行分块,形成块序列,简单地将块直接丢进transformer中。然而这样的做法忽略了块之间的内在结构信息,为此,这
CVPR2021| TimeSformer-视频理解的时空注意模型
前言: transformer在视频理解方向的应用主要有如下几种实现方式:Joint Space-Time Attention,Sparse Local Global Attention 和Axi
知识蒸馏的简要概述
前言: 知识蒸馏是一种在繁琐的模型中提炼知识并将其压缩为单个模型的方法,以便可以将其部署到实际应用中。AI的教父Geoffrey Hinton和他在Google的两个同事Oriol Vinyals和
经典论文系列 | 重新思考在ImageNet上的预训练
这是一篇19年何凯明发的论文,论文基于目标检测、实例分割和人体关键点检测三个方向进行了多项实验,比较了从零使用随机初始化开始训练与使用预训练进行fine-tuning的效果,并得出了一些结论
CVPR2021| TimeSformer-视频理解的时空注意模型
前言: transformer在视频理解方向的应用主要有如下几种实现方式:Joint Space-Time Attention,Sparse Local Global Attention 和Axi
经典论文系列 | Group Normalization & BN的缺陷
本文是何凯明在18年发表的论文,论文提出了BN中存在的问题,即模型性能受到Batch Size的影响,当batch size比较小时,模型性能退化严重,且BN的存在使得在受到内存限制的应用
CVPR2021|一个高效的金字塔切分注意力模块PSA
前面分享了一篇《继SE,CBAM后的一种新的注意力机制Coordinate Attention》,其出发点在于SE只引入了通道注意力,CBAM的空间注意力只考虑了局部区域的信息,从而提出考虑
损失函数技术总结
本文对损失函数的类别和应用场景,常见的损失函数,常见损失函数的表达式,特性,应用场景和使用示例作了详细的总结。 主要涉及到L1 loss、L2 loss、Negative Log-Likelihoo
计算机视觉专业术语/名词总结(一)构建知识体系
前言: 在计算机视觉中存在很多的专业术语,如先验知识,语义信息,embedding,head,neck等。这些术语的解释无法直接在网上搜到,也没有在哪一篇论文中定义它们的概念和意义,因此,对于第一次
欠拟合与过拟合技术总结
在本文,将介绍欠拟合与过拟合的概念、特点、产生的原因、解决的方法。在认真阅读本文后,读者将会对欠拟合与过拟合有个全面的认识。
计算机视觉中的小样本学习综述
本文对计算机视觉中的小样本学习( Few-Show Learning )做了一个全面的综述,介绍了小样本学习的概念,变体,小样本学习方法,元学习算法,小样本图像分类算法,小样本目标检测。
CV方向的高效阅读英文文献方法总结
知乎上很多阅读英文文献方法的回答,总体而言都比较泛,很多回答基本都在介绍如何搜索文献,如何判断文献是否值得一读,用什么翻译软件等。 其实这些对CV这个方向来说,基本属于“无用良品”,因为CV领
计算机视觉资源合集
把公众号的资源整理了以下,在公众号CV技术指南中可免费获取以下内容。1.CV技术总结系列的所有文章合集--《CV技术指南》。2.计算机视觉入门资料合集
论文创新的常见思路总结
目前主流方向的模型基本都做到了很高的精度,你能想到的方法,基本上前人都做过了,并且还做得很好,因此越往后论文越来越难发,创新点越来越难找。 那如何寻找自己的创新点呢?如何在前人的基础上改进呢?