首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
CVHub
创建于2023-03-05
订阅专栏
专注计算机视觉领域,提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案!
等 64 人订阅
共252篇文章
创建于2023-03-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
CVHub | 英伟达 CVPR 2023 新作 VoxFromer: 单目3D语义场景补全新SOTA!
在本文中,作者提出了VoxFormer,一个强大的三维语义场景补全(SSC)框架。VoxFormer优于最先进的基于相机的方法,甚至与基于激光雷达的方法相当。
CVHub | CVPR 2022 ESRT: 集轻量高效于一体的单图超分网络
本文结合 Transformer 和 CNN 建模长、短距离依赖的优势,提出了一种新颖的用于单图超分的高效超分网络——ESRT。
CVHub | CVPR 2023 iTPNs: 谁说 Linear probing 不适用 MIM 任务?
本文提出了一个用于预训练 HiViT 的完整框架,其核心贡献在于利用特征金字塔统一重建和识别任务,从而最大限度地减少预训练和微调任务之间的迁移差距。
CVHub | 即插即用! 国防科大联合慕尼黑工业大学提出新型解耦头 TSCODE: 助力目标检测器轻松涨点!
本文深入的探讨了目标检测任务中分类和定位分支之间的"冲突"原因,并提出了一种新颖的特定于任务的上下文解耦头机制来极大的缓解这种现象。
CVHub | 一文带你入门步态识别
今天为大家介绍的OpenGait便是一套基于Pytorch构建的步态识别(Gait Recognition)框架,其涵盖了一系列最先进的步态识别算法,同时提供了一个结构简单但强大的基线模型。
CVHub | 万字长文带你入门半监督语义分割
图像分割是最古老、研究最广泛的计算机视觉问题之一。图像分割是指将图像划分为不同的非重叠区域,并将相应的标签分配给图像中的每个像素,最终获得ROI区域位置及其类别信息。
CVHub | 一文看尽深度学习中的现代目标检测器
目标检测是指在图像或视频中分类和定位物体的任务。由于其广泛的应用,最近几年目标检测受到了越来越多的关注。本文概述了基于深度学习的目标检测器的最新发展,通过图表的形式直观地在多个经典指标上比较这些架构。
CVHub | 一文看尽深度学习中的各种数据增强
随着深度学习在计算机视觉的广泛应用,以卷积神经网络为代表的深度学习模型取得了突破性的进展。然而直至今日,尽管提出了以 ViT 为代表的新一代视觉网络架构,但数据稀缺仍然是构建深度学习模型最常见的挑战。
CVHub | 一文看尽深度学习中的各种池化方法
池化层大大降低了网络模型参数和计算成本,也在一定程度上降低了网络过拟合的风险。本文将为大家盘点深度学习史上各种经典的池化方法!
CVHub | 一文看尽深度学习中的各种损失函数
损失函数是用于衡量模型所作出的预测离真实值之间的偏离程度。今天 CVHub 将为大家盘点深度学习史上经典的损失函数,包含分类和回归。
CVHub | 一文看尽深度学习中的20种卷积
卷积神经网络中最重要的组件之一。不同的卷积结构有着不一样的功能,但本质上都是用于提取特征。本文将为大家盘点深度学习史上值得一学的20篇卷积相关的论文!
CVHub | 万字长文带你入门目标检测
目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文旨在为大家构建一个全面的知识框架!
CVHub | 万字长文带你入门Transformer
本文为大家介绍近期Transformer的一些定义、方法及相关工作,中间也会穿插一些笔者的见解。最后,本文也将列出一些可探索的未来研究方向,希望能给予读者一些启发。
CVHub | 一文看尽深度学习中的各种注意力机制
视觉注意力机制是人类视觉所特有的一种大脑信号处理机制,该机制可以帮助人类在有限的资源下,从大量无关背景区域中筛选出具有重要价值信息的目标区域,帮助人类更加高效的处理视觉信息。
CVHub | 万字长文带你入门语义分割
本文将围绕语义分割这一核心表达一些个人的观点与看法,鄙人自知资质平庸,文中难免会出现观点错漏现象,恳请大家批评指导。
CVHub | 万字长文带你入门增量学习
增量学习的目标是在动态和开放的环境中,使模型能够在保留已有知识的基础上,不断学习新的类别知识。通过对本文的阅读理解,相信大家已经对增量学习有了一定的认识。