首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
CVHub
创建于2023-03-05
订阅专栏
专注计算机视觉领域,提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案!
等 64 人订阅
共252篇文章
创建于2023-03-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
KAUST & Meta AI 新作 | ZeroSeg: 无需语义标签和文本信息,开放词汇语义分割一把梭哈!
通过 ZeroSeg 证明了可以通过从预训练的通用视觉-语言模型中传递知识来有效地训练语义分割模型,同时希望这将为如何利用最近的基础模型研究成果来帮助像语义分割这样的像素级下游任务开辟一条新的途径。
ICCV 2023 | Pixel-based MIM: 简单高效的多级特征融合自监督方法
在这项研究中,研究人员系统地探索了等向性架构(如Vision Transformer)中多层特征融合在遮挡图像建模中的应用。
中科院一区顶刊 | BACL: 解决长尾目标检测的统一框架,显著提升 16.1 AP!
今天为大家介绍了BACL,一个针对长尾目标检测任务的统一框架。通过采用分而治之的策略,BACL 引入了 FCBL 来减轻前景类别间的不平等竞争,以及 FHM 来增强尾部类别的多样性。
ICCV 2023 | FocalFormer3D: 解决假阴性问题,提升自动驾驶3D目标检测召回率
本工作明确关注自动驾驶中的一个致命问题,即假阴性检测。为此,作者提出了FocalFormer3D作为解决方案。
万字长文带你全面解读视觉大模型
今天,我们主要围绕Foundational Models,即基础模型这个概念,向大家全面阐述一个崭新的视觉系统。
1.3ms 延迟 | 清华 ICCV 2023 最新开源移动端网络架构 RepViT,速度贼溜!
本文通过引入轻量级 ViT 的架构选择,重新审视了轻量级 CNNs 的高效设计。这导致了 RepViT 的出现,这是一种新的轻量级 CNNs 家族,专为资源受限的移动设备设计。
热烈祝贺新加坡南洋理工大学 MMLab 团队共计20篇论文被 ICCV 2023 收录!
如果您也有好的工作想分享给更多的小伙伴,欢迎随时联系 cv_huber,我们将提供一切力所能及的帮助!
ICCV 2023 | 超越 NanoDet, 腾讯联合比特币矿机制造商MicroBT发表 68.77k 的超轻量目标检测器!
本文提出了一个新颖的实例边界增强模块(IBE)和递归热重启训练策略(RecWR),以克服极度轻量级检测器的优化问题。
仅 50KB!| 上海交大 MICCAI2023 最新提出超强 U-Net 变体,参数和计算量分别暴降 494 和 160 倍
本文主要提出了两个新颖的模块,GHPA 和 GAB,这两个模块大大降低了模型的复杂性,并且提高了模型的性能。
即插即用系列 | PromptIR:MBZUAI提出一种基于Prompt的全能图像恢复网络
现有的基于深度神经网络的图像恢复模型通常只适用于特定的退化类型, 并且在其它退化类型上泛化能力有限。
港科&微软 | Semantic-SAM:多粒度的语义通用分割模型
本文介绍了Semantic-SAM,它可以以任何所需的粒度对任何物体进行分割和识别。除了进行通用的开放词汇的分割,Semantic-SAM展示了语义感知和丰富的粒度的优势。
DragGAN 升级版 | 中科大联合上海 AI Lab 发布 FreeDrag: 无需点跟踪即可稳定拖动语义内容!
近日,在AIGC的广阔世界里出现了一个火热的图像编辑方法—即通过在给定图像上通过把语义内容从原位置(handle point)拖动到目标位置(target point)的方式进行精细的定制化编辑操作。
北航新作 | Q-YOLO: 基于 TensorRT 和 OpenVIVO 的目标检测量化实战方案
本文介绍了Q-YOLO,一种高效的一阶段目标检测器,采用低比特量化方法解决传统量化 YOLO 模型中激活分布不平衡引起的性能下降问题。
冠绝榜单 | 百度联合上海AI实验室提出 CityTrack: 刷新多目标跟踪纪录!
本文提出了一种针对城市规模的多摄像头多目标跟踪任务的新颖方法。所提出的方法包括车辆检测、ReID特征提取、单摄像头多目标跟踪和跨摄像头关联等关键组件,共同实现多摄像头多目标跟踪的结果
OVO: Open-Vocabulary Occupancy
语义占据地图预测旨在推断自动驾驶载体在三维环境中安全操作所需的密集几何和语义信息。现有的占据预测方法几乎完全依赖于人工标注的体素数据进行训练。
即插即用系列!| MedAugment: 用于图像分类和分割的自动数据增强插件(附Pytorch源码)
今天主要向大家介绍一种名为 MedAugment 的自动数据增强方法,旨在将自动数据增强技术引入医学图像分析领域。该方法通过将增强空间划分为两种:像素增强空间 空间增强空间。
华为诺亚实验室最新研究进展 | AIGC时代的ImageNet,百万生成图片助力AI生成图片检测器研发
在这个 AIGC 爆发的时代,人人都可以利用AI算法生成高质量的文本,图像,音频内容。其中,由Midjourney, Stable Diffusion等图像生成方法制作的图像,其逼真程度让人赞叹!
ICRA2023 | 通用、自动和无标定目标的Lidar-Camera外参标定工具箱
本文介绍了一个开源的LiDAR-相机标定工具箱,适用于各种LiDAR和相机投影模型,只需要一组LiDAR和相机数据,无需标定目标,并且完全自动化。
SuperGlue作者重磅新作! | LightGlue:又快又准的特征匹配方法
本文介绍了LightGlue,这是基于深度学习局部特征匹配方法。论文重新审视了SuperGlue的多个设计决策,这是稀疏匹配领域的最新技术,并得出了简单但有效的改进方法。
CVPR 2023 Highlight | 唯快不功!ACE:建图快300倍的视觉重定位方法!
ACE是一种新颖的视觉重定位方法,可以在5分钟内绘制新环境的地图。与先前基于RGB的场景坐标回归方法相比,ACE显著降低了成本和能源消耗,使其成为实用的解决方案。
下一页