CVHub

CVHub

CVHub

专注计算机视觉领域，提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案！

等 72 人订阅共253篇文章创建于2023-03-05

ICCV 2023 | 北大&南洋理工联合提出开放词汇实例分割新方法 CGG: 性能俱佳同时具备时间和空间效率优势！

在计算机视觉领域，开放词汇实例分割（Open Vocabulary Instance Segmentation）是一个十分具有挑战性的任务，它需要模型能够识别并分割出图像中的各种对象。

2年前
1.0k
点赞
评论

ICLR 2023 | 利用主动学习降低 3D 目标检测中的高标注成本

本文研究了主动3D物体检测的三种新标准，它们能以最低的3D边界框标注成本和运行时复杂性的前提下有效实现高性能3D目标检测。

2年前
724
1
评论

爱人民币（iRMB）就不会 EMO 了？| ICCV-2023: 结合 CNN 和 Transformer 的倒残差移动模块设计

本文致力于轻量级的高效模型结构设计研究，同时考虑模型参数量（#Params）、计算量（FLOPs）和精度（Accuracy）之间的权衡。

2年前
1.0k
点赞
评论

中科院深圳先进院发表WizardMath | 关于如何提升LLMs的逻辑推理能力

GPT-4在自然语言处理（NLP）任务中展现出了卓越的性能，其中包括具有挑战性的数学推理。然而，目前大部分已存在的开源模型仅仅在大规模互联网数据上进行了预训练，并且没有针对数学相关内容进行优化。

2年前
735
点赞
评论

超越RTMPose | 登顶 COCO-WholeBody 榜首：清华联合IDEA提出全身关键点检测SOTA模型 DWPose

本文介绍了一种2D人体全身姿态估计新方法，以及如何通过多种知识蒸馏技术来提高这种方法的效率和准确性。

2年前
1.4k
点赞
评论

Residual Pattern Learning: 在不影响模型闭集表现的情况下分割异常物体

在本次工作中, 我们针对当前 OoD Segmentation中的两个问题进行了优化, 并且用 consistent checkpoint 在所有数据集上取得了非常好的性能。

2年前
512
点赞
1

ICCV 2023 | 光与影的升华：FeatEnHancer 一种适用于任意低光照任务的即插即用模块，显著提升精度！

本文提出了FeatEnHancer，一种用于低光照视觉任务的增强型多尺度层次特征的新方法。提议的解决方案重点增强相关特征，通过提供强大的语义表示，使其优于现有的低光照图像增强方法。

2年前
760
1
评论

港中文联合上海AI Lab发布多模态(12种)学习统一框架：Meta-Transformer

设计一个统一的网络来处理各种模态（例如自然语言、2D图像、3D点云、音频、视频、时间序列和表格数据）是一项极具挑战性的工作。

2年前
1.2k
4
2

Google & CMU 新作 | 揭示 LLMs 在解决视觉任务方面的无限潜力

本文通过提出一种新方法 SPAE，揭示了冻结的大型语言模型（LLMs）在处理涉及图像和视频的多模态理解和生成任务中的潜力，而无需对这些模态进行显式训练。

2年前
617
3
2

Meta AI开源力作 | SiLK：你真的需要这么复杂的图像关键点提取器？

本论文介绍了SiLK，一个简单而灵活的关键点检测和描述符框架。SiLK基于独特性和不变性的原则设计，在3D视觉感知的关键低级任务上实现或超越了SOTA水平。

2年前
1.4k
1
评论

港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能！

在本文中，我们介绍了GrammarGPT，这是一个专门用于母语中文语法错误纠正的开源大语言模型（LLM）。

2年前
1.7k
点赞
1

大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型

本文介绍了一种名为HQTrack的高质量视频目标跟踪框架。视频目标跟踪是计算机视觉中基础的视频任务。

2年前
691
2
3

CVPR 2023 | SCConv: 即插即用的空间和通道重建卷积（附源码）

SCConv，这是一个有效的架构单元，能够通过减少广泛存在于标准卷积中的空间和通道冗余，降低计算成本和模型存储，同时提高CNN模型的性能。

2年前
1.5k
1
2

ICCV 2023 | APE: 高效的 CLIP 图像分类适配算法，比 Tip-Adapter 参数少30倍

本文基于 CLIP 提出了一种特征提纯的方法为下游图像分类任务选择最具有判别性的特征，以此来提高下游任务的性能并同时提高计算效率。

2年前
1.2k
1
2

重新思考局部-全局上下文交互：SegNetr 在医学图像分割中的应用

SegNetr 通过引入 SegNetr 块和信息保留跳跃连接来改进 U 型网络的分割性能。其中，SegNetr 块通过局部-全局交互实现更好的特征表示，而信息保留跳跃连接则提供了更好的特征融合机制。

2年前
902
点赞
评论

腾讯优图实验室 ICCV 2023 共 16 篇论文盘点

ICCV2023（International Conference on Computer Vision）国际计算机视觉大会将于今年10月在法国巴黎举行。

2年前
1.2k
点赞
3

ICCV 2023 | 南开程明明团队提出新颖注意力机制用于图像超分辨率任务

本文提出了一种新颖且高效的单图像超分辨率模型SRFormer，其核心是一个新的自注意力机制——PSA。PSA 能够在大窗口内有效地构建配对关联，而不会引入过多的计算成本。

2年前
1.0k
1
评论

ICCV 2023 | 超越 NanoDet, 腾讯联合比特币矿机制造商MicroBT发表 68.77k 的超轻量目标检测器！

本文提出了一个新颖的实例边界增强模块（IBE）和递归热重启训练策略（RecWR），以克服极度轻量级检测器的优化问题。

2年前
746
1
评论

无惧暗光！| PE-YOLO: 夜视环境物体检测新突破（附源码实现）

PE-YOLO 是一种新颖的暗环境物体检测框架，该框架整合了金字塔增强网络（PENet）和YOLOv3。

2年前
1.5k
点赞
1

中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)

在这项工作中，研究者们提出了一个强大且有效的视觉Transformer模型，称为DilateFormer。这种模型可以为各种视觉任务提供强大且通用的表示。

2年前
1.2k
1
1