CVHub

CVHub

CVHub

专注计算机视觉领域，提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案！

等 72 人订阅共253篇文章创建于2023-03-05

CVHub手把手帮你榨干GPU的显存

Out Of Memory, 一个炼丹师们熟悉得不能再熟悉的异常，其解决方法也很简单，减少输入图像的尺寸或者Batch Size就好了。

3年前
298
1
评论

深入理解 Word Embedding

背景 One Hot Encoding和Word Embedding是自然语言处理中最流行的两种向量表示形式。

3年前
744
点赞
评论

一文轻松搞定Python装饰器@property

装饰器(Decorators)，是一种可用于修改其它函数功能的函数，有助于使Python代码更加简短。

3年前
100
点赞
评论

一文轻松搞定Python装饰器@property

CV-CUDA: NVIDIA 官方出品高性能图像处理加速库

随着短视频 APP、视频会议平台以及 VR/AR 等技术的发展，视频与图像已逐渐成为全球互联网流量的主要组成部分。

3年前
1.4k
1
评论

CV-CUDA: NVIDIA 官方出品高性能图像处理加速库

万字长文带你入门带你入门变分自编码器

从简单的变分自编码器讲起，后续有时间再单独出一篇关于扩散模型的讨论，通过联系不同模型之间的关系，进一步提出关于未来研究的想法。

3年前
620
1
评论

万字长文带你入门带你入门变分自编码器

一文看尽深度学习中的各种经典GAN

生成对抗网络(Generative Adversarial Networks, GANs)在过去几年中被广泛地研究，其在图像生成、图像转换和超分辨率等领域取得了显著的进步。

3年前
702
1
评论

一文看尽深度学习中的各种经典GAN

即插即用系列！| Spatial Bias: 一种简单有效的超轻量全局编码方法

本文提出了一种快速且轻量的全局特征提取方法：空间偏置卷积。所提出的方法仅向卷积特征图中添加了一些额外的空间偏置通道，使得卷积层本身能够通过自注意操作学习全局知识。

3年前
345
1
评论

即插即用系列！| Spatial Bias: 一种简单有效的超轻量全局编码方法

港科大 Arxiv 2023 | DA-BEV: 3D目标检测新 SOTA，一种强大的深度信息挖掘方法

本文针对之前 DETR-based 的 3D 检测器中忽略了空间交叉注意力中的深度信息，并在检测物体时产生了严重的模糊问题进行了研究。

3年前
1.2k
1
评论

港科大 Arxiv 2023 | DA-BEV: 3D目标检测新 SOTA，一种强大的深度信息挖掘方法

CVPR 2023 | LoGoNet：优于所有最先进的 3D 目标检测方法！

本文提出了一种新颖的多模态网络，称为 `LoGoNet`，采用局部到全局的跨模态特征融合，深度融合点云特征和图像特征，为精确检测提供更丰富的信息。

3年前
903
2
评论

CVPR 2023 | LoGoNet：优于所有最先进的 3D 目标检测方法！

CMNEXT: 基于编解码架构的强大语义分割基线，解锁多模态语义分割的正确姿势！

本文致力于解决任意模态的语义分割AMSS问题，并为此提出了在各种天气条件下具有四种模态和部分传感器故障的`DELIVER`多模态数据集。

3年前
431
1
评论

CMNEXT: 基于编解码架构的强大语义分割基线，解锁多模态语义分割的正确姿势！

Intel 开源新作 | ZoeDepth: 第一个结合相对和绝对深度的多模态单目深度估计网络

论文提出了ZoeDepth，第一个结合了相对深度和绝对深度的方法，弥补相对和绝对深度估计性能之间的差距，在保持度量尺度的同时，实现了卓越的泛化性能。

3年前
1.4k
1
评论

Intel 开源新作 | ZoeDepth: 第一个结合相对和绝对深度的多模态单目深度估计网络

CVPR2023 即插即用系列 | 一种高效轻量的自注意力机制助力图像恢复网络问鼎SOTA！

本文受到两个图像属性的启发，即跨尺度相似性和各向异性图像特征，从而提出了一种高效的锚定条纹自注意力模块，用于建模图像的长远距离依赖关系。

3年前
3.2k
3
评论

CVPR2023 即插即用系列 | 一种高效轻量的自注意力机制助力图像恢复网络问鼎SOTA！

即插即用系列｜Make FCN Great Again: 全局感受野助力全卷积神经网络涅槃重生！

本文基于卷积的网格采样位置应该依赖于空间坐标和不同通道这一思路，提出了一种全新的全局感受野卷积，以提供全局感受野的卷积。

3年前
958
1
评论

即插即用系列｜Make FCN Great Again: 全局感受野助力全卷积神经网络涅槃重生！

致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

本文使用非对齐监督的真实世界图像提出了一种新颖有效的去雾框架。该框架利用多尺度参考损失将去雾网络的预测与清晰且未对齐的参考图像进行比较。

3年前
1.6k
3
评论

致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架

CVPR'2023 即插即用系列! | BiFormer: 通过双向路由注意力构建高效金字塔网络架构

本文提出了一种双层路由注意力模块，以动态、查询感知的方式实现计算的有效分配。其中，`BRA`模块的核心思想是在粗区域级别过滤掉最不相关的键值对。

3年前
1.9k
2
评论

CVPR'2023 即插即用系列! | BiFormer: 通过双向路由注意力构建高效金字塔网络架构

CVPR'2023 | 港科大 & 腾讯 AI Lab & 港大联合出品：有趣的动态 3D 场景重建

本文提出了一种实用的解决方案，用于在给定完全异步多视图视频的情况下构建 3D 循环视频表示。实验验证了所提方法的有效性，并证明在几个基线上质量和效率有了显著提高。

3年前
1.3k
1
评论

CVPR'2023 | 港科大 & 腾讯 AI Lab & 港大联合出品：有趣的动态 3D 场景重建

CVHub | Early Dropout: Make Hinton's Drouout Great Again!

本文提出了early dropout，以帮助欠拟合模型更好地拟合，而late dropout，以提高过拟合模型的泛化性。

3年前
625
1
评论

CVHub | Early Dropout: Make Hinton's Drouout Great Again!

CVHub | 浅谈 U-Net 在医学图像分割中的应用

本文从医学影像和图像分割来阐述医学图像分割领域的研究发展状况，同时也深入剖析U-Net及其变体模型的一些特性，最后再给出更有代表性的研究方向。

3年前
905
点赞
评论

CVHub | 浅谈 U-Net 在医学图像分割中的应用

CVHub | MICCAI TN-SCUI甲状腺结节超声图像分割竞赛冠军方案

甲状腺是一种呈蝴蝶状的内分泌腺，通常位于颈部前下部。它分泌人体内所有细胞正常工作所必需的激素。本文主要为大家介绍MICCAI 2020 举办的一场 TN-SCUI 甲状腺结节分割比赛！

3年前
1.0k
1
评论

CVHub | MICCAI TN-SCUI甲状腺结节超声图像分割竞赛冠军方案

CVHub | Github 4.8k Stars! - CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)

在这篇文章中，我们将为大家介绍一个强大的 AI 模型，经过训练可以根据提供的图像进行高质量复原。使用此模型，你只需上传要恢复的图像，它就会显着提高图像质量！

3年前
4.0k
1
1

CVHub | Github 4.8k Stars! - CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)