首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
CVHub
创建于2023-03-05
订阅专栏
专注计算机视觉领域,提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案!
等 64 人订阅
共252篇文章
创建于2023-03-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
深入理解 Word Embedding
背景 One Hot Encoding和Word Embedding是自然语言处理中最流行的两种向量表示形式。
一文轻松搞定Python装饰器@property
装饰器(Decorators),是一种可用于修改其它函数功能的函数,有助于使Python代码更加简短。
CV-CUDA: NVIDIA 官方出品高性能图像处理加速库
随着短视频 APP、视频会议平台以及 VR/AR 等技术的发展,视频与图像已逐渐成为全球互联网流量的主要组成部分。
万字长文带你入门带你入门变分自编码器
从简单的变分自编码器讲起,后续有时间再单独出一篇关于扩散模型的讨论,通过联系不同模型之间的关系,进一步提出关于未来研究的想法。
一文看尽深度学习中的各种经典GAN
生成对抗网络(Generative Adversarial Networks, GANs)在过去几年中被广泛地研究,其在图像生成、图像转换和超分辨率等领域取得了显著的进步。
即插即用系列!| Spatial Bias: 一种简单有效的超轻量全局编码方法
本文提出了一种快速且轻量的全局特征提取方法:空间偏置卷积。所提出的方法仅向卷积特征图中添加了一些额外的空间偏置通道,使得卷积层本身能够通过自注意操作学习全局知识。
港科大 Arxiv 2023 | DA-BEV: 3D目标检测新 SOTA,一种强大的深度信息挖掘方法
本文针对之前 DETR-based 的 3D 检测器中忽略了空间交叉注意力中的深度信息,并在检测物体时产生了严重的模糊问题进行了研究。
CVPR 2023 | LoGoNet:优于所有最先进的 3D 目标检测方法!
本文提出了一种新颖的多模态网络,称为 `LoGoNet`,采用局部到全局的跨模态特征融合,深度融合点云特征和图像特征,为精确检测提供更丰富的信息。
CMNEXT: 基于编解码架构的强大语义分割基线,解锁多模态语义分割的正确姿势!
本文致力于解决任意模态的语义分割AMSS问题,并为此提出了在各种天气条件下具有四种模态和部分传感器故障的`DELIVER`多模态数据集。
Intel 开源新作 | ZoeDepth: 第一个结合相对和绝对深度的多模态单目深度估计网络
论文提出了ZoeDepth,第一个结合了相对深度和绝对深度的方法,弥补相对和绝对深度估计性能之间的差距,在保持度量尺度的同时,实现了卓越的泛化性能。
CVPR2023 即插即用系列 | 一种高效轻量的自注意力机制助力图像恢复网络问鼎SOTA!
本文受到两个图像属性的启发,即跨尺度相似性和各向异性图像特征,从而提出了一种高效的锚定条纹自注意力模块,用于建模图像的长远距离依赖关系。
即插即用系列|Make FCN Great Again: 全局感受野助力全卷积神经网络涅槃重生!
本文基于卷积的网格采样位置应该依赖于空间坐标和不同通道这一思路,提出了一种全新的全局感受野卷积,以提供全局感受野的卷积。
致敬何凯明的暗通道去雾算法 | NAS-Net: 基于非对齐监督的图像去雾框架
本文使用非对齐监督的真实世界图像提出了一种新颖有效的去雾框架。该框架利用多尺度参考损失将去雾网络的预测与清晰且未对齐的参考图像进行比较。
CVPR'2023 即插即用系列! | BiFormer: 通过双向路由注意力构建高效金字塔网络架构
本文提出了一种双层路由注意力模块,以动态、查询感知的方式实现计算的有效分配。其中,`BRA`模块的核心思想是在粗区域级别过滤掉最不相关的键值对。
CVPR'2023 | 港科大 & 腾讯 AI Lab & 港大联合出品:有趣的动态 3D 场景重建
本文提出了一种实用的解决方案,用于在给定完全异步多视图视频的情况下构建 3D 循环视频表示。实验验证了所提方法的有效性,并证明在几个基线上质量和效率有了显著提高。
CVHub | Early Dropout: Make Hinton's Drouout Great Again!
本文提出了early dropout,以帮助欠拟合模型更好地拟合,而late dropout,以提高过拟合模型的泛化性。
CVHub | 浅谈 U-Net 在医学图像分割中的应用
本文从医学影像和图像分割来阐述医学图像分割领域的研究发展状况,同时也深入剖析U-Net及其变体模型的一些特性,最后再给出更有代表性的研究方向。
CVHub | MICCAI TN-SCUI甲状腺结节超声图像分割竞赛冠军方案
甲状腺是一种呈蝴蝶状的内分泌腺,通常位于颈部前下部。它分泌人体内所有细胞正常工作所必需的激素。本文主要为大家介绍MICCAI 2020 举办的一场 TN-SCUI 甲状腺结节分割比赛!
CVHub | Github 4.8k Stars! - CodeFormer: 地表最强AI马赛克去除神器! (附实战教程)
在这篇文章中,我们将为大家介绍一个强大的 AI 模型,经过训练可以根据提供的图像进行高质量复原。使用此模型,你只需上传要恢复的图像,它就会显着提高图像质量!
CVHub | FastPillars: 一种部署友好的基于 Pillar 的 3D 检测器
随着深度学习算法与硬件平台的快速发展,在自动驾驶和机器人领域利用LiDAR点云的3D目标检测技术得到了广泛的关注。为此,本文提出了一种基于 LiDAR 3D 点云的高效 3D 目标检测器。
下一页