首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
CVHub
CVHub
创建于2023-03-05
订阅专栏
专注计算机视觉领域,提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案!
等 64 人订阅
共252篇文章
创建于2023-03-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
视觉大模型系列 | MSA:一种简单强大的医学 SAM 适配器,轻松强化 SAM 到指定领域
本文将通用分割模型 SAM 扩展到医学图像分割领域,并命名为 MSA。通过采用参数有效的适应性技术,一种成本效益的微调技术,我们在 19 个医学图像分割任务中实现了显著的改进。
CVPR'2023 | PIDNet: 基于注意力机制引导的实时语义分割网络架构,完美解决空间细节、上下文和边界信息!
本文提出了一种新颖的用于实时语义分割的三分支网络架构PIDNet。该模型的目标是实现对图像的语义分割和边界检测。
传感器失效怎么办?MetaBEV:一种新颖且鲁棒感知网络架构,专治各自传感器疑难杂症
本文提出了一种自动驾驶感知新框架 MetaBEV,旨在解决鸟瞰图 (BEV) 3D 检测和地图分割中的传感器故障问题。
CVPR2023 | 无需动态区域分割!多帧深度估计新进展:跨线索注意力机制提升动态区域精度
本论文提出了一种新的动态场景多帧深度估计方法。通过更好对单/多帧深度线索进行融合并相互提升,实现了在无需运动分割情况下的高精度动态区域深度估计。
Google Brain 新作 | diffusion合成数据集来提升ImageNet分类效果
本文提出了当前使用基于扩散模型的生成数据来进行数据增强在多大程度上是有效的。在ImageNet分类任务中,本文表明可以利用大规模的文本生成模型fine-tuning得到SOTA FID。
中科大团队新作 | 通用形变文档图像矫正框架(附在线体验DEMO)!
本文介绍了一种全新的通用形变文档图像矫正框架,作者团队的方法突破了现有多数矫正方法的场景局限性,能够恢复日常生活中常见的各种形变文档图像。
CVPR2023 超高分论文 | Consistent-Teacher: 高效目标检测超强 SOTA!
本文通过分析现有半监督目标检测伪标签的偏移问题与不稳定性(Inconsistancy),提出了一种新的半监督目标检测器Consistent-Teacher。
全网最详细的 DINOv2 论文解读来啦!
本文介绍了第一个基于图像数据的 SSL 工作——DINOv2,这是一种用于在大型图像数据集上预训练图像编码器,以获得具有语义的视觉特征。
中文LLaMa和Alpaca大语言模型开源方案 | 扩充中文词表 & 针对中文语料进行高效编码
本文开源了专门针对中文的LLaMA和Alpaca大语言模型,通过增加20K个中文token扩展了原始LLaMA的中文词汇表,进一步增加了中文编码效率并提高了中文基础语义理解能力。
重塑自监督学习: DINO 网络如何颠覆视觉特征表示的常规方法
本文主要向大家介绍 DINO,这是第一篇探索 ViT 模型在自监督学习领域的经典代表作。DINO 整体架构基于自蒸馏的范式进行构建,包含一个教师网络和学生网络。
视觉大模型系列 | STU-Net:超越 nnU-Net,探讨大模型在医学图像分割领域的可能性
本文介绍了一种基于 nnU-Net 框架的可扩展和可转移的医学图像分割模型 STU-Net。STU-Net 最大包含 14 亿个参数,是迄今为止最大的医学图像分割模型。
视觉大模型系列 | SEEM : 一种比 SAM 交互能力更强,且具有语义感知的分割大模型
本文介绍了 SEEM,该模型可以同时对所有语义进行全局分割,并且可以与用户互动,接受来自用户的不同类型的视觉提示,包括点击、框选、多边形、涂鸦、文本和参考图像分割。
以CVPR2023的半监督语义分割工作UniMatch为例,聊聊一篇顶会论文的idea是如何获得并实现大幅超越以往方法的性能!
在本工作中,我们展示了FixMatch迁移到半监督语义分割任务中的有效性。我们通过消融实验验证了强扰动的重要性,并进一步通过特征强扰动扩展了FixMatch的扰动空间。
CVPR 2023 | 清华黄高团队提出适配边端和云端的即插即用型高效神经网络网络架构 Slide-Transformer
在这篇论文中,作者重新审视了局部注意力机制,并通过提出一种新颖的 Slide Attention 模块来解决其效率问题。
即插即用系列 | 清华提出最新移动端高效网络架构 CloFormer: 注意力机制与卷积的完美融合!
本论文提出了 CloFormer,一种具有上下文感知的局部增强机制的轻量级视觉 Transformer,并且开发了一种新颖的局部感知方法。
2023 港科大医学图像分割新作 | PHNet: 当MLP与CNN巧妙结合会擦出什么火花?
本文提出了一种新的可置换混合网络PHNet,用于3D体积医学图像分割任务。PHNet集成了2D CNN、3D CNN和MLP,以实现局部和全局特征的提取和集成。
CVPR'2023 | Nerf-Stereo: 利用NeRF来训练双目立体匹配网络的新范式!
本文介绍了一个新颖的学习框架,可以轻松地训练立体匹配网络,而不需要任何ground-truth数据。
视觉GPT | SegGPT:大通用分割模型登场!利用视觉 prompt 分割万物
本文介绍了一种基于上下文视觉学习的通用分割模型 SegGPT,展示了如何设计合适的训练策略,充分利用上下文视觉学习的灵活性。
2023港科大新作 | 新颖注意力机制有效提升医学图像小样本语义分割精度!
本文提出了一种用于few-shot医学图像分割的交叉注意力Transformer网络CAT-Net。通过交叉掩码注意力模块实现了查询和支持特征之间的交互,增强了特征表达能力。
下一页