CVHub

CVHub

CVHub

专注计算机视觉领域，提供全面、多领域、有深度的前沿AI论文解读与产业级成熟解决方案！

等 72 人订阅共253篇文章创建于2023-03-05

TPAMI 2023 | 生成式AI与图像合成综述

生成式AI作为当前人工智能领域的前沿技术，已被广泛的应用于各类视觉合成任务。随着DALL-E2，Stable Diffusion和DreamFusion的发布，AI 作画和3D合成实现了令人惊讶的效果

2年前
1.7k
2
1

IJCAL 2023 | 基于美学策略引导的低光照图像增强方法

由于光学器件固有的局限性和外部成像条件的限制，低光图像是一类常见的低质量图像。下图中我们列出了两种低光图像，分别是在光照不均匀的环境下和逆光下拍摄的。

2年前
1.5k
点赞
评论

基于语义对比学习的低光照图像增强网络

由于单个 RGB 图像存在低对比度和低能见度问题，低光图像增强（LLE）仍然具有挑战性。在本文中，我们回答了一个有趣的与学习相关的问题—利用可获得的非配对的/曝光不足的图像和高级语义指导。

2年前
1.0k
1
评论

ICCV 2023 | EfficientViT: 面向边缘设备应用的SOTA语义分割模型，助力SAM高效推理

本文旨在解决在边缘设备上部署最先进的语义分割模型所面临的计算成本过高的问题。作者指出，先前的语义分割模型通常依赖于自注意力机制、计算密集型的大卷积核或复杂的拓扑结构，以获得良好的性能。

2年前
1.1k
点赞
评论

CLIP 数据分析

CLIP 得以成功的关键在于来源于网络所收集的高质量数据集（WIT400M），但关于 CLIP 数据集策划过程的细节一直是个谜。 CLIP的数据策划具有明显的优势。

2年前
947
点赞
评论

ICLR 2023 | 神经规范场: 渲染引导空间规范变换

近期，神经场（Neural Fields）领域的巨大进展，已经显著推动了神经场景表示和神经渲染的发展。为了提高3D场景的计算效率和渲染质量，一个常见的范式是将3D坐标系统映射到另一种测量系统，例如2D

2年前
988
点赞
评论

基于 YOLOR 的统一多任务学习范式

多任务学习旨在使用一个单一模型来学习多个任务，并同时提高所有这些任务的性能，这个概念类似于人类能够同时学习多个任务并将所学的知识应用到其他任务上。

2年前
1.1k
点赞
评论

S3IM：随机结构相似性及其对神经场的不合理有效性

今天为大家介绍的 S3IM 这个工作背后的想法实际上很简洁，作者从这个 idea 在脑海里形成到最后提交到 ICCV-2023 不过2个月时间。

2年前
704
点赞
评论

高效涨点神器 | 台湾国立中央大学最新提出即插即用 SFPN: 显著提升卷积神经网络精度

FPN（Feature Pyramid Network）已经成为大多数单阶段目标检测器的基本组件。以前的研究多次证明，FPN 可以更精确地捕获不同尺寸的对象的多尺度特征图，以更精确地描述它们。

2年前
979
点赞
评论

打破遮挡和数据稀缺难题：MMSports 2023 分割竞赛冠军方案分享！

本文集中讨论了在 CV 领域中的一个长期存在的问题，即遮挡问题，尤其是在实例分割任务中。相信不少小伙伴都或多或少会碰到这个“棘手”的问题，今天我们一起根据文章的脉络来观摩学习下。

2年前
865
点赞
评论

【2023-2024年最新教程】yolov5_obb: 旋转目标检测从数据制作到终端部署全流程教学

yolov5_obb 是 yolov5 目标检测框架的一个变种，支持旋转目标检测任务（Oriented Bounding Boxes，OBB），旨在生成更好拟合具有角度位置的物体预测结果。

2年前
1.9k
1
4

【2023-2024年最新教程】yolov5_obb: 旋转目标检测从数据制作到终端部署全流程教学

X-AnyLabeling 2.x 版本正式发布啦！构建强大的自动标注引擎

X-AnyLabeling 是一款全新的交互式自动标注工具，其基于 Labelme 和 Anylabeling 等诸多优秀的标注工具框架进行构建，在此基础上扩展并支持了许多丰富的模型和功能。

2年前
2.0k
1
1

CFINet-小目标检测

本文主要针对小目标检测领域提出了一种名为CFINet的算法框架，通过采用corase-to-fine的提议框生成策略和特征模仿学习来解决小目标检测的困难。

2年前
741
点赞
评论

ICCV 2023 | 克服域差异：基于事件相机的自监督预训练策略

事件相机（Event Camera）是一种新型传感器。不同于传统的RGB相机记录的是场景的像素亮度，输出稠密、低频的图像帧，事件相机记录的是像素亮度的变化，输出稀疏、高频的事件流。

2年前
460
点赞
评论

字节跳动 PICO 实验室关于 XR/AR 最新的研究进展

在不断发展的人工智能（AI）领域中，数据一直被视为最宝贵的资源之一。数据驱动的AI正以前所未有的方式塑造着未来，尤其在XR（扩展现实）领域，其中硬件和算法快速迭代。

2年前
699
1
评论

TPAMI 2023 | 生成式AI与图像合成综述

生成式AI作为当前人工智能领域的前沿技术，已被广泛的应用于各类视觉合成任务。随着DALL-E2和Stable Diffusion的发布，AI 作画和3D 合成实现了令人惊艳的效果！

2年前
323
点赞
2

IJCAL 2023 | 基于美学策略引导的低光照图像增强方法

由于光学器件固有的局限性和外部成像条件的限制，低光图像是一类常见的低质量图像。下图中我们列出了两种低光图像，分别是在光照不均匀的环境下和逆光下拍摄的。

2年前
378
点赞
评论

基于语义对比学习的低光照图像增强网络

在本文中，我们回答了一个有趣的与学习相关的问题——利用可获得的非配对的/曝光不足的图像和高级语义指导。

2年前
423
点赞
评论

中科大、字节新作 | UniDoc：面向统一的图文理解大模型

导读最近，大型语言模型（Large Language Models, LLMs）相关研究和落地取得了显著进展，为实现通用人工智能（AGI）迈出了重要步伐，并在各种语言应用中表现卓越。

2年前
467
点赞
2