CV技术指南

CV技术指南

CV技术指南

本专栏文章来源于公众号CV技术指南

等 7 人订阅共114篇文章创建于2021-05-30

招聘 | 迁移科技招聘深度学习、视觉、3D视觉、机器人算法工程师等多个职位

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。公司介绍迁移科技是国内最早投身工业机器人视觉感知与智能控制技术的公司之一，致力于以3D视觉+AI算

4年前
954
点赞
评论

YOLO系列梳理（三）YOLOv5

前言 YOLOv5 是在 YOLOv4 出来之后没多久就横空出世了。今天笔者介绍一下 YOLOv5 的相关知识。目前 YOLOv5 发布了新的版本，6.0版本。在这里，YOLOv5 也在5.0基础上

4年前
4.9k
3
评论

从零搭建Pytorch模型教程（三）搭建Transformer网络

本文来自公众号CV技术指南的技术总结系列欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。在讲如何搭建之前，先回顾一下Transformer在计算机

4年前
1.9k
5
评论

StyleGAN大汇总 | 全面了解SOTA方法、架构新进展

转载自机器之心欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。 GAN 生成高分辨率图像的能力正在彻底改变图像合成和处理领域。2019 年 Karr

4年前
1.8k
5
评论

从零搭建Pytorch模型教程（二）搭建网络

前言上一篇《从零搭建Pytorch模型教程（一）数据读取》中介绍了classdataset的几个要点，由哪些部分组成，每个部分需要完成哪些事情，如何进行数据增强，如何实现自己设计的数据增强。然后，

4年前
1.2k
3
评论

一份可视化特征图的代码

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。写在前面的话特征图可视化是很多论文所需要做的一份工作，其作用可以是用于证明方法的有效性，也可以是用

4年前
2.0k
10
评论

ICLR2022 | cosformer : 重新思考在注意力中的softmax

Transformer 在自然语言处理、计算机视觉和音频处理方面取得了巨大的成功。作为其核心组件之一，softmax 注意力有助于捕获长程依赖关系，但由于序列长度的二次空间和时间复杂度而禁止其扩展。研

4年前
1.2k
点赞
评论

神经网络训练不收敛或训练失败的原因总结

本文分别从数据方面和模型方面分析了导致模型训练不收敛或失败的原因，数据方面总结了四种可能的原因，模型方面总结了九种可能的问题。除此之外，本文介绍了每种潜在问题的产生后果或现象，并提供了常规做法。

4年前
1.9k
点赞
评论

计算机视觉中的神经网络可视化工具与项目

本文来自公众号CV技术指南的技术总结系列关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读 CNN解释器这是一个中国博士发布的名叫CNN解释器的在线交互可视化工具。

4年前
1.2k
点赞
评论

关于快速学习一项新技术或新领域的一些个人思维习惯与思想总结

前言本文尝试谈谈笔者对于学一项新技术、入门一个新领域的一些看法和方法。在本文会谈到一些思维习惯层面的、思想层面的内容，最后会给一个从零入门学习pytorch的方法作为例子。、写在前面的话我

4年前
746
点赞
1

资源分享 | PyTea：不用运行代码，静态分析pytorch模型的错误

前言本文介绍一个Pytorch模型的静态分析器 PyTea，它不需要运行代码，即可在几秒钟之内扫描分析出模型中的张量形状错误。文末附使用方法。本文转载自机器之心编辑：CV技术指南

4年前
1.1k
点赞
评论

ICCV2021 | Tokens-to-Token ViT:在ImageNet上从零训练Vision Transformer

前言本文介绍一种新的tokens-to-token Vision Transformer(T2T-ViT)，T2T-ViT将原始ViT的参数数量和MAC减少了一半，同时在ImageNet上从头开始

4年前
1.9k
1
评论

ICCV2021 | 简单有效的长尾视觉识别新方案：蒸馏自监督(SSD)

前言本文提出了一种概念上简单但特别有效的长尾视觉识别的多阶段训练方案，称为蒸馏自监督(Self Supervision to Distillation, SSD)。在三个长尾识别基准：ImageN

4年前
1.7k
点赞
评论

ICCV2021 | 用于视觉跟踪的学习时空型transformer

前言本文介绍了一个端到端的用于视觉跟踪的transformer模型，它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能，具有实时性，比Sia

4年前
1.5k
点赞
评论

ICCV2021 | TOOD：任务对齐的单阶段目标检测

前言单阶段目标检测通常通过优化目标分类和定位两个子任务来实现，使用具有两个平行分支的头部，这可能会导致两个任务之间的预测出现一定程度的空间错位。本文提出了一种任务对齐的一阶段目标检测(TOOD)

4年前
2.1k
点赞
评论

计算机视觉中的transformer模型创新思路总结

前言本文回顾了ViT的结构，总结了计算机视觉中的transformer的主要改进思路：改进分块，改进位置编码，改进Encoder，增加Decoder。每个思路下都介绍了相关的论文，介绍了这些论文的

4年前
3.4k
1
1

ICCV2021 | 渐进采样式Vision Transformer

前言 ViT通过简单地将图像分割成固定长度的tokens，并使用transformer来学习这些tokens之间的关系。tokens化可能会破坏对象结构，将网格分配给背景等不感兴趣的区域，并引入干扰

4年前
1.4k
点赞
评论

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

前言本文分享的论文是ICCV2021中的最佳论文，在短短几个月内，google scholar上有388引用次数，github上有6.1k star。本文来自公众号CV技术指南的论文分享系列关

4年前
1.1k
点赞
评论

ICCV2021 | SOTR:使用transformer分割物体

前言本文介绍了现有实例分割方法的一些缺陷，以及transformer用于实例分割的困难，提出了一个基于transformer的高质量实例分割模型SOTR。经实验表明，SOTR不仅为实例分割提供了

4年前
2.3k
点赞
评论