通用视觉框架OpenMMLab目标检测与MMDetection | 学习笔记

193 阅读3分钟

通用视觉框架OpenMMLab目标检测与MMDetection | 学习笔记

  • 什么是目标检测

    • 目标检测 in 人脸识别
    • 目标检测 in 智慧城市
    • 目标检测 in 自动驾驶
    • 目标检测 in 下游视觉任务
    • 目标检测 vs 图像分类
    • 滑窗 Sliding Window
    • 滑窗 Sliding Windows
    • 滑窗的效率问题
    • 改进思路 1:区域提议
    • 改进思路 2:分析滑窗中的重复计算
    • 消除滑窗中的重复计算
    • 在特征图上进行密集预测
    • 目标检测的基本范式
  • 基础知识

    • 框,边界框(Bounding Box)
    • 框相关的概念
    • 交并比 Intersection Over Union
    • 置信度 Confidence Score
    • 非极大值抑制 Non-Maximum Suppression
    • 边界框回归 Bounding Box Regression
    • 边界框编码 Bbox Coding
  • 两阶段目标检测算法 Two-stage Detectors

    • 两阶段算法概述
    • Region-based CNN (2013)
    • R-CNN 的训练
    • R-CNN 相比于传统方法的提升
    • R-CNN 的问题
    • Fast R-CNN (2014)
    • RoI Pooling
    • RoI Align
    • Fast R-CNN 的训练
    • Fast R-CNN 的速度提升
    • Fast R-CNN 的精度提升
    • Fast R-CNN 的速度瓶颈
    • 降低区域提议的计算成本
    • 朴素方法的局限
    • 锚框 Anchor
    • Faster R-CNN (2015)
    • Faster R-CNN 的训练
    • 两阶段方法的发展与演进 (2013~2017)
  • 多尺度检测技术

    • 多尺度检测必要性
    • 图像金字塔 Image Pyramid
    • 层次化特征
    • 特征金字塔网络 Feature Pyramid Network (2016)
    • 在 Faster R-CNN 模型中使用 FPN
  • 单阶段目标检测算法 One-Stage Detectors

    • 回顾两阶段算法

    • 单阶段算法

      • 单阶段检测算法概述
    • YOLO: You Only Look Once (2015)

      • YOLO 的分类和回归目标
      • YOLO 的损失函数
      • YOLO 的优点和缺点
    • SSD: Single Shot MultiBox Detector (2016)

      • SSD 的损失函数
      • 正负样本不均衡问题
      • 解决样本不均衡问题
      • 困难负样本 Hard Negative
      • 不同负样本对损失函数的贡献
      • 降低简单负样本的损失
      • Focal Loss
    • RetinaNet (2017)

      • RetinaNet 的性能
    • YOLO v3 (2018)

      • YOLO v3 (2018)
    • 无锚框目标检测算法 Anchor-free Detectors

      • 锚框 vs 无锚框
    • FCOS, Fully Convolutional One-Stage (2019)

      • FCOS 的多尺度匹配
      • FCOS 的预测目标
      • 中心度 Center-ness
      • FCOS 的损失函数
    • CenterNet (2019)

      • CenterNet 的主要流程
  • Detection Transformers

    • DETR (2020)
    • Deformable DETR (2021)
  • 目标检测模型的评估方法 Evaluation

    • 检测结果的正确/错误类型
    • 准确率 Precision 与 召回率 Recall
    • 准确率与召回率的平衡
    • PR 曲线 与 AP 值
    • 完整数据集上的例子
    • PR 曲线的起伏
    • Mean AP
  • 总结

  • MMDetection

    • 目标检测工具包 MMDetection
    • 广泛应用
    • MMDetection 可以做什么
    • MMDetection 环境搭建
    • OpenMMLab 项目中的重要概念——配置文件
    • MMDetection 代码库结构
    • 配置文件的运作方式
    • 两阶段检测器的构成
    • RetinaNet 模型配置 – 主干网络
    • RetinaNet 模型配置 – 颈部
    • RetinaNet 模型配置 – bbox head 1
    • RetinaNet 模型配置 – bbox head 2
    • COCO 数据集介绍
    • COCO 数据集格式
    • COCO 数据集的标注格式
    • BBOX 标注格式
    • 标注、类别、图像 id 的对应关系
    • 在 MMDetection 中配置 COCO 数据集
    • MMDetection 中的自定义数据集格式
    • 在 MMDetection 中配置自定义数据集
    • 数据处理流水线
    • MMDetection 中的常用训练策略
    • 训练自己的检测模型