3D 目标检测入门

404 阅读1分钟

和 2D 检测的区别

主要是在深度信息上

解决方案

  • 从数据入手,利用点云直接获取 3D 数据,但需要设计特定的算法
  • 从算法入手,单目/多目的纯视觉算法,由于图像本身缺乏深度信息,所以利用纯视觉做 3D 检测问题本身就存在病态性
  • 多模态算法,结合点云和图像的优势,但要解决多传感器的标定和对齐问题

基础知识

LiDAR

LiDAR(Light Detection And Ranging) 借助激光测量物体距离。(Radar(Radio Detection And Ranging)基于微波)

激光雷达发射的激光会被雨点等干扰;毫米波雷达穿透性则更强,但是精度比 LiDAR 低

RGB-D

发射红外线测量深度,易受环境光影响,通常用于室内

点云和图像

点云是非结构化数据,图像是结构化的

点云提供三维结构信息,不包含语义和纹理,图像相反

点云密度近处大,远处小;图像分辨率相对较高

坐标系变换

世界坐标系、相机坐标系和图像坐标系

世界坐标系到相机坐标系是刚性变换,由平移和旋转构成,涉及到的参数矩阵 [R|t] 为外参矩阵

相机坐标系到图像坐标系的变换利用了小孔成像模型,涉及到的参数矩阵 K 为内参矩阵

image.png