和 2D 检测的区别
主要是在深度信息上
解决方案
- 从数据入手,利用点云直接获取 3D 数据,但需要设计特定的算法
- 从算法入手,单目/多目的纯视觉算法,由于图像本身缺乏深度信息,所以利用纯视觉做 3D 检测问题本身就存在病态性
- 多模态算法,结合点云和图像的优势,但要解决多传感器的标定和对齐问题
基础知识
LiDAR
LiDAR(Light Detection And Ranging) 借助激光测量物体距离。(Radar(Radio Detection And Ranging)基于微波)
激光雷达发射的激光会被雨点等干扰;毫米波雷达穿透性则更强,但是精度比 LiDAR 低
RGB-D
发射红外线测量深度,易受环境光影响,通常用于室内
点云和图像
点云是非结构化数据,图像是结构化的
点云提供三维结构信息,不包含语义和纹理,图像相反
点云密度近处大,远处小;图像分辨率相对较高
坐标系变换
世界坐标系、相机坐标系和图像坐标系
世界坐标系到相机坐标系是刚性变换,由平移和旋转构成,涉及到的参数矩阵 [R|t] 为外参矩阵
相机坐标系到图像坐标系的变换利用了小孔成像模型,涉及到的参数矩阵 K 为内参矩阵