最近在探索一些路侧三维感知的东西,关注到了这个去年年底到今年年初举行的路侧 3D 感知的比赛。用的数据集也是 AIR 提供的 Rope3D,AIR 做车路协同考虑提高路侧相机的 3D 感知能力也是合情合理的。
决赛获奖名单在此 ,按照答辩顺序,今天先总结一下决赛第六名的方案
这个比赛是规定了训练设备线上训练,且限定了训练时间,所以解决方案的精度可能因此受限
第六名解决方案
- 模型:MonoCon,从 PaperWithCode Monocular 3D Object Detection on KITTI Cars Moderate 里挑出来的当时第二名的方案,第一名的方法比赛环境不允许。模型对应的论文地址
- 训练方案: 主要是做了数据增强 + 调参(epoch、学习率策略、学习率大小),方案迭代过程如下图所示
- 专家提问:为什么没使用地面方程做深度预测?
比赛是提供了地面方程(地平面在相机坐标系下的方程式)、深度图等信息,可以辅助获取深度信息,但是该选手使用的是 MonoCon 里面自带的深度预测