持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第4天,点击查看活动详情
本文是CVPR2022最佳学生论文中主要创新点的参考论文DSAC - Differentiable RANSAC for Camera Localization的学习笔记。
1. RANSAC
RANSAC是“RANdom SAmple Consensus(随机抽样一致)”的缩写。它可以从一组包含“局外点”的观测数据集中,通过迭代方式估计数学模型的参数。它是一种不确定的算法,即它有一定的概率得出一个合理的结果;为了提高概率必须提高迭代次数。该算法最早由Fischler和Bolles于1981年提出。
图 1 RANSAC找到的直线(局外点并不影响结果)
一个基本的RANSAC实现包括四个步骤:(i)通过抽样数据的最小子集生成一组模型假设(例如任意选择两个点构造的直线组);(ii)基于某种共识度量对假设进行评分(例如每条直线拟合到的点数);(iii)选择最佳评分假设(例如选择拟合能力最强的直线);(iv)使用额外的数据点,来完善所选假设。(例如使用所有最佳假设拟合到的点重新进行RANSAC)步骤(iv)是可选的,尽管在实践中对高精度很重要。
2. DSAC (以相机定位为例)
2.1 符号标记
I :单张RGB图像
i :图像像素点
h : 处理结果(刚体变换)
Y(I)或Y = {y(I,i) | ∀i} y(I,i)用yi缩写,代表像素i对应的3D坐标
jm∈[1, . . . , |Y |],最小子集YJ={yj1, ..., yjn},n表示最小子集包含项的个数
一个模型假设hJ=H(YJ),在相机定位中,H表示PNP算法,n取4
2.2 三种最优化求解方法
2.2.1 Argmax
不可微。
2.2.2 Soft argmax
加权平均代替argmax。
2.2.3 Probabilistic
利用Softmax将scores转化为概率。
3. DSAC 与 EPro-PnP 的对比
RANSAC方法决定了DSAC是在有限hypothesis的pool中选择最优解,转化为概率也是非连续的Softmax。EPro-PnP则是直接提出了连续域的最优化积分解法。