论文笔记(4)DSAC

418 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第4天,点击查看活动详情

本文是CVPR2022最佳学生论文中主要创新点的参考论文DSAC - Differentiable RANSAC for Camera Localization的学习笔记。

1. RANSAC

RANSAC是“RANdom SAmple Consensus(随机抽样一致)”的缩写。它可以从一组包含“局外点”的观测数据集中,通过迭代方式估计数学模型的参数。它是一种不确定的算法,即它有一定的概率得出一个合理的结果;为了提高概率必须提高迭代次数。该算法最早由Fischler和Bolles于1981年提出。

image.png

图 1 RANSAC找到的直线(局外点并不影响结果)

一个基本的RANSAC实现包括四个步骤:(i)通过抽样数据的最小子集生成一组模型假设(例如任意选择两个点构造的直线组);(ii)基于某种共识度量对假设进行评分(例如每条直线拟合到的点数);(iii)选择最佳评分假设(例如选择拟合能力最强的直线);(iv)使用额外的数据点,来完善所选假设。(例如使用所有最佳假设拟合到的点重新进行RANSAC)步骤(iv)是可选的,尽管在实践中对高精度很重要。

2. DSAC (以相机定位为例)

2.1 符号标记

I :单张RGB图像

i :图像像素点

h 处理结果(刚体变换)

Y(I)或Y = {y(I,i) | ∀i}   y(I,i)用yi缩写,代表像素i对应的3D坐标

jm∈[1, . . . , |Y |],最小子集YJ={yj1, ..., yjn},n表示最小子集包含项的个数

一个模型假设hJ=H(YJ),在相机定位中,H表示PNP算法,n取4

2.2 三种最优化求解方法

image.png

2.2.1 Argmax

不可微。

2.2.2 Soft argmax

加权平均代替argmax。

2.2.3 Probabilistic

利用Softmax将scores转化为概率。

3. DSAC EPro-PnP 的对比

RANSAC方法决定了DSAC是在有限hypothesis的pool中选择最优解,转化为概率也是非连续的Softmax。EPro-PnP则是直接提出了连续域的最优化积分解法。