前俩个月刚和国内来访问的硕士生合作投了一篇超像素的文章,并review了市面上很多超像素的文章,这里给大家科普一下。
0.背景
首先一张图片由一个个像素组成(可以看成网格),每个像素可以有一个灰度值(标量)或RGB值(三维向量)。
现今一张图片动辄1000*1000=100w像素,因此对于图像处理来说,是非常大的维度。
超像素最大的功能之一,便是作为图像处理其他算法的预处理,在不牺牲太大精确度的情况下 降维!
1.超像素
超像素最直观的解释,便是把一些具有相似特性的像素“聚合”起来,形成一个更具有代表性的大“元素”。
而这个新的元素,将作为其他图像处理算法的基本单位。
一来大大降低了维度;二来可以剔除一些异常像素点。
至于根据什么特性把一个个像素点聚集起来,可以是颜色、纹理、类别等。
看下图大家就能一瞥一二:
2.超像素算法
理论上,任何图像分割算法的过度分割(over-segmentation),即可生成超像素。
下面是一个图像分割算法的例子(举此例还因为这里分割标准是依据纹理)。
大家都知道“调参”这个术语。
告诉大家一个秘密,往往论文上出现的结果,都是作者精选几百张图片,调了几千次参数后取的最好结果。
因此,上图把参数一换,即可呈现超像素的结果。
不信下载算法【0】做一次调参侠试试?
注:【0】算法基于matlab,非常好用,更关键的作者(TUM博士,EPFL、海德堡博后)是我的合作者之一,推荐一试。
3.超像素算法判别条件
市面上如此多的超像素算法,如何比较他们的优劣呢?
一般业内参考以下三个指标(具体公式请参考【1】).
(1) Undersegmentation Error
下图,白色是原图的一个物体,红线是一个个超像素的轮廓,而粉红色的区域就是undersegmentation的区域。显然,这部分区域越大就越不好。

(2) Boundary Recall
下图,黑色虚线以及实现是原图物体的轮廓,红线是超像素的边界。一个好的超像素算法,应该覆盖原图物体的轮廓。在给予一定缓冲(粉红色区域)的情况下,超像素的边缘可以覆盖原图物体边缘的越多(黑色实线),该算法就越好。

(3) Compactness score
这个指标衡量了一个超像素是否“紧实”。
下图,高下立判。
4.(我们的)超像素算法的初始化
超像素算法的初始化,我举以下俩个例子:
(1) 种子像素初始化
SLIC利用了简单的聚类(贪婪)算法,初始时刻,每一个聚类的中心被平均地分部在原图中。而超像素的个数,也可以基本由这些中心点来决定。
每一步迭代,种子像素合并周围的像素,形成超像素。

(2) 矩形区域初始化
SEEDS的初始化,是把原图先平均分割成很多矩形,初始超像素即为这些矩形。
每一步迭代,超像素的边缘不断变化,直到converge.

5.(我们的)超像素算法
由于本回答的重点在于科普超像素,这里即为简略地介绍我们的算法。
首先,用到了矩形区域初始化。
然后,在每个矩形中,我们用整数规划刻画了Discrete Potts model(y是像素颜色,w是拟合值),希望求得全局最优的分割(具体模型和算法请见【3】)。

最后,所有矩阵内部完成分割以后(可以并行计算),整个图的超像素便出现了!
亮点:由于Potts模型既做分割,又能去噪,因此我们把该模型用于带噪声图片的分割!
5.State-of-the-art 噪声图片的超像素算法
由于我们超像素的以上特性,我们在标准数据集BSDS500上用3中三个指标进行了大量的带噪声图片超像素的实验。
我们甚至在使用其他算法前,先给图片去噪,再使用其他算法。
结果:不论怎么“优待”其他算法,我们的算法取得了最好的结果(具体请见【2】)。
6.参考资料
【0】M. Storath etl"Joint image reconstruction and segmentation using the Potts model" Inverse Problems, 2015。Code: mstorath/Pottslab
【1】D Stutz etl,Superpixels: an evaluation of the state-of-the-art,
Computer Vision and Image Understanding 166, 1-27
该文作者是德国亚琛工大计算机本科,马普所计算机博士生,对比了几乎所有有开源代码的超像素算法。作者还把论文中evaluate指标的算法开源了,参考:davidstutz/superpixels-revisited
【2】R.shen etl, Discrete Potts Model for Generating Superpixels on Noisy Images
【3】R.shen etl, A First Derivative Potts Model for Segmentation and Denoising Using ILP
更多运筹学、人工智能干货,敬请关注:『运筹OR帷幄』大数据人工智能时代的运筹学
更多超像素相关参考资料,请关注微信公众号“运筹OR帷幄”并在后台回复关键词“超像素”免费获取。