Node Embeding for Graph Similarity 的一些批注

591 阅读2分钟

Earth Mover's Distance 原理解析

Earth Mover's Distance距离即EMD,是由2000年IJCV期刊文章《The Earth Mover's Distance as a Metric for Image Retrieval》提出的一种图像相似度度量方法,从文章标题也可以得知,最初EMD的概念是用于图像检索的。后来因为其各种优点,逐渐用到其他方面的相似度度量该部分主要理解EMD的概念与原理

几个主要的概念

  • signature 定义为一系列的重要特征,可以写作s=(m,w),m是某个特征,w是该特征的权重。

    P=\{ (P_1,w_{p_1}),(P_2,w_{p_2}),(P_3,w_{p_3}),...,(P_M,w_{p_M})\}, Q=\{ (Q_1,w_{q_1}),(Q_2,w_{q_2}),(Q_3,w_{q_3}),...,(Q_N,w_{Q_N})\}

  • EMD本身是一个线性规划问题。假设p_i是一张图像的某个特征,w_{p_i}是特征p_i的权重,而q_j是另一张图像的某特征,w_{q_j}是特征w_{q_j}的权重。

  • 一个特征P集合和特征Q集合之间的距离矩阵 [d_{ij}],每一项[d_{ij}]代表P_iQ_j的距离(比如L1、L2距离等),可知 [d_{ij}]是个M*N矩阵。

目标

希望找到一个flow,它也是一个矩阵 F=[f_{ij}],每一项f_{ij}代表从P_iQ_j的流动数量,d_{ij}p_i位置到q_j位置的代价(距离),从而最小化全局的代价函数:

WORK(P,Q,E)=\sum_{i=1}^{m} \sum_{j=1}^{n}d_{ij}f_{ij}

这个流动量就是线性规划的解

  • 线性规划表达式:
    线性规划表达式
  • 线性规划示意图
    这个问题形象示意图
  • 对于这篇论文来说,子图之间的相似度,线性规划表达式:

Pyramid Match Graph Kernel (Histogram intersection 直方图交叉核)原理解析

方法最初来自《The Pyramid Match Kernel:Discriminative Classification with Sets of Image Features》这篇论文,用来对特征构成的直方图进行相似度匹配.

基本原理

  • PM的工作原理是将特征空间划分为越来越大的区域,并对每个级别的匹配进行加权求和。

  • 如果他们属于同一地区,则说两点相符。较大区域内的匹配加权低于较小区域的匹配。

其中 D =2^ld l from 0 to L

  • 一维示意图

    直方图交叉核一维示意图