概率图模型(2)——马尔科夫随机场

3,093 阅读3分钟

概念导图



1. MarKov随机场的直观理解

干货|如何轻松愉快的理解条件随机场(CRF)?



2. 一些基本概念

2.1 无向图

无向图
在无向图中,A、B、C、D为顶点,各顶点之间的连接线称为边。

2.2 概率图:

表达概率分布的方式。图中的每个节点表示一个随机变量,与之相连的则表示了各随机变量之间的概率依赖关系。所以,表示联合概率分布。以上图为例,设有联合概率分布P(Y)Y一组随机变量,那么在图中,节点A表示一个随机变量Y_A节点A节点B表示随机变量A随机变量B之间的依赖关系。

  • 无向图表示MarKov的三个性质:
    • 成对马尔科夫性
      成对马尔科夫示意图
      节点u、v互不相连,其他所有节点记为O,其所对应的随机变量为Y_u, Y_vY_O。此时:在给定随机变量组Y_O的情况下,Y_u, Y_v条件独立,即有
P(Y_u, Y_v|Y_O)=P(Y_u|Y_O) P(Y_v|Y_O)
  • 局部马尔可夫性
    局部马尔科夫示意图
    在图中任意取一个结点,将与之有边相连的结点均记为W,O是除v、W之外的所有点,v表示随机变量Y_v,W表示随机变量组为Y_W,O表示随机变量组Y_O,则:在给定随机变量组Y_W的情况下,Y_v, Y_O条件独立,即有
\begin{align}
P(Y_v, Y_O|Y_W)&=P(Y_v|Y_W) P(Y_O|Y_W)\\\\
\Rightarrow \frac{P(Y_v, Y_O, Y_W)}{P(Y_W)}&=P(Y_v|Y_W) \frac{P(Y_O, Y_W)}{P(Y_W)}\\\\
\Rightarrow \frac{P(Y_v, Y_O, Y_W)}{P(Y_O, Y_W)}&=P(Y_v|Y_W)\\\\
\Rightarrow P(Y_v| Y_O, Y_W)&=P(Y_v|Y_W) 
\end{align}
  • 全局马尔科夫性
    全局马尔科夫示意图
    在图中设有集合A,B是被集合C分开的任意结点集合,其所对应的随机变量组分别为Y_A.Y_B,Y_C,则在此条件下,认定随机变量组Y_C条件下,随机变量组Y_A.Y_B条件独立的。
P(Y_A, Y_B|Y_C)=P(Y_A|Y_C) P(Y_B|Y_C)

2.3 概率图模型:

如果联合概率分布Y满足成对、局部或全局马尔可夫性,则该联合概率分布为概率无向图模型(马尔科夫随机场)。

  • 概率图模型中的团和最大团:

一条小团团
在无向图中任何两个结点均有边连接的结点子集称为,例如,在下图中,假设有随机变量1,2,则\left \{Y_1,Y_2 \right \}构成了一个\left \{Y_1,Y_4 \right \}未构成团。

此时,再往中加入任意一个结点,若集合不满足成的条件,则称加入结点之前的最大团。如,往集合\left \{Y_1,Y_2 \right \}中加入Y_2,依然满足成的条件,继续加入结点Y_4,由于Y_1不与Y_4相连,故而\left \{Y_1,Y_2, Y_3 \right \}最大团

无向图的团和最大团

  • 概率图模型中因式分解

谈这个问题之前,先看一看贝叶斯模型和概率图模型的区别:

  • 两个贝叶斯模型
  1. 贝叶斯网络1
    贝叶斯网络1的联合概率P(R, C, W, S)=P(R)P(C)P(W|C,R)P(S|W)

  2. 贝叶斯网络2

贝叶斯网络2是一个无效的网络,因为按照公式有

P(A,B,C)=P(B|A)P(C|B)P(A|C)
=P(B,C|A)P(A|C)=P(ABC|C)
  • 概率图模型: 但是在概率图模型中就不一样了
    概率图模型
    有人找了一个函数,能够使得,概率图中的最大团们有:
P(A,B,C,D,E)\propto \Psi(A,B)\Psi(B,C)\Psi(B,D)\Psi(C,E)\Psi(D,E)

概率图模型中因式分解:将概率图中的联合概率分布表示为其最大团上的随机变量函数成绩的形式。

\begin{align}
P(Y)=&\frac{1}{Z} \prod_{C}\Psi _C(Y_C) \tag{2.1}\\
Z=&\sum_{Y}\prod_{C}\Psi _C(Y_C) \tag{2.2}
\end{align}

其中,C是无向图的最大团,Y_C是C的结点对应的随机变量,\Psi _C(Y_C)势函数,是C上定义的严格正函数,乘积是在无向图所有的最大团上进行的。

  • 概率图模型与贝叶斯网络的区别
  1. 链状模型 注意,在概率图模型中,\Psi (A,B)\Psi (B,C)不一定只有图中的对应关系。

    链状模型

  2. 共享一个父结点

    共同祖先

  3. 共享一个孩子结点 贝叶斯网络:

    贝叶斯网络

概率图模型
根据成对马尔科夫性的定义,该图中A、B是相互独立的,因此图中右侧所列等式在该情况下并不成立。此时计算联合概率,需要改成下图的形式:
image.png

2.4 小结

  1. Markov随机场中各团之间的关系都是独立的。
  2. 贝叶斯网络不等同于Markov随机场

3. Hammersley-Clifford定理

Hammersley-Clifford定理揭示了为什么概率无向图的联合概率分布P(Y)可以表示为公式(2.1)(2.2). 具体证明过程在这里。


参考文献