概率图模型基础(1)——简介

746 阅读1分钟

1. 分布及其因子操作

1.1 联合分布

以学生成绩为例:共有以下几个变量:Intelligence(i^0=low, i^1)、Diffculty(d^0=easy. d^1=hard)、Grade(g^1=A, g^2=B, g^3=C)。

notation

其联合分布为:

Joint Distribution

这三种变量的组合共有2*2*3=12种。

1.2 联合分布与条件分布(Condition Probability Distribution, CPD)的一些计算

1. Reduction

设置筛选条件:以选取成绩为A的人为例,把所有得A的人(G=g^1)选出来。

Conditioning

2. Renormalization

重新标准化,将筛选出来的值除以其概率和,保证标准化后的概率和为1。

Renormalization

3. Marginalization

计算边缘概率

Marginalization


2. Factors

2.1 Factor定义

factory 可以理解为一种函数或者表格。其目的是将变量(X_1,...,X_k)映射到某一个实数集。 例如:

  • 在图Joint Distribution中,I,D,G就是一种factor。对于其中的每一行,都有一个对应的实数。
  • 在图normalization中,I,D有是一种factor,没有G的原因是其他两个变量与变量G没有关系,G在其中视为常量即可。

2.2 Factor的运算

product

类似于数据库中的join关键字连接。

add

对应1.2 节中的Marginalization。

Marginalization

Reduction

对应1.2 节中的Reduction。

Reduction

2.3. 符号抽象

为了方便,我们通常将包括但不限于上述的操作符抽象为:

image.png


4. 参考来源

  • 斯坦福公开课——Probabilistic Graphical Models