持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第24天,点击查看活动详情
内容参考了斯坦福大学 Coursera 公开课《概率图模型》,分享内容并不限于课程,在原有课程内容基础加入个人理解,以及扩展的内容
在开始今天内容,我们来介绍一个完成例子。这是一个有趣的问题,首先就是一个学生是否能够拿到推荐推荐资格,学校会根据成绩来决定是否推荐,也就是说成绩是影响学生是否能够拿到推荐资格直接原因,然后成绩有受到课程难易程度和学生智力水平的影响,那么这两个因素也就是间接会影响到是否拿到推荐资格。还有一个有趣的随机变量,就是高考成绩 SAT

| 随机变量名称 | 说明 |
|---|
| Grade | 成绩 |
| Course Difficulty | 课程难易程度 |
| Student Intelligence | 学生智力水平 |
| Studeng SAT | 学生的高考成绩 |
| Reference Letter | 是否推荐 |
P(G,D,I,S,L)
-
P(D)
| d0 | d1 |
| --- | --- |
| 0.6 |0.4 |
-
P(I)
| i0 | i1 |
| --- | --- |
| 0.7 |0.3 |
-
P(G|I,D)
| | d1 |d0 | d1 |
| --- | --- |--- | --- |
| i0,d0 |0.3 |0.4 |0.3 |
| i0,d1 |0.05 |0.25 |0.7 |
| i1,d0 |0.9 |0.08 |0.02 |
| i1,d1 |0.5 |0.3 |0.2 |
-
P(S|I)
| | s0 | s1 |
| --- | --- |--- |
| i0|0.95 |0.05 |
| i1|0.2 |0.8 |
P(G,D,I,S,L)=P(D)P(I)P(G∣I,D)P(S∣I)P(L∣G)
P(d0,i1,g3,s1,l1)=0.6×0.3×0.02×0.8×0.01
贝叶斯网络
关于贝叶斯网络定义是有向无环图(DAG) 每一个结点表示一个随机变量 X1,⋯,Xn,对于每一个随机变量 Xi 的 CPD P(Xi∣ParG(Xi)), 贝叶斯网络表示为一个联合概率
P(X1,⋯,Xn)=i=1∏P(Xi∣ParG(Xi))
那么我们就来看看这个联合概率是否符合概率分布,首先 P(X) 是否为大于 0,我们知道 P(X) 是一系列 CPD 的乘积,因为 CPD 是非负的,所以 P(X) 当然是大于 0 的。我们知道 ∑P(X)=1 也就是要满足概率求和 1 的条件。
D,I,G,S,L∑P(D,I,G,S,L)=D,I,G,S,L∑P(D)P(I)P(G∣I,D)P(S∣I)P(L∣G)
D,I,G,S,L∑P(D,I,G,S,L)=D,I,G,S∑P(D)P(I)P(G∣I,D)P(S∣I)L∑P(L∣G)
我们知道 CPD 是 L 是给定 G 的概率分布
D,I,G,S,L∑P(D,I,G,S,L)=D,I,G∑P(D)P(I)P(G∣I,D)S∑P(S∣I)
概率 P(X) 的因子分解是基于图 G 分解为一个个因子连乘的形式。
P(X1,⋯,Xn)=i=1∏P(Xi∣ParG(Xi))