本文总结多元正态分布的条件分布与边缘分布,证明不难,但都比较繁琐,故不做详细证明,有兴趣可以参考Pattern Recognition and Machine Learningy一书。
1 正态分布的条件分布
对于联合正态分布变量x∼N(μ,Σ),定义精度矩阵(the precision matrix)为协方差矩阵的逆,即Λ≡Σ−1,做分块处理:
x=[xaxb],μ=[μaμb],Σ=[ΣaaΣbaΣabΣbb],Λ=[ΛaaΛbaΛabΛbb]
那么,条件分布
p(xa∣xb)=N(μa∣b,Λ−1)
其中
μa∣b=μa−Λaa−1Λab(xb−μb)
如何证明?证明的关键在于,对于正态分布的密度函数来说,它的指数项都可以写作
−21(x−μ)′Σ−1(x−μ)=−21x′Σ−1x+x′Σ−1μ+C
其中C是常数项。
因此,只需将联合分布的密度函数展开,再将其关于xa的二次项、一次项整理出来,利用其系数即可得到Σ−1和μ的表达式。
2 正态分布的边缘分布
按与上一节同样的设定,xa的边缘分布为
p(xa)=N(xa∣μa,Σaa)
如何证明?只需将原来的密度函数对xb积分即可,利用配方,积分并不困难。
或者,取A=[I,0],则有Ax=xa∼N(Aμ,AΣA′),展开后即可直接得到上面的结果。