
书中3.45这个公式只讲了大体由来,下面将详细推导一下
(2π)D/2∣Σ∣1/21∫exp{−21zTΣ−1z}zzTdz(1)
我们把变换 yj=ujTz 写成完整的形式 y=UTz,由于U是正交矩阵所以有z=Uy
然后由雅可比行列式J 定义为
J=∂y∂z=∣U∣
因此当设计积分变换时可以有如下变换
dz=U∣y∣dy=dy
现在回到公式(1),我们把
zzT=(Uy)(Uy)T=UyyTUT
代入到公式(1)之后得到
(2π)D/2∣Σ∣1/21∫exp{−21yTUTΣ−1Uy}UyyTUTdy
由书中3.44可知Σ=UΛUT,将上述代入公式我们得到
(2π)D/2∣Σ∣1/21∫exp{−21yTΛ−1y}UyyTUTdy
分离下得到
(2π)D/2∣Σ∣1/21i=1∑Dj=1∑DuiujT∫exp{−k=1∑D2λkyk2}yiyjdy
由于 y 是一个标准正态分布的向量,我们可以将积分分离为多个一维积分:
∫exp{−21k=1∑Dλkyk2}yiyjdy=k=1∏D∫exp{−2λkyk2}dyk⋅∫yiyjexp{−2λi+2λjyi2+yj2}dyidyj(2)
对于 i=j,yi 和 yj 是独立的标准正态随机变量。因此,我们可以进一步简化积分:
∫yiyjexp{−2λiyi2}exp{−2λjyj2}dyidyj
分别计算这两个积分:
∫yiexp{−2λiyi2}dyi=0
∫yjexp{−2λjyj2}dyj=0
这是因为对于任何标准正态分布的随机变量 yi 或 yj,其期望值为零,即:
E[yi]=0
E[yj]=0
因此 :
∫yiyjexp{−2λiyi2}exp{−2λjyj2}dyidyj=0
所以 等式(2)在i=j 时 为 0,问题的重点就变为当i=j时的计算:
∫exp{−k=1∑D2λkyk2}yi2dy(3)
将指数项分解为各维度独立的形式:
exp(−k=1∑D2λkyk2)=k=1∏Dexp(−2λkyk2)
将积分按维度分解,并单独处理第 ( i )-维:
∫k=1∏Dexp(−2λkyk2)yi2dy=k=i∏∫exp(−2λkyk2)dyk⋅∫yi2exp(−2λiyi2)dyi
注意:这里避免了对第 ( i )-维指数项 exp(−2λiyi2) 的重复计算。
计算每一部分
- 普通高斯积分(非 i -维部分):
k=i∏∫exp(−2λkyk2)dyk=k=i∏2πλk
- 带权重 yi2 的高斯积分(第 i-维部分):
∫yi2exp(−2λiyi2)dyi=λi2πλi
将两部分结果相乘,得到:
k=i∏2πλk⋅λi2πλi
或者写成更紧凑的形式:
(k=1∏D2πλk)⋅λi(4)
所以(4)即为(3)的计算结果,将其带回(1)就能得到书中结论