5.3.1 Continuous inputs 公式5.49 5.50

65 阅读1分钟

推导公式 (5.49) 和 (5.50)

我们从图中的条件开始推导公式 (5.49) 和 (5.50)。根据图中的公式和描述,假设类条件密度为高斯分布,并且类别 CkC_k 的条件概率密度 p(xCk)p(x|C_k) 表达为:

p(xCk)=1(2π)D/2Σ1/2exp{12(xμk)Σ1(xμk)}.p(x|C_k) = \frac{1}{(2\pi)^{D/2} |\Sigma|^{1/2}} \exp\left\{-\frac{1}{2} (x - \mu_k)^\top \Sigma^{-1} (x - \mu_k)\right\}.

然后我们通过贝叶斯公式计算后验概率 p(Ckx)p(C_k|x)。这里讨论只有两类 C1C_1C2C_2 的情况。两类的后验概率比值为:

p(C1x)p(C2x)=p(xC1)p(C1)p(xC2)p(C2).\frac{p(C_1|x)}{p(C_2|x)} = \frac{p(x|C_1)p(C_1)}{p(x|C_2)p(C_2)}.

取对数后,得到:

lnp(C1x)p(C2x)=lnp(xC1)p(xC2)+lnp(C1)p(C2).\ln \frac{p(C_1|x)}{p(C_2|x)} = \ln \frac{p(x|C_1)}{p(x|C_2)} + \ln \frac{p(C_1)}{p(C_2)}.

p(xC1)p(x|C_1)p(xC2)p(x|C_2) 的高斯分布形式代入,计算对数:

lnp(xC1)p(xC2)=12(xμ1)Σ1(xμ1)+12(xμ2)Σ1(xμ2).\ln \frac{p(x|C_1)}{p(x|C_2)} = -\frac{1}{2}(x - \mu_1)^\top \Sigma^{-1} (x - \mu_1) + \frac{1}{2}(x - \mu_2)^\top \Sigma^{-1} (x - \mu_2).

展开二次型 (xμk)Σ1(xμk)(x - \mu_k)^\top \Sigma^{-1} (x - \mu_k)

(xμk)Σ1(xμk)=xΣ1x2μkΣ1x+μkΣ1μk.(x - \mu_k)^\top \Sigma^{-1} (x - \mu_k) = x^\top \Sigma^{-1} x - 2 \mu_k^\top \Sigma^{-1} x + \mu_k^\top \Sigma^{-1} \mu_k.

代入并整理:

lnp(xC1)p(xC2)=12xΣ1x+μ1Σ1x12μ1Σ1μ1+12xΣ1xμ2Σ1x+12μ2Σ1μ2.\ln \frac{p(x|C_1)}{p(x|C_2)} = -\frac{1}{2}x^\top \Sigma^{-1} x + \mu_1^\top \Sigma^{-1} x - \frac{1}{2}\mu_1^\top \Sigma^{-1} \mu_1 + \frac{1}{2}x^\top \Sigma^{-1} x - \mu_2^\top \Sigma^{-1} x + \frac{1}{2}\mu_2^\top \Sigma^{-1} \mu_2.

取消 xΣ1xx^\top \Sigma^{-1} x 项,合并剩余项:

lnp(xC1)p(xC2)=(μ1μ2)Σ1x12μ1Σ1μ1+12μ2Σ1μ2.\ln \frac{p(x|C_1)}{p(x|C_2)} = (\mu_1 - \mu_2)^\top \Sigma^{-1} x - \frac{1}{2} \mu_1^\top \Sigma^{-1} \mu_1 + \frac{1}{2} \mu_2^\top \Sigma^{-1} \mu_2.

结合 lnp(C1)p(C2)\ln \frac{p(C_1)}{p(C_2)},我们定义权重向量 w\mathbf{w} 和偏置项 w0w_0

w=Σ1(μ1μ2),\mathbf{w} = \Sigma^{-1} (\mu_1 - \mu_2),
w0=12μ1Σ1μ1+12μ2Σ1μ2+lnp(C1)p(C2).w_0 = -\frac{1}{2} \mu_1^\top \Sigma^{-1} \mu_1 + \frac{1}{2} \mu_2^\top \Sigma^{-1} \mu_2 + \ln \frac{p(C_1)}{p(C_2)}.

于是后验概率可以写为逻辑斯谛函数形式:

p(C1x)=σ(wx+w0),p(C_1|x) = \sigma(\mathbf{w}^\top x + w_0),

其中 σ(z)=11+exp(z)\sigma(z) = \frac{1}{1 + \exp(-z)}。这就得到了 (5.48)、(5.49) 和 (5.50)。