正态分布标准化
对于一个服从高斯分布的随机变量x ∼ N ( μ , σ 2 ) x \sim \mathcal N(\mu,\sigma^2) x ∼ N ( μ , σ 2 ) ,计算其均值μ \mu μ 和标准差σ \sigma σ 。
其概率密度函数:
f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} f ( x ) = 2 π σ 2 1 e − 2 σ 2 ( x − μ ) 2
所谓“标准正态分布”,就是取 μ = 0 \mu=0 μ = 0 一般 σ 2 = 1 \sigma^2=1 σ 2 = 1 正态分布给出的。
其概率密度函数:
f ( x ) = 1 2 π e − x 2 2 f(x) =\frac{1}{\sqrt{2 \pi}} e^{\frac{-x^2} 2}
f ( x ) = 2 π 1 e 2 − x 2
对于任意一个正态分布的概率密度函数积分:
∫ f ( x ) d x = ∫ 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 d x = ∫ 1 σ 2 π e − 1 2 ( x − μ σ ) 2 d x = ∫ 1 2 π e − 1 2 ( x − μ σ ) 2 d ( x − μ σ ) \begin{aligned}
\int f(x) \mathrm d x &= \int \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{(x-\mu)^2}{2 \sigma^2}} \mathrm dx
\\
&= \int \frac {1}{\sigma \sqrt {2\pi}}e^{-\frac 1 2 \left( \frac{x-\mu}{\sigma} \right)^2} \mathrm d x
\\
&= \int \frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \mathrm d\left(\frac{x-\mu}{\sigma}\right)
\end{aligned} ∫ f ( x ) d x = ∫ 2 π σ 2 1 e − 2 σ 2 ( x − μ ) 2 d x = ∫ σ 2 π 1 e − 2 1 ( σ x − μ ) 2 d x = ∫ 2 π 1 e − 2 1 ( σ x − μ ) 2 d ( σ x − μ )
令z = x − μ σ z = \frac{x-\mu}{\sigma} z = σ x − μ ,上边公式就变成了:
∫ 1 2 π e − z 2 2 d z \int \frac{1}{\sqrt{2 \pi}} e^{-\frac{z^2}{2}} \mathrm dz ∫ 2 π 1 e − 2 z 2 d z
所以我们可以得到新的随机变量z = x − μ σ z = \frac{x-\mu}{\sigma} z = σ x − μ ,符合标准正态分布。
所以对于一个服从高斯分布的随机变量x ∼ N ( μ , σ 2 ) x \sim \mathcal N(\mu,\sigma^2) x ∼ N ( μ , σ 2 ) ,取z = x − μ σ z = \frac{x - \mu}{\sigma} z = σ x − μ 即可将其转化为标准高斯分布z ∼ N ( 0 , 1 ) z \sim \mathcal N(0,1) z ∼ N ( 0 , 1 ) 。
VAE中的参数重整化
VAE原文:Thesis.pdf (uva.nl)
原来我们要从潜变量空间上随机 采样一个值,就相当于从q ϕ ( z ∣ x ) = N ( μ , σ 2 ) \mathrm{q}_\phi(\mathbf{z} | \mathbf{x}) = \mathcal{N}\left(\mu, \sigma^2\right) q ϕ ( z ∣ x ) = N ( μ , σ 2 ) 中直接取z \mathbf z z 。
这样在反向传播过程中,“随机”这个过程是不可微的,因此无法使用梯度下降更新网络参数。因此我们需要将z \mathbf z z 的产生变成一个确定过程。
借助正态分布标准化,取ϵ = z − μ σ \epsilon = \frac{\mathbf z-\mu}{\sigma} ϵ = σ z − μ ,我们可以知道ϵ ∼ N ( 0 , I ) \epsilon \sim \mathcal{N}(0, \boldsymbol{I}) ϵ ∼ N ( 0 , I ) ,现在z = μ + ϵ × σ \mathbf z=\mu+\epsilon \times \sigma z = μ + ϵ × σ 。
标准化之后,还是用的q ϕ ( z ∣ x ) \mathrm{q}_\phi(\mathbf{z} | \mathbf{x}) q ϕ ( z ∣ x ) 的μ \mu μ 和σ \sigma σ ,但是z \mathbf z z 从q ϕ ( z ∣ x ) = N ( μ , σ 2 ) \mathrm{q}_\phi(\mathbf{z} | \mathbf{x}) = \mathcal{N}\left(\mu, \sigma^2\right) q ϕ ( z ∣ x ) = N ( μ , σ 2 ) 中直接采样,变成了通过确定性方程g ( ϕ , x , ϵ ) = μ + ϵ × σ \mathrm g( \phi, \mathbf{x}, \epsilon) =\mu+\epsilon \times \sigma g ( ϕ , x , ϵ ) = μ + ϵ × σ 得到的。
采样z \mathbf z z 变成从标准正态分布中采样一个ϵ \epsilon ϵ ,将随机性转嫁到了ϵ \epsilon ϵ 上,不影响整体的梯度传导。
也就是 Reparameterization Trick
DDPM中的参数重整化
Given a data point sampled from a real data distribution x 0 ∼ q ( x ) \mathbf{x}_0 \sim q(\mathbf{x}) x 0 ∼ q ( x ) , let us define a forward diffusion process in which we add small amount of Gaussian noise to the sample in T T T steps, producing a sequence of noisy samples x 1 , … , x T \mathbf{x}_1, \ldots, \mathbf{x}_T x 1 , … , x T . The step sizes are controlled by a variance schedule { β t ∈ ( 0 , 1 ) } t = 1 T \left\{\beta_t \in(0,1)\right\}_{t=1}^T { β t ∈ ( 0 , 1 ) } t = 1 T
潜变量的后验分布为:
q ( x 1 : T ∣ x 0 ) = ∏ t = 1 T q ( x t ∣ x t − 1 ) q\left(\mathbf{x}_{1: T} \mid \mathbf{x}_0\right)=\prod_{t=1}^T q\left(\mathbf{x}_t \mid \mathbf{x}_{t-1}\right) q ( x 1 : T ∣ x 0 ) = t = 1 ∏ T q ( x t ∣ x t − 1 )
拆开看x t \mathbf x_t x t 的后验分布如下:
q ( x t ∣ x t − 1 ) = N ( x t ; 1 − β t x t − 1 , β t I ) q\left(\mathbf{x}_t \mid \mathbf{x}_{t-1}\right)=\mathcal{N}\left(\mathbf{x}_t ; \sqrt{1-\beta_t} \mathbf{x}_{t-1}, \beta_t \mathbf{I}\right) q ( x t ∣ x t − 1 ) = N ( x t ; 1 − β t x t − 1 , β t I )
然后我们就可以认为每个时间步t t t 的图像是从均值为μ t = 1 − β t x t − 1 {\mu}_t = \sqrt{1 - \beta_t} \mathbf {x}_{t-1} μ t = 1 − β t x t − 1 、方差为σ t 2 = β t \sigma^2_t = \beta_t σ t 2 = β t 的高斯分布中画出来的。
借助参数重整化可以写成:
x t = 1 − β t x t − 1 + β t ϵ \mathbf {x}_t = \sqrt{1 - \beta_t}\mathbf {x}_{t-1} + \sqrt{\beta_t} \mathbf{\epsilon} x t = 1 − β t x t − 1 + β t ϵ
其中ϵ ∼ N ( 0 , I ) \mathbf{\epsilon} \sim \mathcal{N}(\mathbf{0}, \mathbf{I}) ϵ ∼ N ( 0 , I ) ,是从标准高斯分布中采样的噪声。
本文正在参加「金石计划」