变分推断(variational inference)/variational EM (1)

82 阅读1分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 31 天,点击查看活动详情

诸神缄默不语-个人CSDN博文目录

由于我真的,啥都不会,所以本文基本上就是,从0开始。 我看不懂的博客就是写得不行的博客。所以我只写我看得懂的部分。 持续更新。

@[toc]

1. 琴生不等式

在这里插入图片描述

证明加权形式(令a1=a2==an=1na_{1}=a_{2}=\cdots=a_{n}=\dfrac{1}{n}即为一般形式):

首先证明a1x1+a2x2++anxna_1x_1+a_2x_2+\dots+a_nx_n仍然在[a,b][a,b]内(另一种证明思路见百度百科,即参考资料链接1): 不妨设x1x2xnx_1\geq x_2\geq\dots\geq x_n a1x1+a2x2++anxn=a1(x1x2)+(a1+a2)(x2x3)++(a1+a2++an1)(xn1xn)+(a1+a2++an)xna_1x_1+a_2x_2+\dots+a_nx_n=a_1(x_1-x_2)+(a_1+a_2)(x_2-x_3)+\dots+(a_1+a_2+\dots+a_{n-1})(x_{n-1}-x_n)+(a_1+a_2+\dots+a_n)x_n (这个我自己想是想不出来的,但是我可以理解。大概展开是这样的:) 在这里插入图片描述 每一项的值都是[0,xixi+1][0,x_i-x_{i+1}],最后一项是xnx_n,所以整个多项式的取值范围是[xn,x1][x_n,x_1](右界一般情况下能不能取到我还没琢磨明白,反正a1=1a_1=1时肯定可以,别的情况我还没想到),显然是在[a,b][a,b]范围内的

用数学归纳法证明不等式: ①当n=1n=1f(x)f(x)f(x)\leq f(x)显然成立 ②当n=2n=2时: 设x1x2x_1\leq x_2 函数曲线在(x1,f(x1)),(x2,f(x2))(x_1,f(x_1)),(x_2,f(x_2))所构成的直线之下,设这条直线为g(x)=mx+ng(x)=mx+na1f(x1)+a2f(x2)=a1(mx1+n)+a2(mx2+n)=m(a1x1+a2x2)+n=g(a1x1+a2x2)a_1f(x_1)+a_2f(x_2)=a_1(mx_1+n)+a_2(mx_2+n)=m(a_1x_1+a_2x_2)+n=g(a_1x_1+a_2x_2) 所以a1f(x1)+a2f(x2)=g(a1x1+a2x2)f(a1x1+a2x2)a_1f(x_1)+a_2f(x_2)=g(a_1x_1+a_2x_2)\geq f(a_1x_1+a_2x_2)得证 ③假设对任意n2n\geq2不等式都成立,即f(a1x1+a2x2+a3x3++anxn)a1f(x1)+a2f(x2)++anf(xn)f(a_1x_1+a_2x_2+a_3x_3+\dots+a_nx_n)\leq a_1f(x_1)+a_2f(x_2)+\dots+a_nf(x_n) 则当n=n+1n=n+1时:

f(a1x1+a2x2+a3x1++anxn+an+1xn+1)=f((a1+a2++an)a1x1+a2x2+a3x1++anxna1+a2++an+an+1xn+1)(a1+a2++an)f(a1x1+a2x2+a3x1++anxna1+a2++an)+an+1f(xn+1)=(a1+a2++an)f(a1x1a1+a2++an+a2x2a1+a2++an++anxna1+a2++an)+an+1f(xn+1)(a1+a2++an)[a1f(x1)a1+a2++an+a2f(x2)a1+a2++an++anf(xn)a1+a2++an]+an+1f(xn+1)=a1f(x1)+a2f(x2)++anf(xn)+an+1f(xn+1)\begin{aligned} f(a_1x_1+a_2x_2+a_3x_1+\dots+a_nx_n+a_{n+1}x_{n+1})&=f\Big((a_1+a_2+\cdots+a_n)\frac{a_1x_1+a_2x_2+a_3x_1+\dots+a_nx_n}{a_1+a_2+\cdots+a_n}+a_{n+1}x_{n+1}\Big)\\ &\leq(a_1+a_2+\cdots+a_n)f\big(\frac{a_1x_1+a_2x_2+a_3x_1+\dots+a_nx_n}{a_1+a_2+\cdots+a_n}\big)+a_{n+1}f(x_{n+1})\\ &=(a_1+a_2+\cdots+a_n)f\big(\frac{a_1x_1}{a_1+a_2+\cdots+a_n}+\frac{a_2x_2}{a_1+a_2+\cdots+a_n}+\dots+\frac{a_nx_n}{a_1+a_2+\cdots+a_n}\big)+a_{n+1}f(x_{n+1})\\ &\leq(a_1+a_2+\cdots+a_n)\Big[\frac{a_1f(x_1)}{a_1+a_2+\cdots+a_n}+\frac{a_2f(x_2)}{a_1+a_2+\cdots+a_n}+\dots+\frac{a_nf(x_n)}{a_1+a_2+\cdots+a_n}\Big]+a_{n+1}f(x_{n+1})\\ &=a_1f(x_1)+a_2f(x_2)+\dots+a_nf(x_n)+a_{n+1}f(x_{n+1}) \end{aligned}

不等式得证