【VAE】青春AE女郎不会梦到VAE学姐

71 阅读1分钟
AEVAE
主要作用:学习数据的隐藏表示,不能生成新数据不仅可以学习数据的隐藏表示,还可以用于生成新数据
最小化重构loss最小化重构loss + latent loss

image.png AE主要由两部分构成:编码器和解码器。
编码器获取数据样本并将其信息转换为某个向量。解码器将这个向量取出并重新构建输入样本。
那既然都要求编码器的输入和解码器的输出尽量接近了,那这么做到底图啥呢?
原因是,在使用AE时,我们并不关心其输入,而是关心中间的这个latent vector,也就是编码器将输入编码的隐向量,因为这个向量是输入的图片或音频等的潜在表示,且可以被计算机所理解。这个向量的作用在该模型中的作用可能有限,但我们可以将这个向量提供给其他架构来做一些工作。例如

image.png 在这篇论文中提出的这个模型,起作用是根据一个人的推文来推断他的位置。
在这个模型中,三个隐藏层就是三个AE,用来表示来自推文的输入文本。然后结果会被传输到两个输出层,其中一个(model 1)用来确定这篇推文是在美国的哪个州被发出的,另一个(model 2)用来估计发推文的用户的经纬度。