摘要
因果表示学习的任务旨在揭示影响低层观测数据的、潜在的更高层因果变量。然而,在允许潜在变量之间存在瞬时因果关系的同时,从观测数据中识别出真实的潜在因果变量仍然是一个挑战。为此,我们从分析从观测数据中识别潜在变量时存在的三个内在不确定性问题入手:传递性、排列不确定性和缩放不确定性。我们发现,传递性是阻碍潜在因果变量可识别性的关键因素。为了解决由传递性导致的不可识别问题,我们引入了一种新颖的可识别性条件,即底层潜在因果模型满足一个线性高斯模型,其中因果系数和高斯噪声的分布由一个附加的观测变量进行调制。在某些假设下,包括存在一个潜在因果影响消失的参考条件,我们可以证明潜在因果变量能够被识别到仅有的平凡排列和缩放变换。当该参考条件对部分潜在变量子集不成立时,我们仍能获得部分可识别性的结果。此外,基于这些理论结果,我们提出了一种新方法,称为结构化因果变分自编码器,它能够直接学习因果表示及其之间的因果关系,以及从潜在因果变量到观测变量的映射。在合成数据和真实数据上的实验结果证明了该方法的可识别性和一致性,以及其在学习因果表示方面的有效性。FINISHED