基于观测数据的因果消偏方法 整理

126 阅读1分钟

背景

本周主要阅读了DataFun中的一篇分享,讲到《基于观测数据的因果推断技术》。这里整理了其中,使用观测数据进行因果纠偏的方法如下。

方法一 基于RCT数据和观测性样本的重采样算法

RCT融合观测数据,麻烦的是依然需要进行随机实验,这里不再展开。

方法二 特征分解

核心思想:将建模特征中把与因果效应无关的变量(调整变量)和与因果效应相关的变量(工具变量、混杂变量等)通过设计不同的损失函数分离出来。
相关工作:D2VD。设计接近正交的矩阵分解把调整变量和混杂变量进行分离。这种分离的好处是可以减少预估因果效应的方差,使得因果效应的的预估值更加准确。 image.png AutoIV:将D2VD没有特别强调的工具变量单独拎了出来进行分离。抽空读下原文。 image.png

在资源分配中的应用

image.png

方法三 双重机器学习

方法四 后门调整

image.png 参考: juejin.cn/post/720175…

方法五 前门调整

具体而言,我们首先估计干预到中介变量的因果效应,然后再估计中介变量到最终 outcome 之间的因果效应。 image.png