本文正在参加 人工智能创作者扶持计划
为了解决其他变量/协变量干扰因果效应的问题,老爷子提出了后门准则 & 前门准则。
后门准则
- 假设在变量图中,想要探究 X→Y的因果效应
- 但是图中总有一些指向X的、看得见(图中有显示)却摸不着(实验中难以测量)的父变量
- 后门准则所解决的就是由于X的可见不可得的父变量导致无法测量X对Y的因果效应的问题!
定义:后门准则(The Backdoor Criterion):在有向无环图G=(V,E)中,给定一对变量(X,Y)∈E,则变量集合Z相对于(X,Y)满足后门准则,当且仅当Z的任一元素均不是X的后继节点,并且Z阻断了所有的在X和Y之间且指向X的路径。
如果变量集合Z满足后门准则,那么X对Y的因果效应如下推出:
P(Y=y∣do(X=x))=z∑P(Y=y∣X=x,Z=z)P(Z=z)
- “后门”是指那些连接X和Y,既指向X又指向Y的羊肠小道,如X←W→Y
- “后门”的存在使得X和Y是相关的,但这种关系不一定是因果的
- 满足后门准则的变量不能是X的后代,否则X会因果作用于这类变量,而这类变量又会继续影响Y1。
- 满足后门准则的变量必须是在逻辑图中可见的,而不能是不可观测的协变量(confounders)!
前门准则
- 仍然假设试图探究 X→Y的因果效应
- 后门准则的一大要求是,满足后门准则的变量在逻辑图中是可见的。问题在于,这一条件不一定能时时刻刻都成立。
- 例如:U为协变量(confounders),并且X←U→Y。即便这是X的唯一的“后门”,由于U不可观测,因此U不能满足后门准则。
- 前门准则所解决的正是这样的问题!
定义:前门准则(The Front-Door Criterion):给定一个变量集合Z,Z相对于变量(X,Y)满足前门准则,当且仅当Z同时满足以下3个条件:
- Z中断(intercept)所有从X到Y的有向边;
- 不存在关于(X,Z)的后门;
- 所有关于(Z,Y)的后门均被X阻断。
如果Z满足前门路径,并且P(x,z)>0,那么X→Y的因果效应是可识别的,并且可按照如下方式计算:
P(y∣do(x))=z∑P(z∣x)x′∑P(y∣x′,z)P(x′)
其推导原理如下:
- 由条件2可知,由于不存在(X,Z)的后门,因此:
P(Z=z∣do(X=x))=P(Z=z∣X=x)
- 由条件1可知,Z→Y 。因此可以使用后门准则计算 Z→Y的因果效应(书上p68式3.13少写了P(X=x)):
P(Y=y∣do(Z=z))=x∑P(Y=y∣Z=z,X=x)P(X=x)
- 接下来考虑到X对Y的整体因果效应。如果Z被自然赋予(do-操作)了值z,那么Y的取值为y的概率为P(Y=y∣do(Z=z))。对于Z的每一个取值z,在X被自然赋予(do-操作)了值x时,其取值概率为P(Z=z∣do(X=x))。那么X→Y的整体因果效应为
P(Y=y∣do(X=x))=z∑P(Y=y∣do(Z=z))P(Z=z∣do(X=x))=z∑x′∑P(Y=y∣Z=z,X=x′)P(X=x′)P(Z=z∣X=x)=z∑P(z∣x)x′∑P(y∣x′,z)P(x′)
参考文献
- Judea Pearl, Madlyn Glymour, Nicholas P.Jewell.Causal Inference in Statistics: A Primer.2016.WILEY
本文正在参加 人工智能创作者扶持计划