目录与链接
4 反事实及其应用
4.1 反事实
这种 “如果” 陈述,其中 “如果” 部分是不真实的或未实现的,被称为反事实陈述。反事实的 “如果” 部分被称为假设条件,或者更多的时候,被称为先行词。
举个例子,在开车回家时,我来到了一个岔路口,在这里我必须做出选择 : 是走高速公路 (X=1),还是走常规公路 (X=0)。我选择了常规公路,结果发现交通拥堵。一个小时后,当我回到家时,我对自己说 : “哎呀,我应该走高速公路的。” 如果我们试图用 do-运算来表示这个估计,我们会陷入僵局。
导致我们希望估计的行驶时间与实际观察到的行驶时间之间的冲突。显然,为了避免这种冲突,我们必须象征性地区分以下两个变量 :
- 实际驾驶时间
- 假设高速公路条件下的行驶时间,实际路面行驶时间已知为 1 小时。
不幸的是,由于 do-操作过于笼统,无法做出这种区分。虽然 do-操作能区分两个概率: 和 ,但它并没有为我们提供区分两个变量本身的方法,一个代表常规公路上的时间,另一个代表高速公路上的假设时间。我们需要这种区分,以便让实际行驶时间 (走常规公路的时间) 告知我们对假设行驶时间的评估。实际上是可以实现这样的区分。我们简单地使用不同的下标来标记这两个变量,用 (或在上下文允许的情况下使用 ) 表示高速公路的驾驶时间,用 (或 ) 表示常规道路的驾驶时间。在前面举的例子中,因为 是 Y 的实际观测值,因此希望估计的数值是
这个表达式包含了三个变量的混合 : 一个假设变量和两个观测变量,假设变量 是在一个事件 上的断言,它以实际观测到的事件 为条件。当使用 do-操作预测干预效应的时候,使用如下表达式 :
这个表达式中的 Y 是事件 的结果。这个表达式也可以用新符号描述为 ,它也表示在 X 设置为 x 时,Y 的取值,两种表示形式都可以使用,没有必要抛弃 do-操作,而仅使用反事实符号。同时我们会遇到需要使用反事实表达式 (1) 才能解决的问题,这是因为 和 是且一定是在不同条件下发生的事件,这两个事件发生在“两个不同的世界”。因为式 (1) 试图在给定实际驾驶时间 (我们选择走常规公路) 的情况下,估计选择高速公路行驶时间;而式 (2) 则是选择在走高速公路的世界中估计期望驾驶时间,不参考发生在另一个世界中的任何信息。与此同时,我们不能把式 (1) 中的情况规约为一个 do-表达式。
4.2 反事实的定义和计算
4.2.1 反事实的结构性解释
在前面关于干预的章节里,通过用等式 来模拟将变量 X 设置为 x 的操作,从而用因果结构模型预测从未实施过的行动和决策的效应。本节中将演示通过在一个稍微不同的环境中使用相同的操作,我们如何使用结构方程模型来定于i反事实,如何从给定模型中理解反事实,以及当模型中一部分未知时,有多爱的概率能够估计出反事实。
从一个完全确定的模型 M 开始。已知模型中所有外生变量的值和函数 。在这样一个确定的模型中,每一个对外生变量的赋值 关联到群体中的每一个每个单个成员,或总体中的“个体”,或关联到某种“情形”。这一关联的理由如下 : 每一个复制 唯一确定了 V 中所有变量的值,因此总体中的每一个个体的属性取得唯一的值,这依赖于个体的身份。
考虑现在的反事实的语句,“在 的情况下,若 X 当初取值 x,则 Y 会取值 y”表示 , 其中 X 和 Y 是 V 中的任意两个变量。解释这个语句中的关键是将语句 “X 当初值取 x” 作为一个在当前模型中进行微小修改的陈述,以便建立前置条件 ,这个条件有可能与 X 的实际观测值 冲突,即允许常量 x 不同于 X 的实际观测值而不会使方程系统不协调 (反事实)。
下面进行举例演示,该例子只包含 X,Y 和 U,并由以下的两个方程定义 :
首先计算反事实 ,即在 的情况中,若 X 当初取值 x,则 Y 的取值情况。用 替换第一个方程,得到“修正”的模型 :
代入 ,求解 ,得到
通过这个简单的计算样例,足以表明,虽然反事实被认为是假设的,甚至从统计角度看像是神秘的,但是它们很自然地从我们对现实的感知中表现出来,就像在结构模型中表示的那样。每一个结构方程模型都为所有可能的反事实赋予了确定的值。
4.2.2 反事实的基本定理
我们现在准备将反事实的概念推广到任何结构模型 M。考虑任意两个变量 X 和 Y,它们不一定在同一个方程里 (但在同一个方程组中)。令 表示用 代替 X 后得到的 M 的修正版本。反事实 的形式定义如下
换言之 : 模型 M 中的反事实 被定义为“修改后的”子模型 中 Y 的解。式 (5) 是因果推理最基本的原则之一。
4.2.3 从总体数据到个体行为
下面用图 1 来现实反事实在个体行为推理中的作用 : X 代表学生花在课后补习班的时间,H 代表学生做的家庭作业的数量,Y 代表学生的考试成绩。每个变量的值都以学生的均值以上的标准差数给出 (也就是说,模型是标准化的,因此所有变量的均值为0,方差为1)。这个模型代表了一个随机的试点项目,在这个项目中,学生随机地指定参加课后补习。
图 1.一个描述激励 (x) 对学生考试成绩效应的模型
假设所有因子 都是独立的,且得到了模型 1 中的参数
考虑一名学生 ,假设他的作业加倍,他的分数会是多少呢?
图 2.关于学生分数的反事实问题,假设作业量会增加到 来进行推断
4.2.4 计算反事实的三个步骤
任何反事实值的确定可由如下三步过程来计算 :
- 溯因 : 用证据 来确定 U 的值;
- 作用 : 修改模型 M,移除变量 X 出现在左边的方程,用 代替它们,从而获得修正的模型 ;
- 预测 : 使用修正后的模型 和 U 的值来计算 Y 的值,即反事实的结果。
可以将之前的三步法扩展到任何概率型的非线性系统。给定任何一个形式为 的反事实,三步法过程如下 :
- 溯因 : 根据证据更新 ,获得 ;
- 作用 : 修改模型 M,移除 X 出现在左边的结构方程,用 代替它们,从而获得修正的模型 ;
- 预测 : 使用修正后的模型 和 ,计算 Y 的期望,即反事实的结果。
5 结语
其实第四章后面还有一部分的内容,但是感觉都是案例驱动的,且涉及到的原则性的概念几乎没有,说明反事实的发展还处在较为初级的阶段。所以笔记这里就不做过多整理,整本书其实还是很偏向于案例驱动,可见现在的因果模型的普适性仍有较大提升空间。有时间我也会了解以下 Rubin 那一派的倾向得分并看看《因果论》(有时间永远是最鸽的修饰词2333)。