文献荐读 | 第一部分因果推断：基本框架（3）

来源：

翻译：陈昕欣

校对：龙哥

编辑：林毅

点击标题查看上期内容：

一周一荐 | Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction

文献荐读 | 第一部分因果推断：基本框架（1）

文献荐读 | 第一部分因果推断：基本框架（2）

1.8 性质、预处理变量与协变量

考虑一个涉及多个个体的因果效应研究，我们假设它满足稳定性假设：SUTVA。至少有一半的潜在结果没有被观察到或者遗漏，这是因为每个个体只能观察到一个潜在结果，即与治疗/处理方法的实现水平相对应的潜在结果。为了估计对任一个体的因果效应，我们通常需要测算，或估算缺失的潜在结果。将个体估算的缺失结果与实际观测到的结果进行比较，可以使我们估计个体水平下的因果效应。一般来说，做出这样的测算是相当困难的。这包括对分配机制的假设和不同个体间的比较，每个个体只能选择其中一种处理方法。通常，个体特定性质（也称为预处理变量或协变量）的存在（在本书中用个体i的含有K个分量的行向量X表示），有助于做出这些测算。例如，在我们的头痛示例中，这些变量可能包括在决定是否服用阿司匹林之前头痛的强度。同样，在评估职业培训对未来收入的影响时，这些性质可能包括年龄、以前的教育背景、家庭、社会经济地位或培训前的收入。正如这些例子所示，有时协变量（例如，培训前的收入）与潜在结果（培训后的收入）仅在测量时间上不同，此时协变量可以高度预测潜在结果。

这些协变量的关键特征是，它们是先验的，不受处理分配机制的影响。这些知识通常来自于这样一个事实，即它们是个体的永久性特征，或者它们在分配处理方法之前就具有确切的数值，正如“预处理”变量所反映的那样。

这些协变量中可用的信息有以下三种使用方法。首先，协变量通常通过解释因变量/结果中的一些变化使得估计更精确。例如，在头痛的例子中，通过研究具有相同的初始头痛强度的个体，即在接受治疗/处理前保持恒定的头痛强度，应该能够更精确地估计阿司匹林的效果，至少对于具有这一头痛强度的个体是这样。其次，由于实际原因，研究人员可能更有兴趣探讨处理/治疗对某一子样本（由协变量定义）的平均因果效应。例如，我们可能想要分别评估职业培训项目对不同教育水平的人的效应，或者分别评估一种药物对男性和女性的效果。然而，在我们这本书中，协变量的最后也是最重要的作用在于它们对分配机制的影响。

年轻失业者可能对可获得新技能的培训计划更感兴趣，而高危人群更可能注射流感疫苗。结果，处理组与对照组的背景和特征可能存在差异。同时，这些特征可能与潜在结果相关。因此，关于分配机制及其可能不依赖于潜在结果的假设，在某些关于协变量同质的子样本中通常更为合理，也就是说，要有条件地考虑协变量，而不是无条件地给定。

1.9 潜在因果与LORD悖论

为了清晰阐明因果推断的潜在结果解释，我们考虑一个问题，在文献中被称为“Lord 悖论”：

一所大学想考察其食堂膳食对学生的影响以及影响的性别差异，他们收集了各种类型的数据。特别地，记录每个学生在9月份入学时的体重以及在次年6月的体重。(Lord，1967，p304)

Lord论文中这一假想研究的结果包括：对于男性来说，学年末的平均体重与刚开始时相同;事实上，体重的整体分布没有变化，尽管有些男性的体重减轻了，有些男性体重增加了——增加和减少的部分正好相等。女性也是如此。唯一的区别是，女性在年初和年末的平均体重都比男性轻。平均而言，男性和女性的体重都没有增加或减少。从Lord对这一问题的描述，我们感兴趣的对象，通常称之为估计，是大学膳食对男性的因果效应与大学饮食对女性的因果效应之间的差异。也就是说，因果估计是指男女因果效应之间的差异，即“差异”因果效应。

这一悖论是在两名统计学家在被要求对数据发表评论时产生的，他们得出了相互矛盾的结论。统计学家1观察到，男性和女性在9月和6月的体重分布没有差异。因此，统计学家1得出结论：

就这些数据而言，没有证据表明饮食(或其他东西)对学生体重有任何影响。特别是，没有证据表明对两性有任何不同的影响，因为两组都没有显示出任何系统性的变化。(Load，1967，p305)

统计学家2以一种更“高级”的方式看待数据。实际上，他在9月份调查了初始体重相同的男性和女性，比如“超重”女性（简单而言，就是高于平均体重的女性）的子样本和“体重不足”（类似定义）的子样本。他注意到，这些男性平均体重增加，而女性的平均体重减少。他还注意到，无论初始体重的值如何，这个结果都是正确的。（实际上，统计学家2使用了第七章中描述的协方差调整或回归调整的技术）因此，他的结论是，在“控制”了初始体重后，膳食对男性和女性有不同的积极影响。因为对于初始体重相同的男性和女性来说，平均而言，男性比女性增重更多。

谁是对的？统计学家1还是统计学家2？注意两位统计学家的关注点在于前后的体重变化或者体重增幅，这些体重增幅并不是因果效应，因为他们没有比较处理之后在同一时间的潜在结果；相反，他们比较的是体重随时间的变化。如果两位统计学家将他们的评论局限于描述数据，那么他们都是正确的，但就因果推断而言，他们都是错误的，因为这些数据无法支持任何有关饮食因果效应的结论，除非做出一些强的，但可以说是不合理的假设。

回到最基本的思路。个体显然是学生，试验（大学饮食）的时间明显是9月，结果Y记录时间明显是6月。让我们接受稳定性假设。现在，潜在结果是什么，分配机制是什么？注意到，Lord对该问题的陈述使用了已被批评的符号来表示处理指标和观察到的变量，而不是提倡的潜在结果的符号表示。潜在结果是大学膳食下的六月份体重Yi（1）和“控制”饮食下的六月份体重Yi（0）。协变量是学生的性别，男性还是女性，和9月份的体重。但是分配机制已经为每一个人分配了一种新的处理方法！没有人，无论男性或女性，被分配到控制组中去。因此，完全没有经验基础来比较大学饮食与控制饮食的效果，无论是原始的因果效应还是差异因果效应。通过引入协变量“男/女”和“初始体重”使得问题变得更加复杂，Lord 造成了混淆。但这里的要点是，通过明确使用潜在因果，立即解决了这一“悖论”。对于因果推断，任何一个答案都可能是正确的，这取决于我们愿意对“控制”饮食下（从未观察到）的潜在结果和大学饮食下的潜在结果（可观察到）之间的关系做出的假设。

1.10 因果估计

接下来让我们在描述因果估计时更加正式一些，这是我们分析的最终目标。从总体开始，标示为i=1，…，N，这是我们的重点。总体中的每一个体都要接受一种处理水平。在最一般的情况下，令Ti表示个体i接受的处理水平的集合。在多数情况下，这一集合对于所有个体而言都是相同的。例外情况包括将处理组定义为对每个个体的同龄群体。在此例中，集合Ti包含了对每个个体而言相同的两种处理方法（例如，服用药物或不服用药物），对任一i=1，…，N而言，本Ti=T={0,1}。本文中，大部分对限定处理组讨论的一般化，在概念上是直截了当的。

对任一个体i，及共同处理水平集中的任一处理方法而言，T={0,1}，有相对应的潜在结果Yi(0)和Yi(1)。Yi(0)与Yi(1)的比较是个体水平上的因果效应。通常这些只是简单的大小比较，Yi(1)-Yi(0)或比值Yi(1)/Yi(0)，但总的来说，比较可以采取不同的形式。有许多这样个体水平的因果效应，我们常常希望将它们总结为有限样本或子样本。我们通常称之为因果估计，就是对潜在结果的平均差异

其中，下标“fs”表示我们对有限样本求取平均值。

我们有多种方法将这一示例一般化。这里我们讨论两种一般化的方法，在此情境下，所有个体的处理水平集T={0,1}。首先，我们对子样本（subpopulations)，而不是对全部总体求取平均值。这里的子样本可以用不同的变量集来定义。首先，它可以用预处理变量或协变量（表示为Xi）来定义。回想一下，这些变量是在个体意义上的测量，与结果不同，它们先验已知且不受处理方法的影响。例如，我们可能只有兴趣研究一种新药对女性的平均效应：

这里，

标识该个体是否为女性，而

表示在有限样本中女性的数量，这里IA是事件A的示性函数，如果A确实发生则等于1，否则为0。第二，我们可以关注那些接受这一处理方法的人的平均处理效应：

其中Nt是处理组的个体数量。例如，我们对服军役的人感兴趣时，主要观测军队服役对在平民劳动力市场中后续收入的平均处理效应，对接触石棉的人感兴趣时，主要观测接触石棉对健康的平均处理效应。在这两个例子中，我们对未接受处理的控制组的平均处理效应不太感兴趣。定义相关子样本的第三种方法是部分地根据潜在结果来定义。例如，人们可能感兴趣的是就业培训计划对小时工资的平均处理效应，只对那些本来会被雇佣的人(小时工资为正值)求取平均数，不管处理水平如何：

其中

，因为条件变量（不论处理水平如何均被雇佣）是潜在结果的，所以划分子样本的条件部分地取决于潜在结果。

平均处理效应一般化的第二种方法，我们可以关注潜在结果的更为一般化的函数。例如，我们可能感兴趣的是Yi(1)的中位数（全部样本的中位数或子样本的中位数）与Yi(0)的中位数。我们也可能感兴趣探讨差值Yi(1)-Yi(0)的中位数，这通常不同于与中位数的差值。

在T={0,1}的所有情况下，我们可以将因果估计写成所有个体，所有处理水平和分配机制，以及所有预处理变量的所有潜在结果的行交换的函数：

在这一表达式中Y(0)和Y(1)是一N维列向量，表示潜在结果，而其第i项等于Yi(0)和Yi(1)。W是处理分配的N维列向量，其第i项等于Wi，而X是协变量的N*K的矩阵，其中第i行等于Xi。并不是所有这些函数都必须有因果关系，反过来也是正确的：我们在本书中考虑的所有因果估计都可写作这种形式，所有这些估计都是对在同一集合中所有个体的Yi(0)和Yi(1)的比较。正如前面的例子所示，因果估计依赖于Y(0)，Y(1)，X和W。

1.11 本书结构

本书第一部分的其余章节包括对因果推断框架发展的简要历史概述（第2章）和描述分配机制的一些数学定义（第3章）。

本书第二部分至第五部分针对分配机制的不同假设，阐述了相应的不同情况。第二部分讨论随机分配的最简单情形，特别是我们所说的经典随机实验。在这些情形中，分配机制由实验者控制，在试验开始之前，实验的每个个体分配某一处理水平的概率是完全可知的。

在第三部分和第四部分，我们探讨了常规分配机制（regular assignment mechanisms），其中分配机制不一定是在实验者的控制之下的，而且分配概率的知识是不完整的、特定的和有限的：在由协变量的固定值定义的子样本中，已知分配概率对于所有的这些个体是相同的，并且严格地处在0和1之间；概率本身不必知晓。此外，在实践中，我们通常很少有协变量的数值完全相同的个体，因此经典随机实验章节中讨论的方法无法直接在此使用。

最后，第五部分和第六部分探讨了非常规的分配机制（irregular assignment mechanisms），它们允许分配机制依赖于协变量和潜在的因果，包括观测到的和不能观测到的变量，或者允许个体级别的分配概率等于0或1。这种分配机制提出了特殊的挑战，如果没有进一步的假设，只能取得有限的进展。在本文的这一部分中，我们将讨论在特定情境中处理这一问题的几种策略。例如，我们讨论了推断结果对违反分配机制关键的“非混淆”假设的敏感性。我们还讨论了一些特定的案例，这些案例中，非混淆假设被联系各种潜在结果的假设补充或替代。这些假设同样是排他性限制，即预先假定处理对结果没有影响或影响有限。由于这一不规则的分配机制所产生的问题，以及这种分配机制采取多种形式，故此这一领域仍然是方法论研究的沃土和前沿。

1.12 样本、总体和大样本

在本书的大部分讨论中，我们观测到的协变量、处理水平和实验结果的有限单位集都是我们所感兴趣的集合，我们称之为总体。这一群体是如何选择的，来自何处并不重要。所有结论都取决于这一总体，并且我们并不试图对其他总体进行推论。然而，对于讨论的这一部分来说，仍有必要把我们观测到的集合视为是从一个更大的总体中随机抽取出来的。在这种情况下，我们通常把这一更大的总体视为无穷大。做出这种区分至关重要，我们把我们观测到的集合视为有限样本（通常使用下标“fs”表示），把无限总体视为超总体（super-population,用下标”sp”表示），以将此例与之前的例子（之前例子中，我们观测到了总体中所有个体的数值）做出区分。

1.13 结论

在本章中，我们提出了因果推理框架中的三个基本概念。第一个是潜在结果，每个个体对应一种处理水平。根据这些潜在结果来定义因果估计，可能还包括处理分配和预处理变量。我们讨论了这一点，因为最多只能观测到一种潜在结果，因此有必要观测多个个体才能进行因果推断。为了利用存在的多个个体，我们使用稳定性假设，SUTVA，这是我们框架中的第二个基本概念。第三个基本概念是分配机制，它决定了哪些个体接受哪种处理水平。在第3章，我们对分配机制进行分类，并作为本书的组织架构基础。

（完）

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。