PSM-DID的经典方法与野路子（一）

高级计量经济学及Stata现场班

陈强亲授

北京, 2021年5月1-5日

Now or Never!

上期推文提及，针对横截面数据（cross-sectional data），一般不宜在倾向得分匹配（PSM）之后，再进行OLS回归，因为不仅无必要，而且可能有害：

（对于横截面数据）为何在倾向得分匹配之后一般不宜再作回归

但凡事皆有例外。一个重要例外则为在面板数据（panel data）中，日益流行的“倾向得分匹配双重差分法”（Propensity Score Matching Difference in Differences，简记PSM-DID）。

PSM-DID最早为Heckman et al. (1997, 1998)提出，给出了严格的识别条件与理论证明，本文称为“经典的PSM-DID方法”。

然而，Heckman et al. (1997, 1998)发表于Review of Economic Studies，对于一般的实证研究者而言过于艰深，而且仅针对两期面板（政策冲击前后各一期）。

由于多期面板也十分常见，故实证研究者在应用中自行“发明”了一些其他的PSM-DID方法。这些探索性的PSM-DID方法不一而足，在某种意义上相当于“野路子”（土办法），目前均尚无严格的理论证明。

本推文将首先介绍经典的PSM-DID方法，不仅因为这是最原创的PSM-DID方法，也因为它有理论上的保证。然后，也将探讨若干PSM-DID“野路子”的优缺点。

需要指出，“野路子”未必就不对，也可能是计量实践领先于计量理论，只是尚无理论上的保证而言（故“野路子”在本文中不含贬义）。

由于PSM本质上针对横截面数据，而DID与PSM-DID均针对面板数据，故PSM-DID实质上还是一种DID方法，只不过借用PSM来构造合适的控制组个体而已。因此，我们首先从DID讲起。

双重差分法（DID）

“双重差分法”（Difference in Differences，简记DID）的核心假设为“平行趋势假设”（parallel trend assumption），也称为“共同趋势假设”（common trend assumption）。

平行趋势假设意味着，若“处理组”（treatment group）未受到政策冲击，其平均时间趋势与“控制组”（control group）相同或平行，参见下图。

更精确地，可用下式来表述平行趋势假设：

其中，左边“

”表示个体 i 属于处理组，而右边“

”则表示个体 i 属于控制组。

下标 t 表示第 t 期，而下标 t ' 表示在此之前的一期，即 t ' = t - 1。

结果变量

括号中的“0”表示，这是未受政策冲击的“潜在结果”（potential outcome）。

不难看出，在平行趋势假设下，可以使用控制组个体的平均变化趋势，作为处理组个体如果未受政策冲击的反事实的平均变化趋势。这正是DID的核心思想。

在具体操作上，对于两期面板，DID可通过“双重差分”来实现；但对于多期面板，则更方便使用面板数据的“双向固定效应模型”（two-way fixed effects model）来实现，详见本公众号的往期推文：

开学礼包：如何使用双重差分法的交叉项（迄今最全攻略）

最新AER论文速递（含Stata操作）：异质性处理效应下的双向固定效应估计量

然而，在实践中，平行趋势假设并不容易满足。原因有二。首先，处理组与控制组分别包含了许多不同的个体。

其次，进入处理组与控制组的个体可能存在系统差别，即所谓“选择偏差”（selection bias）；比如，著名的“阿森费尔特沉降”（Ashenfelter's dip），即最近收入下降者更倾向于参加就业培训项目。

如果平行趋势假设不满足，则无法使用DID来识别政策冲击的因果效应。此时，可考虑使用PSM-DID，因为PSM-DID的“条件平行趋势假设”更容易满足。

倾向得分匹配双重差分法（PSM-DID）的假设

传统DID的平行趋势假设并未考虑处理组与控制组的协变量差异（协变量未出现于上述公式中），故此假定不容易满足（协变量可能在两组之间很不平衡）。

显然，如果给定相同的协变量，则处理组与控制组的个体更容易拥有相同的时间趋势。这正是PSM-DID最核心的“条件平行趋势假设”（conditional parallel trend assumption）。

假设数据为两期面板，“条件平行趋势假设”可用公式表达如下：

其中，

为个体 i 的所有协变量所构成的向量；下标 t 表示处理后（post-treatment），而下标 t ' 表示处理前（pre-treatment）。

对比以上两个公式可看出，二者的区别仅在于，是否在给定协变量

的条件下求条件期望。Heckman et al. (1997, 1998)将此假设称为“双重差分均值独立”（differences in differences mean independence），但本质上，它是在给定

条件下的平行趋势假设。

显然，“条件平行趋势假设”比传统的“平行趋势假设”更容易满足，因为毕竟前者要求处理组与控制组个体的协变量完全相同（相当于找到特征完全相同或接近的替身）。

然而，“条件平行趋势假设”也更难检验，因为需要针对样本中不同的

进行检验；而一旦给定

后，样本容量可能就非常有限了。

进一步，对于PSM-DID，进行传统的平行趋势检验将没有意义，因为PSM-DID并不依赖于传统的平行趋势假设。

经典PSM-DID的估计方法

在两期面板中，基于条件平行趋势假设，PSM-DID的基本做法是：首先使用处理前的第1期数据（这是横截面数据），进行倾向得分匹配（PSM）；然后根据匹配结果，针对两期面板进行双重差分估计（这是真正意义上的双重差分，当然也可使用OLS）。

在具体匹配方法上，可以使用传统的“K近邻匹配”（k-nearest neighbor matching），“卡尺内匹配”（caliper matching）或“卡尺内K近邻匹配”（k-nearest neighbor matching within caliper）。

然而，近邻匹配虽易理解，但所得结果可能依赖于K（匹配的邻居个数）；而通常K=1的最近邻匹配并非最优选择，因为方差较大。另一方面，若进行卡尺内匹配，也不易选择卡尺的半径。

为此，Heckman et al. (1997, 1998)主要使用“核匹配”（kernel matching）进行PSM-DID。所谓“核匹配”，是一种“全局匹配”（global matching）方法，即将处理组的每位个体与控制组的所有个体进行匹配，但控制组每位个体的权重（weights）不尽相同；而这些权重则通过使用“核函数”（kernel functions），根据“倾向得分”（propensity scores）计算而得。比如，若控制组某位个体的倾向得分，与所考虑的处理组个体之倾向得分相去甚远，则该控制组个体的权重将很小，甚至为0。

更具体地，在两期面板中，经典PSM-DID的步骤包括：

第1步、使用处理前的第1期数据，通过 Logit 或 Probit 回归，根据处理变量

与协变量

估计倾向得分

（即 PSM）。

第2步、对于处理组的每位个体 i，计算其结果变量的前后变化

。

第3步、对于控制组的每位个体 j，计算其结果变量的前后变化

。

第4步、使用以下公式计算PSM-DID估计量，作为对于“处理组的平均处理效应”（Average Treatment Effect on the Treated，简记 ATT）的一致估计：

其中，

为处理组的个体数目，而

为处理组个体 i 与控制组个体 j 这一配对的权重，其计算公式为

其中，

为核函数（比如三角核、二次核或高斯核），而 h 为带宽（bandwidth）。根据非参数估计知识，所得结果对于具体的核函数并不敏感，而带宽 h 则可选择最优带宽。

在以上最后一步，也可以使用“加权最小二乘法”（weighted OLS）来进行，并由此得到相应的标准误与 p 值。

经典PSM-DID的小结

综上所述，经典的PSM-DID方法可谓一气呵成。其第一阶段的PSM，只是用于计算DID阶段的权重

而已。

有关经典PSM-DID方法的Stata操作，可通过非官方命令 diff 来实现，详见《高级计量经济学及Stata应用》（陈强，2014，第2版）。

另外，虽然经典PSM-DID方法假设两期面板数据，但事实上也可应用于多期面板，只要每次仅选取两期即可（政策冲击前后更一期）。这样做的好处在于，不仅可作为稳健性检验（robustness checks），还可考察处理效应的动态变化。

当然，在多期面板中，若每次仅使用两期进行经典的PSM-DID估计，则显然影响估计效率。为此，同时使用多期数据进行PSM-DID估计的“野路子”应运而生，在实践中广泛应用（论文发表于中英文期刊），将在下期推文中详细介绍。

参考文献

陈强，《高级计量经济学及Stata应用》，第2版，高等教育出版社，2014年

陈强，《计量经济学及Stata应用》，高等教育出版社，2015年（好评如潮的配套教学视频，可在Peixun.net 或网易云课堂购买）

陈强，《机器学习及R应用》，高等教育出版社，2020年11月

陈强，《机器学习及Python应用》，高等教育出版社，2021年，即将出版。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。