打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【稷下方法9】| Synthetic Control

推文作者:加相知

本文编辑:彭培芸

原文信息:

Cunningham,S.(2021).Causal inference The mixtape. Yale university press.

原文链接:https://mixtape.scunning.com/10-synthetic_control

01

简介

1.合成控制法首次出现是在2003年的一篇文章中,该文章用于估计恐怖主义对经济活动的影响(Abadie和Gardeazabal, 2003年)。

2.合成控制法是一种数据驱动的方法,适用于评估“试点”较少的政策和控制组与实验组时间趋势不一致的情况,他的核心思想是虽然难以在其他没有试点的地区找到合适的反事实参照组,但是通常可以对其他没有试点的地区进行适当的线性组合,构造出一个合成的反事实参照组。

02

比较案例研究(The Comparative Case Study)

1

定性案例研究(Qualitative case studies)

定性案例研究的目标在于利用逻辑和历史经验进行归纳,分析事件或特征的因果影响。但由于定性案例研究缺乏对应的反事实情况,分析归纳出的因果影响并不精确和科学。但却可以为我们推测因果关系提供支撑。

2

定量比较案例研究(Quantitative comparative case studies)

定量比较案例研究是更明确的因果设计。它们通常是自然实验(natural experiment ),只适用于单个单位,如单个学校、企业、州或国家。这类定量比较案例研究将总体结果的演变与其他单个结果进行比较,更常见的情况是,将一组选择的类似单位作为对照组进行比较。

03

马列尔偷渡事件(Mariel boatlift)

古巴裔美国人帮助安排了1980年4月至10月期间从古巴的马里埃尔港(Mariel Harbor)大规模逃往美国(主要是迈阿密)的偷渡行动。大约12.5万古巴人在六个月内移民到佛罗里达州。这一活动使迈阿密的劳动力增加了7%。该研究想要评估的是马列尔偷渡事件(Mariel boatlift)对迈阿密劳动力市场上移民的流入是否压低了当地劳动力市场上本地人的工资和就业率。Card使用的是传统的DID方法:他对比了处理组(迈阿密)与单一控制组(休斯敦、匹兹堡和亚特兰大这三座城市中的一个)的工资水平变化。

合成控制法不是使用单一的控制组,而是对备选的三座城市进行加权平均,从而“合成”一个与迈阿密更相似的控制组。通过最优选择一组权重,当应用到一组相应的单位时,产生一个最优估计的反事实单位,接受处理后反事实被称为“合成单元”。假设偷渡发生前休斯顿的工资水平比迈阿密高,而亚特兰大比迈阿密低,相较于使用单一的城市(亚特兰大,休斯顿)作为控制组,二者通过平均“合成”的城市显然与迈阿密更具可比性。

04

合成控制法的优点

1.合成控制法排除了外推,因为合成控制法的权重非负,且和为1。相反,它使用插值,因为估计的因果关系总是基于某一年的某些结果与同年的反事实之间的比较。

2.第二个优势与数据处理有关。与回归不同,反事实的构建不需要在研究的设计阶段获得处理后的结果。这样做的好处是,它可以帮助研究人员在指定模型时避免“偷看”结果。谨慎和诚实仍然是必须使用的,因为在设计阶段很容易看到结果,但关键是,假设使用这种方法可以只关注设计,而不是评估。

3.反事实透明。选择的权重明确了每个单位对反事实的贡献,合成控制法使对照组中用于比较的个体对反事实的贡献透明可知。

4. 在定性和定量类型之间架起了一座桥梁。定性研究者往往正是专注于描述一个单一的单位,合成控制为他们提供了一个工具,使他们能够选择反事实,只要他们对评估某些特定的干预措施感兴趣,这个过程原则上就能改善他们的工作。

05

合成控制法的模型

1.假设共有J+1个地区,观测时期为1,2 ,..., T。其中第一个地区在T0+1 ,...,T年持续受到干预,其余J个地区均一直未受到干预,为潜在的控制组(被称为“donor pool”)。

Yit 为地区 i 在第 t 期实际观测到的结果变量,其中 i = 1, ... , J + 1, t = 1, ... , T 。

2.“合成控制”即控制组个体的一种加权平均,那么我们便能得到Yit的无偏估计:

3.对于权重的选择,分为不同控制组个体的权重选择,以及不同变量间的权重选择。控制组个体间的权重选择方面,所选择的权重应使得合成控制组与处理组在事前结果变量的预测值最为接近。也就是说,给定一组非负常数v1, ... , v k,且权重之和为1,构造合成控制组。

4.求X0W和X1的最小数值:

06

加州控烟案

1988年,加州通过了著名的99号提案:烟草税与健康保护法。其主要内容是对加州的卷烟销售征收每包25美分的州消费税,对其他商业类烟草产品(如雪茄和咀嚼型烟草)的销售也征收约同等的消费税。烟草销售的其他限制包括禁止在青少年可进入的公共区域安装自动售烟机,禁止个人销售香烟。同时,该法案产生的收入专门用于各种环境和保健计划以及反烟草广告。

合成控制法在经济学实证研究中的经典实证应用案例, 烟草税对烟草消费的影响。在经济学中,专家们对于烟草税征收对烟草消费的影响之一议题长期争论不休。一方面,一些研究认为对香烟增税将提升烟民的抽烟成本,从而降低烟草消费的需求;另一方面,学者发现,香烟作为具有成瘾性的刚性需求商品,香烟增税对烟草消费的影响很小。   

根据美国1970-2000年的州级面板数据,采用合成控制法研究美国加州1988年控烟法对人均香烟消费量的政策效果,研究者们收集多个州跨多年的香烟销售数据,包含38个州从1970年到2000年的数据。(考虑到有些州采取了和加州类似的烟草控制法案,为避免干扰,排除了这些州的数据,有四个州在1989到2000期间也引入了控烟法,无法作为控制地区,故将四洲剔除)。

1.如图80所示,在1980-2000年间,加州居民的香烟消费量(cigsale)明显低于全国平均水平。另外从80年代起,整体,香烟消费量是在下降的。而在99号提案生效后,看上去加州的数据相比其他州有加速下降趋势。

2.为了回答99号提案究竟对降低烟草消费有没有效果,我们基于开头介绍的合成控制的思想,通过干预前(pre-treatment period)的数据生成一个合成控制, 也就是说我们把其他州的数据通过线性加权组合起来,生成一个趋势和加州非常相像的假数据, 然后看看到这个合成控制对于干预后的预测结果。

3.合成控制法选择了一组最优权重,当将其应用于该国其他地区时,会产生如图81所示的内容。预处理后,这组权重为加利福尼亚产生了几乎相同的时间路径,就像真实的加利福尼亚一样,但是处理后,这两个序列会发散,可以表明该计划确实减少了香烟的销量。

4. 表82列出了他们用于最小化距离的变量。显示了真实加州、合成加州及按人口简单加权平均美国其他州得到的协变量对比,可以看出加州与合成加州的预测变量均十分接近,故合成加州可以很好地复制加州的经济特征。

5.图82进一步画出二者差值,加州控烟法对于香烟人均年消费量有很大的负效应,而且此负效应逐渐增大。具体来说,在1989-2000年期间,加州的香烟人均年消费大约下降了25%。

07

均方根预测误差(RMSPE)

前面部分的内容只涉及到估计,那我们如何确定两个系列之间观察到的差异是否具有统计学意义的差异?也许两个系列之间的分歧只不过是预测误差,任何选择的模型都会这样做,即使没有处理效果。

Abadie, Diamond和Hainmueller(2010)建议我们使用一种老式的方法来构建基于R. A. Fisher(1935)的精确的(p)值。Firpo和Possebom(2018)将本检验中使用的零假设称为“无论如何都没有处理效果”,这是文献中最常见的零假设。尽管他们提出了一个替代的null用于推理,但我将重点关注Abadie、Diamond和Hainmueller(2010)在这个练习中提出的原始假设。

随机化推理将处理分配给每个未处理的单元,重新计算模型的关键系数,并将它们收集到一个分布中,然后用于推理。Abadie、Diamond和Hainmueller(2010)建议计算一组处理前后的均方根预测误差(RMSPE)值,作为用于推断的检验统计量。

均方根预测误差的具体流程如下:


1.对donor pool中的每个国家/州反复应用综合控制方法,获得安慰剂效应的分布。

2.计算每个安慰剂处理前的RMSPE公式为:

3.计算每个安慰剂在处理后时期的RMSPE(类似的公式,但在处理后时期)。

4.计算处理后和处理前的RMSPE的比率。

5.按从大到小的降序排序。

6.计算处理单元在分布中的比例为:

08

安慰剂检验

(1)如下图所示可以观察到对于有些州(测试单元)的模型即使是在干预前的数据,拟合的不是很好。这和我们预期中的也是一致的,如对于一个销量最高或最低的州,我们基于内插值interpolation思想的模型是不可能拟合的很好的。当然,这也给了我们一些启示,在实验设计中,我们也需要谨慎地选择我们的试验组。

这里,对于拟合结果不太好的州,我们可以认为其是噪声从数据集中去除。一个简单的方法是我们对于干预前(pre-intervention)设置一个误差的阈值(threshold), 对于误差大于阈值的州我们将其从数据中删除。

(2)通过去除数据中的noise,我们可以从上图中看到和其他州的效应值相比,加州在干预后有明显的降低的效果,如下图所示:

我们可以看到在干预后的方差(variance)要远高于干预前的方差, 这和我们预期中的是一致的,我们新方法的优化目标是最小化干预前的数据点的均方误差。

(3)将所有州结果的效应值用直方图表示,然后显示加州的结果在图中的位置。

但是推断是基于那些精确的(p)值。所以我们这样做的方法是我们简单地创建一个比率的直方图,或多或少地在分布中标记处理组,以便读者可以看到与模型相关的确切的(p)值。在图中生成它。

加州在38个州中排名第一这给出了一个精确的(p)值0.026,这小于大多数期刊想要(任意)  看到的统计显著性的常规5%。

09

总结

在政策或者策略评估的场景中,如果我们只有如城市/省/州等实体的聚合数据(aggregated data), 这时候DID(difference-in-difference)方法并不能很好地做归因。在DID中,我们需要寻找一个和试验组相似,可以表征试验组反事实情况(假设试验组没有接受到干预)的对照组,但这样理想的对照组,在现实中我们很难找到。

    合成控制法作为DID的升级版,合成控制法给了我们一个更好的解决方案。我们可以学习和构成基于若干个和试验组相近的测试单元线性组成的合成控制来表征一个虚拟的试验组。基于该合成控制,我们模拟出试验组没有接受到干预的结果并计算因果效应值。

结语

结语:以上为本期分享的全部内容,如果各位同行对我们团队例会内容感兴趣,可以关注“稷下经纬”公众号,我们将会为大家持续放送经济学干货供大家学习、思考!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
合成控制法 (Synthetic Control Method)及R应用(上)
Stata:纠偏合成控制法介绍-allsynth
过去15年政策评估文献中最重要的创新--合成控制法
合成控制法什么鬼? 因果推断的前沿方法指南
使用 CausalPy 进行因果推理
互助问答第133期:合成控制法的应用
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服