前沿: 在基于冲击的IV设计中预处理平衡不满足真不行！

①134篇各种方法的code, 代码和程序文章合集, 必须收藏！②今年最诚意的主流计量方法与Stata操作的视频教程, 一定要收藏学习！③《经济研究》期刊上所有文章按照"计量方法"进行分类汇总，有选择性地学习计量方法，④120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏！⑤Stata数据管理,绘图,检验,实证方法操作,结果输出的187篇文章！

正文

关于下方文字内容，作者：徐锦, 厦门大学王亚南经济研究院，通信邮箱：jinxu0209@hnu.edu.cn

内生性问题: 微观和宏观经济学研究中的关键因果识别问题

Vladimir Atanasov and Bernard Black，2021，The Trouble with Instruments: The Need for Pretreatment Balance in Shock-Based Instrumental Variable Designs，Management Science，67:2, 1270-1302
Credible causal inference in accounting and finance research often comes from natural experiments. These experiments can be exploited using several shock-based research designs, including difference in differences (DID), shock-based instrumental variable (shock-IV), and regression discontinuity. We study here shock-IV designs using panel data. We identify all shock-IV papers in two broad data sets and reexamine three of the apparently strongest papers—Desai and Dharmapala [Desai M, Dharmapala D (2009) Corporate tax avoidance and firm value. Rev. Econom. Statist. 91:537–546.], Duchin et al. [Duchin R, Matsusaka J, Ozbas O (2010) When are outside directors effective? J. Financial Econom. 95:195–214.], and Iliev [Iliev P (2010) The effect of SOX Section 404: Costs, earnings quality, and stock prices. J. Finance 65:1163–1196.]. After we enforce covariate balance and common support for treated and control firms, the instruments in all three papers are unusable—they are no longer significant in the first stage. All three papers also show nonparallel pretreatment trends on outcomes or core covariates. The problems with these papers generalize to our full sample and to other papers exploiting the same shocks as Duchin et al. A core conclusion of our reexamination is that pretreatment balance (common support, covariate balance, and parallel pretreatment trends) is necessary for credible shock-IV designs. We provide a good-practice checklist for shock-IV design with panel data, much of which also applies to DID designs.

10份TOP期刊中shock-based IV的详细总结！

Core conclusion：

预处理平衡[pretreatment balance]对于保证shock-IV design的可靠性来说是必要的。

Main contributions：

本文通过复查三篇具有代表性的shock-IV设计的论文，发现在控制了预处理平衡后，三篇论文的工具变量均失效。由此提出相关解决办法，并提供shock-IV设计的自查清单，该清单同样也适用于DID设计和nonshock-IV设计。

Three reexamined paper：

（1）Duchin R, Matsusaka J G, Ozbas O. When are outside directors effective?[J]. Journal of Financial Economics, 2010, 96(2): 195-214.

Shock：2000年美国关于审计委员会完全独立性的交易所上市规则

IV：冲击前是否拥有完全独立审计委员会的二元虚拟变量

核心预测变量：2000-2005年间的独立董事占比的变化

（2）Iliev P. The effect of SOX Section 404: Costs, earnings quality, and stock prices[J]. The Journal of Finance, 2010, 65(3): 1163-1196.

Shock：美国萨班斯-奥克斯利法案 (SOX) 第404条

IV：冲击前公众持股量（float） <7500 万的虚拟变量

测量变量：2004 年对第 404 条的遵守 (冲击后)

（3）Desai M A, Dharmapala D. Corporate tax avoidance and firm value[J]. The Review of Economics and Statistics, 2009, 91(3): 537-546. -Link- -PDF-

Shock：1996 年美国 Check-the-box 税收规则

IV：Post-Shock Dummy  tax shields (时期前后冲击)

测量变量：账面税缺口（book-tax-gap）

Abstract：

金融和会计领域研究中可靠的因果推断往往来自于自然实验。这些实验通过运用基于冲击的研究设计[shock-IV design]（双重差分法[DID]、工具变量[IV design]、断点回归[regression discontinuity]等）来完成。本文将在面板数据下研究shock-IV设计。识别所有shock-IV论文，同时复查其中最显著的三篇文章，本文发现：在我们严格控制了协变量平衡[covariate balance]、实验组[treatment group]和对照组[control group]的共同支撑[common support]，三篇文章的工具变量均失效了——工具变量在第一阶段不显著。三篇文章同样在结果或核心协变量都存在非平行预处理趋势[nonparallel pretreatment trends]。这些问题在基于相同其他冲击设计的论文中同样存在。本文的核心结论是：预处理平衡[pretreatment balance]（包括共同支撑、协变量平衡和平行预处理趋势）对于可靠的shock-IV设计是十分必要的。该结论同样适用于DID设计。

1. Intro

金融和会计领域的研究越来越强调因果效应识别。学者们通常使用看似满足因果推断条件的冲击进行研究。但是他们往往忽略了实验组和对照组的预处理平衡，这导致他们得出的结论是错的。本文通过复查以往论文中运用shock-IV进行因果识别设计的三篇效果最显著的文章，来验证这一观点。同时，本文还提供了关于shock-IV研究设计的检查清单，以便学者们自查来满足预处理平衡的需要。该检查清单同样适用DID模型和non-shock-IV的研究设计。

1.1 DMO（2010）：When are outside directors effective?

DMO（2010）研究了董事会独立性对企业价值和盈利能力的影响。衡量董事会独立性变化的主要工具变量是企业在2000年是否有一个完全独立的审计委员会。1999年，企业必须拥有完全独立的审计委员会来满足纽交所[NYSE]和纳斯达克[NASDAQ]的要求，这构成了“审计委员会冲击”[Audit Committee Shock]和“审计委员会工具变量”[Audit Committee IV,AC-IV]，这种冲击使得企业对董事会添加独立董事来来保证审计委员会的独立性。他们发现：整体来看，较高的独立董事占比[PctIndep]是风险中性的，但当企业的信息成本[InfoCost]较低，独董占比的价值为正，反之成立。将2002年SOX法案（要求上市企业要有较多的独立董事）的实施[SOX Board Shock& Minority Independent IV，MI-IV]作为一种冲击进行考察，会得到相似的结论。DMO在先前研究的文章中也提出“达标距离工具变量” [Distance-to-Compliance IV，DC-IV]。我们将这三个工具变量称为董事会独立性工具变量[the Board Independence IVs，简称BI-IVs]。有一系列论文利用这些工具变量来进行shock-IV（使用一个或多个）或DID研究设计。

BI-IVs存在一些问题。考虑AC-IVs和相关工具变量：（1）DMO样本的共同支撑有限：对照组（具有完全独立的审计委员会）中几乎没有独董占比[PctIndep]小于25%，然而实验组中几乎没有在2000年的独董占比[PctIndep2000]超过80%。（2）样本在实验组和对照组的协变量[PctIndep2000]存在严重不平衡：实验组公司的PctIndep2000要远远少于对照组，这种不平衡也导致了他们结果的出现。如果我们限制共同支撑，同时平衡PctIndep2000，重新比较两组，我们发现：AC-IV变量在第一阶段就不能显著预测2000年-2005年间董事会独立性的变化[δIndep]。

当我们不做上述限制，Duchin（2015）的Audit Committee IV 就存在严重问题：（1）工具变量效应是假的——它的本质是PctIndep的均值回归效应。（2）AC-IV不通过安慰剂检验[placebo tests] 核心思想：虚构实验组或者虚构政策时间进行估计，如果不同虚构方式下的估计量的回归结果依然显著，那么就说明说明原来的估计结果很有可能出现了偏误，我们的被解释变量y的变动很有可能是受到了其他政策变革或者随机性因素的影响。（3）预处理趋势不平行。BI-IVs的缺点同样影响着基于企业自发改变来符合监管要求定义的工具变量，例如董事会中女性最小比例的要求。

1.2 Iliev（2010）：The effect of SOX Section 404: Costs, earnings quality, and stock prices

Iliev（2010）结合断点回归和工具变量，研究了企业遵守SOX法案第404节政策要求的成本。他在7500万美元的公众持股量[free float]处做了断点处理。论文发现：一些企业操纵公众持股量，使其低于7500万美元的政策要求。Iliev使用巧妙的工具变量来识别该操纵问题：一家企业在2002年是否有超过7500万美元的公众持股量。该工具变量构建的依据是：2003年通过的证券交易委员会（SEC）规则要求，2002年公众持股量超过7500万美元的企业应遵守SOX第404节（限制在7500万美元以内）。

Iliev的工具变量设计十分巧妙。但是仍然存在很多问题：（1）它的工具变量在实验组和对照组的预处理方面严重失衡；（2）在限制了共同支撑后，它的样本太小以致无法估计；（3）他和前人的分析方法（主要分层法，principal strata approach (Frangakis and Rubin 2002)）相比，高估了企业的审计费用。这种高估是由增长的不平衡造成的。

1.3 D＆D（2009）：Corporate tax avoidance and firm value

D＆D研究企业治理如何调节税收保护对企业价值的影响。他们发现，1996年美国财政部针对小型私营企业的税收规定，增加了跨国企业避税的机会。D＆D考虑这种冲击并构建了企业对收入税收保护的需要以创造账面税收差距（book–tax gap）的工具变量（BTG-IV）。他们发现，增加庇护机会可以增加企业价值，但只适用于机构所有权较高的企业。

我们将D&D IVs应用于冲击前后平衡样本。发现：（1）工具变量很弱，在第一阶段不再显著预测工具变量（账面-税收差距）。（2）工具变量不再是外生的（尽管存在外生冲击），他们的样本表现出协变量不平衡和非平行预处理趋势。

1.4 Conclusion

我们在复查过程中出现了许多项目。我们将这些总结在面板数据为基准的shock-IV设计检查表中。包括：

（1）使用面板数据（包括IV和DID）对shock-IV design进行预处理平衡的关键作用

（2）修改为到共同支撑和平衡相关的冲击前协变量和结果的价值（基于因果推断理论）

（3）在同一研究中同时使用DID和冲击IV的价值

（4）安慰剂检验（falsification tests）的重要性

（5）对于基于政策要求的冲击，使用断点回归方法和评估回归均值是否可以解释明显的冲击力

（6）如果冲击与协变量相互作用，需要确认双重差分和三重差分的平行趋势

（7）当冲击和结果在时间上分离时，即使样本在冲击时处于平衡状态，时间间隔也会导致不平衡

本文主要研究shock-IV design中的预处理平衡。在线附录提供了检查清单、复查的相关细节。

2. Background of shock-based research and shock-IV

冲击后，我们需要用对照组的结果作为实际未得到的潜在结果。这种做法的最大挑战就是选择偏差[selection bias]：实验组和对照组在很多没有观察到的方面存在差异，这种偏差会影响所估计的实验效果[treatment effect]。本文的一个关键主题就是：只有当shock-IV和其他冲击基准的实验设计符合若干条件，包括共同支撑、协变量平衡等，我们可以认为该研究设计可能达到了一个真实的随机试验的水平，此时研究得到的因果估计是可靠的。

Atanasov and Black (2016)将一个好的冲击所要满足的条件进行了汇总，本文在面板数据上对这些条件进行拓展，具体如下：

（1）冲击强度[shock strength]

冲击应足够强大，从而在限定了共同支撑和协变量平衡之后，它仍然能够显著改变企业的行为。

（2）外生冲击[Exogenous shock]

冲击应来自所研究的系统外。实验组的企业无法选择是否受到冲击影响，同时也无法为冲击做准备。这种冲击预计是永久性的，且没有理由相信潜在结果或受到冲击的企业取决于未观察到的企业特征。

（3）“唯一通过条件”[Only-through condition(s)]

冲击对结果的影响只能通过该冲击产生。同一时刻，没有其他冲击会对两组结果产生不同的影响。如果在工具变量分析中，我们期待冲击会通过特定的工具变量影响结果，那么该冲击能且只能通过该变量影响结果。我们通常称它为排斥性约束[exclusion restriction ]，在本文，我们称它为“唯一通过条件”[Only-through condition(s)]。

（4）预处理平衡[Pretreatment balance]

只有当实验组和对照组在冲击前相似（我们称其为预处理平衡），外生性和“唯一通过条件”才可靠。预处理平衡由几个部分构成：

（4.1）尽可能像随机分配[As if random assignment]

人工分出的实验组和对照组要尽可能接近随机分组的结果。除了强制变量[forcing variable] （在其临界值处,参与项目的概率会发生不连续的变化），我们要选择哪些企业受到冲击及其相关变量的影响。

（4.2）共同支撑[Common support]

实验组和对照组的相关协变量及结果应该存在于相同区间内，如果两组的样本区间不一致，可以通过样本修剪[sample trimming]达到共同支撑条件。

（4.3）协变量平衡[Covariate balance]

除强制变量及其相关变量外，冲击应该对实验组和对照组的相关协变量和结果变量产生相似的预处理价值[pretreatment values]。这种效应通常被误称为“协变量平衡”。我们可以通过相关方法使数据达到协变量平衡。

（4.4）平行预处理趋势[Parallel pretreatment trends]

实验组和对照组的结果和核心协变量在冲击前应该存在平行趋势。对于一个三重差分设计（冲击和其他变量进行交互）来说，相关的双重差分应该和三重差分一样存在平行预处理趋势。

前三个条件在因果工具变量中广为人知，因此我们在这里聚焦第四个条件：近似随机试验、协变量平衡、共同支撑假设以及平行预处理趋势的必要性。在之前的研究中，这种需要往往被忽略了。

2.2 工具变量强度和扩大的相关系数

论文中，即使唯一通过条件充分成立，工具变量估计仍有可能存在偏差；如果工具变量们的效果较弱，标准差通常向下偏差。通常情况下，检验工具变量在第一阶段显著的经验法则是看第一阶段的F统计量是否大于10。当工具变量在第一阶段不显著时，其相关系数容易产生高估的问题。2SLS估计得到的相关系数将远远大于OLS估计的相关系数。高2SLS/OLS系数比是是工具变量失灵的警报，但并不能成为证据。比值越高，工具变量越失灵。

2.3 DID 和 Shock-IV的相似性

基于相同冲击的DID 和 Shock-IV 之间有密切的联系。

DID 有几个优点：

（1）它依赖于较弱的假设。DID 估计了冲击对所有受冲击的企业的实验效果。相比之下，Shock-IV要求研究者指定一个路径，它假设冲击只通过这个路径影响结果，并仅为受冲击影响后行为发生变化的企业提供一个估计结果。

（2）DID 要求研究人员使用前后平衡的样本，并附加有利的测试，包括检查平行预处理趋势和虚构测试，如评估安慰剂冲击的影响，以及实际冲击是否能预测安慰剂的结果。

IV 也有优点。它必须表现出第一阶段，即冲击必须显著影响工具变量。相比之下，DID 设计隐蔽的保留了第一阶段，并让作者假定第一阶段可能不存在。IV 的设计设定了一个特定的渠道，可以更容易地评估经济规模是否合理。

因此，将两种设计应用于同一研究是有价值的。如果冲击较强，两者应具有相似的统计强度。

平行趋势假设在 DID 中很常用，但在 Shock-IV 研究中就不那么常用了。要了解为什么两种设计都依赖于这种假设，有必要考虑两者的相似性。如果测量的变量是二元的，DID 设计估计了冲击对所有受冲击的企业的平均影响。相比之下，IV 为受冲击影响行为发生变化的企业提供了一个局部平均处理效应 (local average treatment effect，LATE)。如果没有协变量，IV 分析的 2SLS 系数可以表示为 Wald 估计：

2.4 共同支撑

共同支撑和协变量平衡是DID和shock-IV设计中至关重要却又经常被忽视的部分。一个理想化的冲击会将企业随机分配到实验组和对照组中，从而满足上述两个条件（异常提取除外），进而保证(没有协变量的)估计值是无偏的。添加协变量能够提高精度，但这需要保证既不会产生偏差，又不需要预防遗漏变量偏差[omitted variable bias ,OVB]。但是，实际处理中，许多冲击缺少共同支撑，协变量和结果也是不平衡的。处理这些问题的最好办法有：

（1）进行样本修剪；

（2）通过匹配或者其他办法进行平衡。

学者们希望可以通过使用观察到的协变量进行修剪和平衡，同时改善未观察到的协变量的共同支撑和平衡。

综述性文献表明，学者需要将样本限制在“足够跨度”的共同支撑内，即实验组和对照组的企业在研究变量上具有一定的重叠的区域，并避免对共同支撑外的结果进行回归分析。简单起见，假设人们对实验后的平均实验结果感兴趣。常见的共同支撑问题是：对照组企业的协变量值是否和实验组的协变量值范围重叠。之后，可以根据预处理协变量来估计每个企业的处理倾向[propensity to be treated]，然后在倾向评分上提供共同支撑。同样，也可以对选定的协变量提供共同支撑：
 。

2.5 协变量平衡

这样做的挑战是：找到一组协变量，这使得这些不稳定的条件变得合理。这通常需要包含一组相对广泛的协变量，这些协变量与工具变量或结果共同变化。较好的做法是在分析的“设计阶段”选择这些协变量，隐藏结果，使协变量的结果不会影响协变量的选择。学者们希望在控制观察到的协变量同时也可以控制未观察到的协变量。综述类文章强调了生成在广泛的可观察协变量集上相似的实验组和对照组的重要性。本文提倡在协变量上进行明确的平衡，而不是仅仅依靠回归。

在因果工具变量设置中，在两个方面添加协变量或对其进行匹配并不容易。首先，对于面板数据来说，通常只应包括非中间结果的时变协变量，但这可能会受到实验的影响。对于这些协变量来说，他们的预处理价值可能受到平衡，但是在2SLS回归中可能会被忽略。中间结果是否为重要的协变量可能受到实验的微弱影响，这需要根据理论进行判断。如果忽略了中间结果作为协变量，这会放大OVB的风险；如果考虑了将有无中间结果作为协变量的稳健性检验考虑进去，这会增加“中间结果条件”的偏差。其次，为了考虑异质因果效应，我们应该估计协变量的LATE条件（称为局部平均响应函数），然后在协变量空间上积分以获得整体的LATE估计量（Abadie 2003）。

然而，来自经典回归理论和观察研究设计的一个核心结论是，通过平衡似乎可以预测实验的协变量或将其纳入2SLS回归中，使不完美冲击更接近于与随机分配一样好的价值。我们在第6节中讨论了例外情况，其中不应在合理预测实验的观察到的协变量上进行平衡，或不应在2SLS回归中包括协变量。

2.6 修剪和平衡数据对样本大小和精度的影响

样本修剪主要有两大成本。首先，由于样本规模的减小，标准差将增大。例如，对于共同支撑中的DMO样本进行修剪，会使得样本从323实验组、582对照组减小到267实验组、343对照组。但是，对于论文来说，从大样本中通过回归方法得到的小标准误差，在共同支撑假设外推断的并不是一个恰当的测量值。其次，系数估计仅适用于样本修剪。但是，基于企业且不在共同支撑假设下的处理效应估计量并不是在任何情况下都适用。

平衡方法同样经常减小样本规模。例如，我们在第3节中对DMO实施的方法（倾向分数与替代值的一一匹配），当使用修剪后保留的所有343个控制企业时，样本留下了267个实验组的企业和156个对照组企业。然而，在这里也一样，除非平衡（修剪后）已经很好，否则通常没有更好的选择。在没有平衡的情况下发现的实验效果在平衡后减弱或失去统计意义，将是不可信的。

2.7 平行趋势

平行趋势假设——对照组单元和实验组单元在实验时期会经历平行变化。但是对于实验组来说，这种平行趋势不能直接观测到。但是我们可以在整个实验期间通过预处理时期的平行趋势来估计其合理性。我们可以通过图像展现出每一组整个时间的平均产出，同时也提供提前量—滞后量图像leads-and-lags graph，展示了整个期间的被评估的预处理效用。这些图像展示了预处理趋势是否是平行的，同时也展示了当和冲击相关时，实验效果[treatment effect]是否存在。非平行趋势对于DID设计来说是致命的，因为我们不知道如果没有实验，这些趋势是否是连续的、停止了的或者甚至是反转了。这些方法同样适用于shock-IV。

在工具变量设计中，我们可以提供两个阶段的leads-and-lags graphs：对于第一阶段的工具变量和第二阶段的结果变量来说都应该有冲击后平行趋势。若两个变量中任意一个不是平行的，这个设计就受到了威胁，通常不可靠的。一个冲击和公司特征交互的工具变量和三阶差分设计是相似的。平行性应该在双重差分和三重差分同时检验。

3. Reconsideration of Duchin et al. (2010) and Related Board Independence Paper

我们将运用上述理论，重新检验DMO及其系列（第三节）、Iliev（第四节）以及D&D（第五节）。除非特殊说明，所有回归都是用公司层面上的聚类标准差。这些文章不同之处在于他们报告的是T统计量还是标准差；我们在此统一报告T值统计量。

我们研究DMO（2010）这篇论文作为一系列董事会独立性论文的代表，这些文章使用了一个或者多个工具变量：Audit Committee IV, Minority-Independent IV, and Distance-to-Compliance IV。我们评估这三个工具变量，并主要关注DMO（2010）使用的变量：Audit Committee IV，同时关注文章没有进行预处理平衡对工具变量有效性造成的威胁。我们在附录中讨论其他两个变量的更多细节，还讨论DMO在设计中的其他关心的部分。

3.1 总览DMO和Audit Committee IV

DMO研究了两个问题：

（1）公司董事会中独立董事数量的改变是否影响2000-2005年的三个结果（托宾Q，资产回报率（ROA）以及股票收益率）？

（2）独立董事带来的影响是否因公司面临的国际环境不同而有所差异？

文章发现，当公司的信息成本较低，增加独立董事能够提高公司表现，反之成立。

DMO认为企业选择董事会成员的行为是内生的。DMO通过要求审计委员会独立性的法律冲击进行因果推断：NYSE和NASDAQ在1999年要求列表中的公司要在审计委员会中有100%的独立董事。在此之前，审计委员会允许存在多数独立董事，并不要求完全独立。这些要求也被包括在SOX中。DMO强调，这一法律的变化是一个外生冲击，与其他引起公司为了建立审计委员会而向董事会中添加独立董事的变量不相关。这些规则的改变只影响了那些在2000年缺少完全独立审计委员会的公司（规定在2000春季的股东大会后有效，此时大部分公司在选择他们的董事会）。因此，可以选择拥有完全独立的审计委员会的公司作为对照组。

3.2 协变量平衡和共同支撑

值得表扬的是，DMO报告了2000年的协变量平衡。我们在表1的前4列报告了DMO样本的协变量平衡性分析，其中还包括了DMO数据集中没有运用在分析中的变量。后3列报告了数据匹配、修剪后的协变量平衡情况。除了虚拟变量，其他的样本中的变量都具有很好的平稳性。

图1（b）展示了修剪和匹配后的样本表现情况。在共同区域内，实验组和对照组的公司情况相近，这表明AC-IV对董事会独立性的影响并不显著。

3.3 DMO Results Correcting for Technical Errors

我们从纠正DMO所犯的两个技术性错误开始分析。我们将简略讨论，详细见在线附录。

3.4 Theoretical Need to Balance on

3.5 Problems with the DMO Design Without Balance on

3.5.1. Overview of Falsification and Placebo Checks Without Balance on

3.5.2. Regression to the Mean in the DMO Design.

3.6 为AC-IV解决的不平衡问题

3.6.1. 修剪和匹配样本

3.7 评估冲击后的平行趋势

DMO仅使用2000年和2005年的数据，将结果计算为2000年和2005年之间的差异，统计2000年的协变量，然后对行业进行横截面回归。另一种方法是使用公司FEs、年度数据和聚集在公司上的标准误差进行真正的面板数据设计。有了完整的面板数据，可以使用领先和滞后图绘制两个阶段的年度系数估计；这对于是否有平行的预处理趋势以及每个阶段的结果是否在与冲击相关的时候出现都是非常有用的。如果结果有滞后性，则可以使用分布式滞后回归来捕捉冲击的全部影响。

3.8 董事会独立性工具变量的总结以及更长远的讨论

3.8.1
的协变量失衡和均值回归

董事会独立性工具变量在核心冲击后协变量
上具有严重的失衡。这个失衡再加上均值回归效应驱动着三个工具变量的表现强度。这三个工具变量均未通过安慰剂检验（placebo checks）：安慰剂工具在预处理年份具有很强的预测能力，实际工具和安慰剂工具在时间上的向后预测能力与在时间上的向前预测能力大致相同。在我们平衡了
后，（对于Audit Committee IV是可行的），第一阶段变得不显著，因此无法继续分析。

3.8.2 协变量失衡和三重差分的平行趋势

3.8.3 Only-Through Condition

Only-Through Condition要求审计委员会独立性的增加仅通过董事会独立性影响决策实验组的结果变量。人们必须相信，对审计委员会组成的冲击对ROA、托宾q或股票回报率没有直接影响。然而，为什么这是真的？完全独立的审计委员会可能（1）影响公司的会计选择，从而影响报告的利润，这将影响ROA；或（2）降低欺诈风险，从而导致投资者为相同的报告收益支付更多费用，这将影响托宾的q和股票回报。

3.9 DMO的理论可能仍然是正确的

如果独立董事面临获取公司特定信息的高成本，他们的效率就会降低，这个结论可能是正确的。但是在论文中，董事会独立性工具变量们太弱了以至于我们无法检验这个理论。

4. Reanalysis of Iliev (2010)

4.1 Overview

由SEC实施并由《多德-弗兰克法案》修订的SOX法案第404节要求公众持股量[public float, free float]（非内部人士持有的股份的市场价值）大于7500万美元的公司，从2004年起，其审计师应能够证明该公司有足够的内部控制。显然，遵守该法案会增加企业的审计成本，但学者们想知道具体会增加多少。对于大型的公有制企业来说，没有对照组，因此最好的研究就是断点时间序列，人们观察2004年前后审计费用的时间趋势，并寻找在2004年这一时点上相对该趋势的异常跳跃。但是，受法案外其它因素的影响，2004年的审计费用也有可能发生其它变化。

Iliev（2010）是一篇严谨的文章。在Atanasov and Black (2016)中，作者回顾了2001年至2011年期间在22个主要期刊上发表的863篇市政公司治理论文和74篇基于冲击进行研究的论文。只有两篇论文使用了断点回归，Iliev（2010）便是其中之一。他检查了协变量平衡性，包括对运行变量（持股数or公司规模）的灵活控制，改变断点附近的带宽，检查公司操纵公众持股数以规避遵守SOX法案的证据，并进行一系列的安慰剂检验和稳健性检验。他发现了阙值操纵的证据，并用一个巧妙且看似可行的工具变量解决了该问题，它的断点回归设计是可靠且谨慎的。

然而，我们关注的是Iliev对shock-IV的使用。他的工具变量貌似外生且可靠，但是这可能是一种假象。我们在之后证明：由于一些微妙的原因，他的断点回归设计在2002年采用SOX法案时产生了协变量平衡，但是到了2004年SOX法案真正生效时，并没有产生协变量平衡。单凭这一点并不能说明什么。当控制了适度的增长，遵守SOX法案假定的相关系数从0.744下降到0.706；我们首选的断点回归+双重差分设计估计的相关系数是0.586（审计费用增加了80%）。

更有趣的是，Iliev的工具变量设计导致了IV-compliers和对照组之间的增长存在严重的不平衡。我们在之后证明它的工具变量同时通过工具化变量（SOX法案的遵守）和遗漏增长变量（违反了“唯一通过条件”）来预测审计费用。IV compliers（遵守SOX第404节法案只是因为他们的工具变量要求这样做）同样很渺小，就像是一个不能代表所有遵守了SOX法案的公司（称为SOX complier）的子样本。我们同样表示了对导致Iliev使用了工具变量的关心—公司选择操纵公众持股量来避免遵守SOX法案的这种行为与较高的遵守法案成本有关—这对于他的研究来说并不是一个重要的话题。

4.2 Data Manipulations

我们从Iliev的数据集开始，这其中包括了2002年至2004年1492个个体公司。其中，816家公司有完整的公众持股量、审计费用和协变量的数据，有281家公司的2004年公众持股量在[50万美元，100万美元]这个区间内。在在线附录中，我们复刻了它的断点回归和工具变量回归的结果。

在我们的分析中，我们对2002年和2004年的公众持股数范围进行了系统性的改变。为此，我们重新定义了一个范围参数b，与之对应的区间是
。在我们的主要分析中，我们假设b=1.5，这意味着我们的公众持股数范围为[50万美元，112.5万美元]，这与Iliev设置的公众持股数范围相近。

4.3 Covariate Balance

我们假设表3-5的协变量平衡同时存在于2002年（7500万美元门槛限制前）和2004年（Iliev建立了自己的样本）。他估计平衡只出现在2002年，2004年并不存在协变量平衡。在表3，我们将未来的实验组公司（2002 float ∈ [$75M, $100M]）和潜在的未来对照组公司(2002 float ∈ [$50M, $75M))进行比较。除了规模及相关变量，这两组在Iliev的协变量是相似的。在表4（2004年），实验组和对照组的协变量也是相似的。

但是，SOX compliers和对照组的公司真的相似吗？在两张表中，我们包括了2002年至2004年公众持股量、市值、销售额和资产增长的变化。2002年，除了规模及其相关变量，阙值上下的公司表现是相似的。但是，SOX compliers的公众持股量和市值增长与对照组公司相比要慢得多（表4）。之所以产生这种差异，是因为SEC规则在公众持股数如何影响遵守规则的方面产生的作用是不对称的。公司可以达到规则要求，但并不能违背规则的规定。

因此，这违背了断点回归的核心假设。直到我们仔细思考哪些公司是IV compliers，哪些公司总是接受，又有哪些公司总不接受时，我们才发现这一违背。遗漏增长协方差在这里重要吗？论文中的回答是“并不重要”。在附录1的表格里，我们将增长变量添加到他的回归中，实验效应估计量从0.744降至0.706.但是，增长失衡成为了我们重新评估他们工具变量策略的核心。与对照组的公司相比，IV compliers（公司遵守法案，只因在2002年它的公众持股数大于7500万美元）拥有较高的失衡；与所有的sox compliers相比它的失衡也更高。

4.4 Impact of Growth Imbalance on Coefficient Estimates

接下来，我们主要通过图表分析来估计增长失衡对遵守SOX法案第404节成本的影响。首先，IV compliers是所有SOX compliers的一个特殊的子集。IV compliers必须在2002年具有超过7500万美元的公众持股量，还要在2003年和2004年将公众持股量降至7500万美元以下。这种负增长的轨迹是否能够至少部分解释他们在2004年的审计费用？

我们在图5中给予了肯定的回答。我们基于Iliev的数据样本，并将它们分为四组，绘制了ln(audit fee)和2004年公众持股数之间的关系图：

4.4.1. 41个shrinker-compliers（三角形）：2004年公众持股数小于7500万美元的SOX compliers，暗示着在2002年或2003年，它们的公众持股数超过了7500万美元。

4.4.2. 80个grower-compliers（菱形）：2002年公众持股数小于75M但是2004年公众持股数大于75M的SOX compliers。

4.4.3. 107个对照组公司（实心圆）：在2004年公众持股数小于75M，且从不受法案影响。

4.4.4. 43个large-compliers大型compliers（空心圆）：从2002年到2004年公众持股数持续高于7500万美元。

我们同样添加了两条线用来预测ln（2004 fees）。第一条线在左下角，它来自ln（fees）对公众持股量和常数项的回归，用来表示对照组公司的情况，在公众持股量达到7500万美元时结束。第二条回归线则包括了2004年公众持股量的全部情况，它用来表示SOX compliers的情况。我们将ln（fees）对公众持股量、常数项、shrinker compliers虚拟变量（是shrinker compliers时为1）回归。该回归线在公众持股数为7500万美元处跳跃，该跳跃反映了shrinker compliers于此是正相关系数的情况。

散点图和预测费用线则表明，控制了公众持股量后，shrinker compliers的审计费用要高于其他SOX compliers（shrinker compliers的相关系数为0.53）。如果我们用回归线来比较对照组公司和和2004年shrinker compliers7500万美元公众持股量的审计费用，两组关于ln（fees）的差值为1.07，这与Iliev的IV估计量相近。相比之下，如果我们将相同的对照组和超过了7500万美元公众持股量的SOX compliers两者的审计费用进行比较，预测费用的差值仅为0.54—这与我们之后讨论的DID/RD估计值十分相近。

我们现在可以看到不控制增长会如何导致Iliev在他的工具变量分析中高估SOX的合规成本。如果没有SOX，收缩compliers将比其他SOX compliers有更高的审计费用。这是令人信服的——这些公司曾经规模较大，且大规模的公司通常都保留着较高的费用。有些公司甚至会有更高的审计费用，因为他们可能存在业务问题，从而导致规模减小，这些都需要更多的审计来查明相关问题，从而导致了更高的审计费用。Iliev的工具变量估计值将收缩compliers和对照组的企业进行比较，这在估算SOX的合规成本时产生了较大的向上偏差。

图6说明了工具变量compliers和对照组企业在增长上的差异。图片展示了ln（2002 float）（x轴）和ln（2004 float）（y轴）的散点图。三条垂直虚线分别表示了2002年公众持股量达到5000万美元、7500万美元和1亿美元。水平线是2004年对应的情况。45°线则表示2002年至2004年公众持股量没有发生变化。IV compliers在图中右下角的红色方框中（2002年的公众持股量大于7500万美元，2004年的公众持股量小于7500万美元），这些点都位于45°线以下；对照组的公司位于图中绿色方框中（2002年和2004年的公众持股量均超过7500万美元），几乎所有的点（110/117）都位于45°线之上。对照组的公司ln（float）最大减少了0.20。在图中黑色方框中的其他SOX compliers代表了在2004年公众持股量高于7500万美元的公司。我们在表5中展示了增长上的不平衡，从2002年到2004年，ln（float）的均值变化（δln（float））在IV compliers中表现为-0.57，但是在对照组中表现为+0.96.

断点回归的最大优势就是在于除了运行变量（和相关替代变量），它在观测到的和未观测到的协变量上都会产生共同支撑和协变量平衡。但Iliev的工具变量设计和他最初对断点回归的设计大相径庭。当他逐步解决相关问题（一些公司在2004年操纵float是的符合SOX法案的要求）时，Iliev发现了增长不平衡这一更严重的问题。公众持股量的减少强烈预示着审计费用的变化，这意味着这种失衡是十分有害的。

IV compliers和对照组的公司在ln（float）增长上的表现几乎没有重合的部分。图7表示IV compliers和对照组的δln（float）不同范围的直方图。在δln（float）∈[-0.25,0]这个区间内，仅有7家对照组公司和六家IV compliers公司拥有共同支撑。这些是仅有的工具变量可靠的公司——但是它的样本太少以致不能支撑一个可靠的估计量。而且，即使共同支撑的样本足够大以致可以支撑推断的成立，他也仅仅代表了公司中的一小部分，不能代表全部公司的情况。

总而言之，Iliev构建的工具变量的精确度被对照组和IV compliers在增长上的失衡严重破坏。他的断点回归的相关设计也被破坏，但并不严重。我们接下来会讨论，当我们认识到两组之间存在增长上的严重不平衡时，学者们应该怎样做。但在此之前，我们先做出相关评价。由于增长失衡，Iliev的工具变量并不满足唯一通过条件。Iliev在2004年进行了横截面回归，他的断点回归应该保证除了运行变量，其他便将都存在协变量平衡。因此，他可能只观察到了2004年保持了平衡，却没有想过在动态方面是否存在失衡。我们很早就指出，增长是一个很重要的协变量，Iliev的工具变量估计值太高了。但是有很长一段时间我们没有搞清为什么会这样。毕竟，对增长的控制只会略微降低合规成本（从0.744到0.706）。

我们关注的是冲击基准的设计中对预处理平衡的普遍需要，而不是研究人员在特定研究中的特定要求协变量平衡时，特定的估计量是否通过检验。Iliev的断点回归设计通过检验，但是他的工具变量设计和断点回归设计真实情况下可能并没有协变量平衡。

对于我们来说，我们从Iliev的分析中得到的信息有：

1.保证工具变量有效性比较棘手。一个外生的工具变量是必要的，但并不充分。

2.学者应该使用大量的协变量，并检查它们是否平衡。如果Iliev这样做，他可能就会发现增长的不平衡，并妥善的解决了这一问题。

3.工具变量设计和生效的时间差可能会在工具变量生效时导致失衡，这种失衡并不会在工具变量设计时存在。

4.稍稍微背了唯一通过条件可能会导致工具变量估计量产生较大的偏差。

5.在共同支撑外用回归进行推断是很危险的。

6.学者应该讨论工具变量compliers是否能够代表整个样本的情况。

4.5 Our Preferred Analysis: DiD/RD Within Principal Strata Balanced on Growth

我们在这一节将要讨论如何处理实验组和对照组之间的增长失衡。首先，我们要定义2002年公众持股量的变化范围（冲击前）：[50万美元，112.5万美元]，这里假设参数b为1.5。Iliev定义了2004年的变化范围。我们通过研究2002年至2004年公众持股量具有相似变化的子样本公司，来解决对照组和SOX compliers在增长上的失衡问题。我们定义“缩小者”作为2002年float＞2004年float的公司。“缩小者”主要包括两种状态：（1）shrinker-compliers，指2002年公众持股量超过7500万美元，在2004年一定要遵守SOX法案的公司；（2）shrinker-controls，在2002年的公众持股量小于7500万美元的公司。由于合规要求是强制性的，两种状态的公司都要满足SOX法案的要求。此外，由于公司不能通过减小规模来规避SOX法案的限制，因此两种状态都不能包括SOX avoiders。Iliev担心SOX avoiders会具有相对较高的SOX法案合规成本，但这种猜想并不适用于shrinkers。

我们在图8（a）的阴影部分展示这两组。两种状态的平均δln（float）较为相似；我们在未报告的协变量表格中还验证了其他除规模外的协变量的平衡性这两组ln（audit fees）的DID估计值比较不应该因增长失衡而产生较大的偏差。

我们定义的第二种状态的两组企业是针对不太重要的增长的公司。其中SOX公司是指在2002年float小于7500万美元，在2004年float小于1.125亿美元，δln（float）大于0的企业；对照组公司是在2002年float小于7500万美元，同时在2002年float依旧小于7500万美元的公司。适度种植层状态的两组公司在图8（b）中用三角阴影来表示。这两组在除了规模和规模相关变量，其他协变量均平衡。

在表6中，我们报告了收缩者状态的两组公司、适度种植者状态以及总样本的固定了公司和年份效应下的双重差分回归结果。我们主要报告了三个部分：（1）除固定效应外没有其他协变量；（2）添加Iliev的协变量以及（3）添加了公众持股数之后的回归情况。在（3）考虑了最广泛的协变量之后，SOX法案的合规虚拟变量的估计的相关系数对于收缩者状态是0.606，适度种植者是0.507，总样本是0.586（审计费用增加80%）。综合阶层估计值远远小于Iliev工具变量估计值，略低于他的断点回归估计值（0.744），尽管没一个估计值都在其他估计值的95%浮动区间内。

4.6 Estimating the Magnitude of Selection Bias

我们还可以使用主要分层法来评估选择偏差的程度。因为具有较高合规成本的公司会更可能限制他的公众持股数来规避SOX404法案。选择偏差是Iliev使用工具变量的主要原因。当我们继续考虑“growers”阶层：（1）growers-forced-compliers，2004float＞2002float＞75M，（2）growers-voluntary-compliers，2004float＞75M＞2002float。如果选择偏差是一个严重的问题，则第二组的法规合规成本应耕地，因为SOX avoiders将从这组中移除。实际上，附录三便命令这两组在统计上差异很小。因此，实践中选择偏差是有限的，我们不需要工具变量去处理这个问题。

4.7 Parallel Trends

对于shrinkers和growers阶层来说，我们证实了尽管我们可以选择更长的预处理期，对于数据有限的预处理期（2002-2003），目前存在的平行趋势是可以接受的。可以查看附录3，我们看到2004年实验组的公司的审计费用预期上涨，其涨幅约为0.6，这与表6的结论一致。

5. Reexamination of Desai and Dharmapala (2009)

本文复现的第三篇shock-IV文章是D&D（2009）。这篇论文研究了税收避免对美国的公共公司的价值有什么影响，同时讨论了公司治理是否会调节这种效应。论文发现：更多的避税机会增加了公司的托宾Q值，但这种效应仅存在于具有较高机构所有权的公司。本文在下文重点讨论D&D提出的工具变量强度[IV strength]。

5.1 Research Design

D&D将1996年底通过的法律（美国私有制公司税收转移的“打勾规则”[check-the-box rules]，有效避免同一收入来源被多次征税）作为一种冲击，来进行因果推断。这些规则简化了小型私有公司的报告。但令人意想不到的是，这些规则还降低了跨国公司的避税成本。D&D将报告给股东的账面价值和报告给美国国税局的应税收入之间的差值（book-tax gap，BTG）作为公司避税活动的一种衡量方式。论文假设：在1996年法律修订之前，低BTG的公司拥有更多的避税机会。对于较高机构所有权的公司，较多的避税机会将增加公司的价值（用税收调整后的托宾Q表示）；而在治理较差的公司，公司内部人员将会占有额外的价值，从而不会提升公司价值。

但是，BTG是内生的，它可能被公司很多其他的属性影响，有时影响可能不可观测。D&D通过构建shock-IV来解决该问题：他们将1996年的冲击和三个BTG预测变量（预测了公司对其收入避税的需要，净营业亏损抵后，net operating loss carryforwards (NOLs) 公司发生的年度亏损只能由以后年度的所得税弥补,短期债务short-term debt, 和长期债务 long-term debt）进行交互，并按照总资产规模对变量进行调整。这三个变量依旧是内生的，但将他们和外生的shock进行交互，从而将这三个变量赋予外生性。论文将这三个变量在工具变量分析中作为协变量，从而解决“唯一通过条件”。在这些限制下，工具变量将仅通过BTG间接影响托宾Q值，这种影响并不直接或通过遗漏变量影响。因此，与DMO的系列论文不同，D&D对和他们工具变量相关的核心内生变量进行限制；如果不这样操作，可能会造成遗漏变量偏差[OVB]。

D&D的研究设计起初看来十分完善。论文有一个完全外生的冲击，充分捍卫了外生性。REStat的编辑和审稿人也对此深信不疑。但这种研究设计仍然存疑。税务专家提出：BTG对避税需求的衡量较差，机构所有权对于公司治理的衡量也没有那么好。本文忽略上述问题，专注研究当控制预处理平衡后，论文的表现如何。事实证明，即使D&D的研究理论正确，当控制了预处理平衡趋势后，他的研究设计仍然不显著。

D&D的协变量和控制的年份和公司的固定效应变量如下：总资产、薪酬总额、销售额、股价波动、经营业盈亏抵后、短期债务/资产、长期债务/资产、海外资产/收入、R&D投入。他们主要的因变量是税收调整后的托宾Q值[tax-adjusted Tobin’s q]。

5.2 Creating a Pre–Post Balanced Data Set

在研究设计阶段，本文首先要确定研究样本。D&D数据集包括了1993年-2001年期间至少观测到一次的862家公司。其中，有100家公司只被观测到一次，因此被公司的固定效应要求剔除样本。

D&D的工具变量是内生的BTG预测值和1996-冲击的交互，这种设计依赖于冲击的外生性。对于样本仅在1996年前或1996年后的公司，本文无法进行研究。在762个有效的样本中，仅有510个公司同时出现在1996年前后，在其他的252家公司中，有80个公司仅在1996年出现，这些公司会影响协变量的系数，但并不直接影响工具变量的估计，因为其交互项为0。相比之下，仅在1996年出现的公司更令人头痛。因为其工具变量和BTG预测因子相同，同样是内生的。因此，本文应将样本数据限制在1996年前后均出现的510家公司。

在这其中，有487家公司在1996年和1997年具有数据，因此，其他23家公司需要从样本中移除。这23家公司与487家公司相比，协变量的表现也存在不同。鉴于此，本文最终的前后平衡研究样本限制在拥有1996年和1997年数据，同时在1996年前后均观测到的487家公司。

5.3 IV Strength（D&D Table 4）

在线附录的表DD-App1对D&D的公司固定效应估计量进行了复刻。在表7，我们转而研究论文的工具变量策略。我们对表7中的（1）和（3）方程用原文样本进行回归，复现了D&D的第一阶段工具变量的结果，同时我们用前文得到的前后平衡样本进行相同的操作。在原始的样本和模型中，工具变量是统计性显著，但是强度较弱，他们的F统计量（3.33&3.00）均未通过F＞10的经验准则。当我们对样本进行平衡，F统计量降低到1.48和1.05,；工具变量不再统计性显著。

原始的样本之所以工具变量显著，主要是受仅在1996年之后出现的公司影响，这些公司的工具变量是内生的。我们在在线附录中展示了他们第二阶段的结果和三重差分的结果均不显著。(Tables DD-App-2 and DDApp-3)。

本文强调，DID和shock-IV研究设计均利用了冲击的价值。DID会自动将样本限制在冲击前后均出现的范围中。因此，如果D&D同时使用了上述两种方法，那么样本不平衡的问题就不会存在。

5.4 Covariate Balance and Parallel Trends

对于一个基于交互项的工具变量，文章应该用多种方法确保协变量平衡性，从而探索交互项的各个方面。我们在表8对此进行说明。

我们基于1996年的属性，将公司分为实验组和对照组，给出了前后平衡样本的协变量平衡结果。在面板A，我们基于工具变量BTG，将公司分为实验组和对照组。实验组具有低于中位数的BTG，因此，在D&D的论文中，低BTG的公司具有更高的避税需求。对照组有高于中位数的BTG值。在面板B，我们基于1996年的机构所有权将样本进行划分。实验组具有高于中位数的机构所有权，因此他们在避税机会中收益更多。在面板C中，我们基于根据D&D工具变量的协变量衡量的应税收入保护的需要进行划分。为了构建该指标，我们依据前文提到的三个变量将样本进行排序，并用排序等级的总和定义一个虚拟变量：
，当实验组的公司低于排名的中位数，记为1，否则为0。

在每个面板，我们报告了实验组和对照组1996年D&D协变量的均值，我们同样报告了双样本检验的T统计量，将其用于检验均值和归一化之后的差异。

在面板A和B中，实验组和对照组在大多数协变量上相对平衡，但是，低BTG的公司具有显著的高股价波动，高机构所有权的公司给予高管更多期权，作为其薪酬总额的一部分。当我们根据
对公司进行分类时， C组中的平衡情况表现很差。

实验组和对照组之间的差异增加了实验时期非平行趋势出现的风险。如果D&D的结果在目前的操作中一直显著，此时学者希望用平衡的方法来解决目前不平衡的问题。我们在对DMO的复查中说明了这一过程。实际上，D&D样本在冲击前后它的托宾Q值均存在非平行趋势。1996年，在法案生效之前，实验尚未开始，对照组相对于实验组的托宾Q均值上升；在冲击之后过了很久，它在1999年再次上升，然后在2000年和2001年下降。1999年至2001年的变化表明，人们对20世纪90年代末的技术泡沫有不同的反应。2000年和2001年，技术泡沫破灭。鉴于这些非平行变化有时与冲击无关，即使人们发现1997年与1996年对托宾q值有影响，也不能自信地将其归因于冲击。

关于工具变量，参看1.内生性问题操作指南, 广为流传的22篇文章，2.看完顶级期刊文章后, 整理了内生性处理小册子，3.如何寻找工具变量？得工具者得实证计量，4.内生性处理的秘密武器－工具变量估，5.工具变量在社会科学因果推断中的应用，6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例，7.没有工具变量、断点和随机冲击，也可以推断归因，8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析，9.工具变量IV与内生性处理的精细解读，10.我的"工具变量"走丢了，寻找工具变量思路手册，11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性，12.豪斯曼, 拉姆齐检验，过度拟合，弱工具和过度识别，模型选择和重抽样问题，13.工具变量先锋 Sargan，供参考，14.AEA期刊的IV靠不靠谱？15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom，16.GMM是IV、2SLS、GLS、ML的统领，待我慢慢道来，17.IV和GMM相关估计步骤，内生性、异方差性等检验方法，18.因果推断IV方法经典文献，究竟是制度还是人力资本促进了经济的发展？19.内生变量的交互项如何寻工具变量, 交互项共线咋办，20.面板数据、工具变量选择和HAUSMAN检验的若干问题，21.IV和Matching老矣, “弹性联合似然法”成新趋势，22.IV回归系数比OLS大很多咋回事, 怎么办呢? ，23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献，24.找不到IV, RD和DID该怎么办? 这有一种备选方法，25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS，26.内生性, 工具变量与 GMM估计, 程序code附，27.GMM和工具变量在面板数据中的运用，28.关于工具变量的材料包, 标题,模型,内生变量,工具变量，29.必须使用所有外生变量作为工具变量吗？30.工具变量精辟解释, 保证你一辈子都忘不了，31.毛咕噜论文中一些有趣的工具变量！33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析，34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了！35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计！36.如何通过因果图选择合适的工具变量？一份关于IV的简短百科全书，37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑！因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案！实证研究必备工具！39.中国女学者与其日本同行在JPE上发文了！利用独特数据, 地理断点RDD和IV研究中国环境议题！40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差，41.内生性处理的秘密武器－工具变量估计，42.工具变量IV必读文章20篇, 因果识别就靠他了，43.看完顶级期刊文章后, 整理了内生性处理小册子，44.“内生性” 到底是什么鬼? New Yorker告诉你，45.Heckman两步法的内生性问题(IV-Heckman)，46.最全估计方法，解决遗漏变量偏差，内生性，混淆变量和相关问题，47.非线性面板模型中内生性解决方案，48.内生性处理方法与进展，49.内生性问题和倾向得分匹配，50.你的内生性解决方式out, ERM独领风骚，51.面板数据是怎样处理内生性的，52.计量分析中的内生性问题综述，53.一份改变实证研究的内生性处理思维导图，54.Top期刊里不同来源内生性处理方法，55.面板数据中heckman方法和程序(xtheckman)，56.控制函数法CF, 处理内生性的广义方法，57.二值选择模型内生性检验方法，58.2SRI还是2SPS, 内生性问题的二阶段CF法实现，59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法！60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用，61.如何选择合适的工具变量, 基于既有文献的总结和解释！62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码！63.弱工具变量的稳健性检验, 附上code和相关说明！64.工具变量对因果效应的识别和外推, 大牛的顶级评述！65.刚2022年, Acemoglu就在QJE上发文了！OLS+IV走遍天下都不怕！66.如何在AER上用OLS发经济史研究, 这篇道出了验证IV合理性的标准范式! 必读，67.怎样找到一个巧妙的工具变量, IV在公共政策评估中的应用，68.Bartik工具变量是什么? 份额移动法IV应用越来越多，69.阿西莫格鲁又一篇使用IV做因果推断的经典文献, 拿起小板凳一睹为快！70.AER教你两种论证IV合理性的实证策略, 以及如何对IV做安慰剂检验，71.我们应该在多大程度上相信工具变量估计, 基于63份顶刊复制结果的操作建议

关于DID，参看：1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏！2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文！3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢？4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习，5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据，6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章，7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码！8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了！9.前沿, 模糊双重差分法FDID方法介绍和示例, 附code和数据！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

2.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。