互助问答第301期：关于面板数据的PSM问题

关于面板数据的PSM问题

老师：

您好！我在微信公众号上看到了互助问答第289期的详细解答，您在其中建议可找工具变量并指出方法服务研究而非指导研究这一观点，让我收益颇多，谢谢您！这里我还想再追加问一些问题。

（1）就上次提到的关于学生打工的例子，虽然不像一项政策实施一样具有明显的干预期，但有的学生在10个学期中存在打工情况，有的学生从未打工，所以如果从匹配的角度进行处理可以吗？在这10期中有过打工的看作处理组，无打工经历的作为控制组，通过PSM后再计算打工对学生成绩的影响，这样存在什么问题吗。

（2）另外再请教一下，截面数据的PSM和面板数据的PSM在操作上的差别是什么呢？如果作一般的面板数据的匹配（非PSM-DID这一类情况），是否需要分时期匹配和合起来回归呢？比如分学期对打工学生和本学期没打工的学生进行匹配。陈强老师《高级计量经济学及stata应用》中第28章第6节关于倾向得分匹配的示例（第二版第549业)的操作命令是处理面板数据的情况吧，该命令为：psmatch2 处理变量t 协变量x，outcome（因变量Y）neighbor（1）ate ties logit common。

再次打扰，谢谢老师了！

你的数据是学生的面板数据，因变量是学习成绩，关键自变量是打工。学生打工的情形非常复杂，有可能10个学期从没打过工，有可能连着10个学期打工，还有可能有的学期打工，有的学期不打工。你问的两个问题实际上就是一个问题：基于这样的数据，如何进行匹配操作。首先，你可以在每个学期中匹配该学期中打工和没打工的同学，然后把所有学期匹配好的样本整合在一起分析。整合在一起后，需要利用面板数据的优势（比如纳入个体固定效应，实际上就是PSM-DID的一般思想）。如果如你所说不做类似于PSM-DID的处理，那就只是把数据混在一起当截面数据使用，是浪费了面板数据的优势。但是，这种按学期分别匹配再整合的方法至少有两个缺点。第一，因为不同学期有不同的匹配过程，所以不同学期匹配起来的样本可能有明显差异，比如有的同学出现在第1学期匹配好的样本中，但是不在第2学期匹配好的样本中。这样就不能充分利用面板数据的追踪特性。第二，每个学期都重新匹配的做法实际上只能反映当前学期打工对成绩的短期效应，也即遮蔽了打工的历史经历对成绩的长期影响。因此，下面的方法可能更好一些。如果学生在10个学期中曾经打过工，就归入处理组；如果从未打过工，就归入控制组。然后根据第1学期之前的初始特征对处理组和控制组学生进行匹配（也即只匹配这么一次。这次匹配实际上是基于初始截面数据的匹配：每一行观测值代表一个学生，所有变量都是第1学期之前的初始特征，可以利用psmatch2等命令操作，但首先得整理出这样的截面数据。）。将匹配好的两组学生以及他们后续所有学期的数据整合在一起（通过学生ID进行merge），利用面板数据的特性进行回归，这样可以一定程度上缓解上述两个问题。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。