倍分法(DID)的标准误:不能忽略空间相关性

发布时间:2020-07-20 阅读 205

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者: 伊凌雪 (中央财经大学)
邮箱: yilingxue99@163.com

本文主要编译自如下论文:

Source:- Ferman, Bruno. 2019. “Inference in Differences-in-Differences: How Much Should We Trust in Independent Clusters?” MPRA Paper. [PDF]

本文来自专辑: 连享会专题 - 倍分法 DID


目录


1. 简介

倍差法 (DID) 是识别应用经济学中因果关系使用最广泛的方法之一。然而,在 DID 模型中存在序列和空间相关性会导致推理变得复杂。 Bertrand 等 (2004) 表明如果不考虑序列相关性,在 DID 模型应用中会导致过度拒绝,之后,大多数应用DID模型的论文采取了假设对任意形式的序列相关性都稳健的推理方法,但是这些论文大多都没有考虑空间相关性。Barrios et al. (2012) 表明,在聚类中进行随机分配处理时,忽略空间相关性并不会产生推理的问题。在本文中,作者考虑了在处理非随机分配问题中, DID 模型忽略空间相关性的后果。

2. 文章的主要思想和核心结论

本文的核心观点是 DID 模型中空间相关性问题主要取决于该组未吸收的分组和时间固定效应, ηjt 代表 DID 模型中未观察到的变量,该变量在控制了分组和时间固定效应后仍然存在。因此, DID 模型中的推理只有在假设误差项 ηjt 的序列和时间相关性时才可能成立,而在多数研究中的是DID模型推理没有对 ηjt 的时间相关性进行限制。标准的DID模型如下:

其中 Yjt为 j 组在时间 t 的结果变量, djt 是指示变量,如果在时间 t 对第 j 组进行处理,则该变量等于 1 ,否则为 0 。参数 α 定义为 djt 对于 Yjt的因果效应,而 θj 和 γt 分别是分组和时间固定效应。误差项 ηjt 代表在控制了分组和时间固定效应后仍然存在的未观察到的变量。

规定 N1 为处理组、N0 为控制组和 T 为时间段。我们假设从日期 t 开始,所有处理组的 djt 均为 1 。设 I1I0 ) 是处理 (控制) 组的指数集合,而 T1T0 )是处理后 ( 前 ) 时期的指数集合。在 Ferman 和 Pinto (2019) 的基础上,我们考虑每组 j 的平均误差的前后差异,其计算公式如下:

在DID模型中,只有在假设误差项 ηjt 序列或空间相关性时,才能进行推理。最常见的是,DID模型的推理方法没有对 ηjt 时间相关性进行限制,可以由误差 Wj 的线性组合得到,假设 ηjt 在 Wj 组中是独立的。

当假设 j 独立时,最常见的选择是依据聚类稳健方差估计 (CRVE) 进行群体层面的集群,直到自由度修正, CRVE 由下式给出:

W^j=1TttT1η^jt1ttT0η^jt 是 DID 回归残差的线性组合。假设跨 j 独立,当 N1N0 →  时, CRVE 提供渐近有效的推论。然而,如果 Wj 在 j 之间存在相关性,那么不考虑这种空间相关性会导致对真实标准误差的严重低估,则会导致过度拒绝。

为了证明这个想法,我们列出一个遵循潜在结果的线性因子的模型,并推导出当考虑这样的基础模型时所隐含的 Wj 。令 Yjt(0)(Yjt(1)) 为 j 组在时间 t 时未处理 (处理) 的结果。

其中 λt 是共同冲击的 (1×F) 向量,而 μj 是因子载荷的 (F×1) 向量,决定了 j 组受到共同冲击的影响。我们假设所有空间相关性都被线性因子结构吸收, ϵjt 在 j 上是独立的,但是 ϵjt 和 λt 任意序列相关。通过参考DID估计量的分布,并基于 λtμj , 和 ϵjt 的重复抽样框架分布推断参数 α

本节给出的结果强调了以下情况:当空间相关性被忽略时,线性因子模型结构会使空间相关冲击导致推理问题,忽略该空间相关性的估计标准误将被低估,会导致过度拒绝。当处理前和处理后公因子的平均值相近时,与空间相关的冲击变得无关紧要。重要的是,无论 λt 的序列相关性如何,该结果都是有效的。相比之下,处理组和控制组的因子载荷平均值相似,对空间相关冲击会减弱。

3. 使用真实数据集进行模拟

本文通过两个真实的数据集,美国社区调查 (ACS) 和当前人口调查 (CPS) ,对前面提出的结论进行模拟。遵循Bertrand (2004) 等使用的策略 ,随机生成安慰剂干预措施,然后评估基于忽略空间相关性的推断而拒绝零值的模拟比例。

3.1 ACS模拟

本文通过对2005年到2017年的美国社区调查 (ACS) 数据进行模拟,并选择两个状态和两个时期,然后在第二个时期在公用微数据区 (PUMA) 级别分配处理。由于预期状态级别存在未观测到的协变量,因此公用微数据区存在潜在的空间相关性。作者考虑了两种不同的处理分配,一种是公用微数据区与其状态无关的随机分配治疗,另一种是在状态级别分配的处理。

将样本限制为25至50岁之间的女性,并将工资和就业状况作为结果变量。通过 DID 回归,使用 PUMA 级别聚集的标准误来检验零假设。因此,推理方法允许同一公用微数据区中个体之间存在任意相关性,但限制在不同公用微数据区中个体的误差项是独立的。由于处理都是随机分配的,如果推理顺利进行,则应在 5% 的时间内拒绝零假设。

图 1 显示了使用 ACS 数据的模拟的拒绝率。处理前后之间的距离 (δyear ) 从 1 到 10 年不等,预处理期间为 2005 年至 2017 年 δyear  。结果显示的是 25 至 50 岁妇女的工资 (图1 A) 和就业状况 (图1 B) 。这些结果与第 2 节中的结论相吻合,即当处理前和处理后时间段之间的距离很短,则分组固定效应会吸收大部分空间相关性。然后,处理前后时期之间的距离较大,分组固定效应将吸收较少的空间相关性,会产生严重的过度拒绝。双向集群可能会低估标准误差,因为没有考虑对于 jj 和 ttηjt 和 ηjt 之间的相关性。

3.2 CPS模拟

通过对 1979 年到 2018 年的 CPS 数据进行模拟,选择两年和两个年龄组。在这些模拟中,我们将一对 (状态 × 年龄) 视为 i 组,并使用包含时间固定效应和状态 × 年龄固定效应的DID模型估计处理效应。基于聚集在状态级别标准误来检验无效的零假设。因此,我们假设处于不同状态的个体的误差项是独立的。

在这些模拟中,我们现在可以测量前期和后期 (δyear ) 之间以及处理组和控制组 (δage ) 之间的接近度。因此,在本示例中,可以验证第 2 节中的结论,即当 (i) 处理组和控制组更为相似,或者 (ii) 处理前时期接近处理后时期时,相关冲击应该会减轻。

图 2 显示了使用 CPS 数据的模拟的拒绝率,我们考虑了所有成对年份和年龄的组合。初始时间段为 1979 年至 2018 年 δyear 。初始年龄为 25 至 50δyear 。对于每个模拟,我们运行 DID 回归并使用在状态级别上聚集的标准误来检验原假设。结果变量是工资 (图2 A) 和就业状况 (图2 B) ,分别考虑了每个模拟中年龄相同的女性。

总体而言,这些模拟结果与第2节中针对线性因子模型得出的结果一致,只有在处理后和处理前期间 ( δyear  较大) 以及处理组和控制组 ( δage  较大) 之间存在显著差异时,会产生严重过拒绝。

3.3 蒙特卡洛模拟-双向聚类

本文通过展示一个小型的蒙特卡洛 (MC) 模拟,以分析DID设置中的双向集群的属性。这里给出一个简单的例子,其中有100个小组,一半是处理组,一半是控制组,其中,当 jT1 时, Yjt=λt1+ϵjt ,当 jT0 时, Yjt=λt0+ϵjt。这些结果证实了前文提出的观点,即双向集群可能会低估标准误差,因为没有考虑对于 jj 和 tt , ηjt 和 ηjt 之间的相关性。

表1给出了模拟的拒绝率。第 1 列显示基于稳健标准误差的拒绝率 (没有聚类) 。第 2 列显示了基于分组聚类的标准误差的拒绝率。第 3 列显示了基于分组和时间水平上的双向聚类标准错误的拒绝率。

4. 可能的解决方案和建议

4.1 可能的解决方案

结果表明,如果不对误差的时间序列或横截面相关性附加其他假设,DID估计量则不可能得出有效的推论。为了说明这一点,如果我们不对误差的结构施加任何限制,那么误差项 ηjt 方程在公式 (2) 中可能是这样的:

问题的核心是,如果我们想让误差在两个维度之间相互关联,那么至少需要在一个维度上测量距离。在时间序列或横截面中对至少一维的误差结构施加限制,当假设误差在 j 上是独立的时,即使不对时间序列相关性施加任何限制,也可以提供有效的推论 ( 例如 Arellano ( 1987 ) 和 Bertrand 等 ( 2004 ) ) 。这些方法大多数将依据渐近理论,使其组数达到无穷大。尽管测量距离在时间序列维度上是自然的,但在横截面上却不明显,所以当周期数小时,就很难进行推理。

4.2 作者的建议

结果显示,当 (i) 公因子在处理前后的平均值之差的二阶矩很大时,并且 (ii) 因子载荷在处理组和控制组的分布有很大差异,或因子载荷表现出空间相关性时,可能导致严重的过度拒绝。因此,在这种情况下,应确保以上两种情况中至少有一个条件不满足。一个可能的建议是将样本限制在处理前和处理后的几个时期。群体固定效应将吸收未观察到的常见冲击,从而使得假设独立群体的推断更加可靠。

另一方面,如果实证工作的重点是估计政策变化的长期影响,那么就不可能通过将样本限制在政策变化前后的时期内来最小化 E[(λ¯post λ¯pre )2] 。因此,应确保处理组和控制组尽可能相似,这样可以使得空间相关性的更大部分被年份固定效应所吸收。

在多个预处理期的情况下,也可以进行安慰剂检验,以测试空间相关性是否存在问题。这些结果表明,空间相关性的预测试可以提供有关基于 CRVE 推断是否可靠的信息,预测试也可以测试空间相关的冲击,这样不会增加额外的问题。

5. 结论

本文分析了在倍差法 (DID) 模型推理中忽略空间相关性的问题。如果空间相关性结构遵循线性因子模型,当存在以下两种情况时我们将说明忽略这种相关性的推理仍然是可靠的: (i) 公因子在处理前后的平均值之差的二阶矩很低;或者 (ii) 处理组和控制组的因子载荷分布具有相同的期望值,并且没有表现出显著的空间相关性。本文通过真实数据集进行的模拟证实了这些结论。在此基础上,提供了有关如何最大程度地减少由于空间自相关性引起的推理问题的方案,并分析了空间相关性预测试属性的建议。

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD