Change-in-Change(CIC):双重变化模型

发布时间:2020-10-12 阅读 423

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:李安琪 (华东师范大学)
邮箱anqili@stu.ecnu.edu.cn

[编者按]: 本文介绍的内容来自如下论文,特此致谢!

[Source]: Athey, S., & Imbens, G. W. (2006). Identification and inference in nonlinear difference‐in‐differences models. Econometrica, 74(2), 431-497. -Link-


目录


1. 双重变换模型简介

1.1 CIC 模型的应用背景

标准的 DID 模型使用条件较为严苛,即必须满足平行趋势(CT)假设、SUTV 条件,以及线性形式条件。

  • 平行趋势假设:1. 那些无法观测的因素不会影响某一特定个体进入处理组的概率,也就是说,每个样本是进入处理组还是控制组是完全随机的;2. 处理组和控制组个体的某些特征不会随着时间变化而呈现出不同的变化;

  • SUTVA 条件:政策干预只影响处理组,不会对控制组产生交互影响,或者政策干预不会产生外溢效应;

  • 线性形式条件:潜在结果变量同处理变量和时间变量满足线性条件。

在使用 DID 模型时,若研究者没有考虑以上条件,如忽略处理组和控制组之间随时间而变化但却无法观测到的异质性因素,则估计出来的政策效果就是有偏误的。

对于一个只有两期两组的极端数据,我们很难知道其是否符合平行趋势假设。因为政策(事件)在不同阶段下不仅可能改变估计结果的均值和方差,而且在个体之间的影响也会不同。因此,为了克服经典的 DID 无法解决的异质性处理效应问题,Athey 和 Imbens (2006) 提出了可以适用于连续型解释变量的非线性双重差分方法(Nonlinear Difference-in-Difference,NL-DID),也称为双重变换模型 (Changes in Changes,CIC) ,它不依赖于函数形式,也允许时间变化与政策干预下对不同个体影响有所不同。

1.2 CIC 模型的识别与推断

CIC 模型假设处理组和控制组的潜在结果具有异质性分布,群体和时间周期的处理前提可以是非对称性。通过该假设可以构造处理组的 “反事实” 分布,识别更加有效的处理效应分布,因此可以用来评估非随机实验的政策效果问题。

其具体原理是将控制组经验分布的反函数作为处理组 “反事实” 的分布函数,进而求出处理组的 “反事实” 的潜在结果,最后将处理组的可观测结果均值和 “反事实” 的潜在结果均值的差作为平均处理效应。

CIC 模型与经典 DID 方法不同的是其假设控制组个体的结果变量满足非线性形式而不是简单的线性形式。

假设可以观察到 i.i.d 的三元组(Y,D,T),其中 Y 为结果变量,D 为区分控制组、实验组的 indicator,T 为时间的 indicator,I=D·T 为处理的 indicator,观察到的 Y 实际为:

其中,使用三个可以观测到的分布函数,FY10、 FY001 和 FY01 , 分别表示在给定组别和时间下的条件分布函数,得到了观察不到的 FY11N(y) 分布函数(表示控制组的 “反事实” 分布)。

当第二个时期的结果变量在个体中是无法观测的部分 u 时,且 h(u,0)=yFY11N 分布函数使等同于 kClC(Y10) 的分布。最终,得到具有异质性的平均处理效应:

这个结论的证明也相对简单,感兴趣的读者可以参考原文。除此之外,文章中还提供了一幅图:

对于一个处理组第 0 期的 y,我们可以找到控制组的对应的第 0 期的 y 值,及其分布函数值 FY,00(y)=q 。由于假设了 YN 对 U 是单调的,且给定 GU 与 T 是独立的,因而可以直接找到 q 对应的控制组第 1 期的分布函数对应 q 的点,其对应的 y 与 y 的差值就是给定 U 控制组的 y 的变化大小,从而得到了处理组在第 1 期的反事实分布。图中白线即为得到的处理组第一期的反事实分布。

1.3 CIC 模型的适用性

当我们想要减少因个体异质性而产生的估计偏误或想要进一步研究不同分位数下的政策效果时,可以利用 CIC 模型。但是,CIC 模型存在以下两个问题:

  • 在存在协变量的情况下缺乏可预测的估计量,需使用带协方差的 CIC 模型,具体可通过 CIC 模型拟合如下回归模型: 通过构造新的关注变量 Y¯=α+βT+γG+λI+e 先行削除变量 x 的影响,再对 Y¯ 应用上述方法估计出不同分位点的分布处理效应;
  • 当处理组为连续型变量时,CIC 方法不适用。

2. 双重变换模型 Stata 命令安装与实操

2.1 CIC 模型的命令安装

ssc install cic, replace

与此同时,我们还必须安装 qrprocess 命令。

ssc install qrprocess, replace

2.2 CIC 模型的命令使用与展示

sysuse nlsw88, clear
set seed 1
gen TREAT = uniform() < .5
replace wage = wage + TREAT
gen POST = uniform() < .5
replace wage = wage - POST
cic continuous wage TREAT POST, vce(bootstrap, reps(50))
bootstrap, reps(50): cic all wage TREAT POST, at(50 90) did vce(none)
cic all wage TREAT POST, vce(delta) at(50)
cic dci wage TREAT POST i.occupation, at(50) vce(bootstrap, reps(50))

3. 双重变换模型案例详解

案例论文: Lucas, Adrienne M., Mbiti, & Isaac M. (2012). Access, sorting, and achievement: the short-run effects of free primary education in kenya. American Economic Journal: Applied Economics. -Link-

3.1 文章简介

2003 年 1 月,肯尼亚政府取消了对公立小学的所有收费,实行小学义务教育政策 (Free Primary Education,FPE)。尽管该政策受到国际赞誉,但是不久后,公立学校开始没有额外教师或教室吸纳新生。

作为公立学校,学校会被要求尽可能多地接收学生。以至于,2007 年班级平均人数增至 84 人左右,且学生成绩开始下降。之所以如此,是因为 FPE 政策可能会使更富有或更高能力的同龄人进入私立学校。

在此背景下,Lucas 和 Mbiti (2012) 先使用 DID 方法,来评估 FPE 政策对不同地区的影响。随后,进一步使用 Athey 和 Imbens (2006) 一文中提到的 CIC 模型策略,来评估肯尼亚 FPE 政策对市区小学升学考试成绩分布以及入学分流(私立、公立)的影响。

3.2 研究设计

3.2.1 参照组与对照组设置

尽管 FPE 政策是全国性的,但由于政策出台之前,在升学率为 100%(或辍学率为 0%)的地区,该政策的影响应该很小甚至没有,而在升学率最低的地区,该政策的影响应该很大。

为此,作者利用肯尼亚不同地区的 FPE 政策强度的差异,假设接受政策干预的处理组的反事实状态(即考试成绩的分布)同控制组的分布一样。然后,用市区中辍学人数占八年级(毕业班)总人数的比例衡量小学义务教育政策实施的强度,并将强度大于平均值的市区作为处理组,将强度低于平均值的市区作为控制组,将标准化的升学考试成绩作为衡量政策效果的变量。

3.2.2 研究框架

在这个假设下,构建 DID 模型:

其中,ysjt 是第 t 年 j 区 s 类学校(公立或私立)的结果(例如,毕业生人数);intensityjt 是政策的有效强度;publics 是一个虚拟变量,对于公立学校等于1; δs 是一个虚拟变量,对于私立学校,等于1;