Change-in-Change(CIC):双重变化模型

发布时间:2020-10-12 阅读 111

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:李安琪 (华东师范大学)
邮箱anqili@stu.ecnu.edu.cn

[编者按]: 本文介绍的内容来自如下论文,特此致谢!

[Source]: Athey, S., & Imbens, G. W. (2006). Identification and inference in nonlinear difference‐in‐differences models. Econometrica, 74(2), 431-497. -Link-


目录


1. 双重变换模型简介

1.1 CIC 模型的应用背景

标准的 DID 模型使用条件较为严苛,即必须满足平行趋势(CT)假设、SUTV 条件,以及线性形式条件。

  • 平行趋势假设:1. 那些无法观测的因素不会影响某一特定个体进入处理组的概率,也就是说,每个样本是进入处理组还是控制组是完全随机的;2. 处理组和控制组个体的某些特征不会随着时间变化而呈现出不同的变化;

  • SUTVA 条件:政策干预只影响处理组,不会对控制组产生交互影响,或者政策干预不会产生外溢效应;

  • 线性形式条件:潜在结果变量同处理变量和时间变量满足线性条件。

在使用 DID 模型时,若研究者没有考虑以上条件,如忽略处理组和控制组之间随时间而变化但却无法观测到的异质性因素,则估计出来的政策效果就是有偏误的。

对于一个只有两期两组的极端数据,我们很难知道其是否符合平行趋势假设。因为政策(事件)在不同阶段下不仅可能改变估计结果的均值和方差,而且在个体之间的影响也会不同。因此,为了克服经典的 DID 无法解决的异质性处理效应问题,Athey 和 Imbens (2006) 提出了可以适用于连续型解释变量的非线性双重差分方法(Nonlinear Difference-in-Difference,NL-DID),也称为双重变换模型 (Changes in Changes,CIC) ,它不依赖于函数形式,也允许时间变化与政策干预下对不同个体影响有所不同。

1.2 CIC 模型的识别与推断

CIC 模型假设处理组和控制组的潜在结果具有异质性分布,群体和时间周期的处理前提可以是非对称性。通过该假设可以构造处理组的 “反事实” 分布,识别更加有效的处理效应分布,因此可以用来评估非随机实验的政策效果问题。

其具体原理是将控制组经验分布的反函数作为处理组 “反事实” 的分布函数,进而求出处理组的 “反事实” 的潜在结果,最后将处理组的可观测结果均值和 “反事实” 的潜在结果均值的差作为平均处理效应。

CIC 模型与经典 DID 方法不同的是其假设控制组个体的结果变量满足非线性形式而不是简单的线性形式。

假设可以观察到 i.i.d 的三元组(Y,D,T),其中 Y 为结果变量,D 为区分控制组、实验组的 indicator,T 为时间的 indicator,I=D·T 为处理的 indicator,观察到的 Y 实际为:

其中,使用三个可以观测到的分布函数,FY10、 FY001 和 FY01 , 分别表示在给定组别和时间下的条件分布函数,得到了观察不到的 FY11N(y) 分布函数(表示控制组的 “反事实” 分布)。

当第二个时期的结果变量在个体中是无法观测的部分 u 时,且 h(u,0)=yFY11N 分布函数使等同于 kClC(Y10) 的分布。最终,得到具有异质性的平均处理效应:

这个结论的证明也相对简单,感兴趣的读者可以参考原文。除此之外,文章中还提供了一幅图:

对于一个处理组第 0 期的 y,我们可以找到控制组的对应的第 0 期的 y 值,及其分布函数值 FY,00(y)=q 。由于假设了 YN 对 U 是单调的,且给定 GU 与 T 是独立的,因而可以直接找到 q 对应的控制组第 1 期的分布函数对应 q 的点,其对应的 y 与 y 的差值就是给定 U 控制组的 y 的变化大小,从而得到了处理组在第 1 期的反事实分布。图中白线即为得到的处理组第一期的反事实分布。

1.3 CIC 模型的适用性

当我们想要减少因个体异质性而产生的估计偏误或想要进一步研究不同分位数下的政策效果时,可以利用 CIC 模型。但是,CIC 模型存在以下两个问题:

  • 在存在协变量的情况下缺乏可预测的估计量,需使用带协方差的 CIC 模型,具体可通过 CIC 模型拟合如下回归模型: 通过构造新的关注变量 Y¯=α+βT+γG+λI+e 先行削除变量 x 的影响,再对 Y¯ 应用上述方法估计出不同分位点的分布处理效应;
  • 当处理组为连续型变量时,CIC 方法不适用。

2. 双重变换模型 Stata 命令安装与实操

2.1 CIC 模型的命令安装

ssc install cic, replace

与此同时,我们还必须安装 qrprocess 命令。

ssc install qrprocess, replace

2.2 CIC 模型的命令使用与展示

sysuse nlsw88, clear
set seed 1
gen TREAT = uniform() < .5
replace wage = wage + TREAT
gen POST = uniform() < .5
replace wage = wage - POST
cic continuous wage TREAT POST, vce(bootstrap, reps(50))
bootstrap, reps(50): cic all wage TREAT POST, at(50 90) did vce(none)
cic all wage TREAT POST, vce(delta) at(50)
cic dci wage TREAT POST i.occupation, at(50) vce(bootstrap, reps(50))

3. 双重变换模型案例详解

案例论文: Lucas, Adrienne M., Mbiti, & Isaac M. (2012). Access, sorting, and achievement: the short-run effects of free primary education in kenya. American Economic Journal: Applied Economics. -Link-

3.1 文章简介

2003 年 1 月,肯尼亚政府取消了对公立小学的所有收费,实行小学义务教育政策 (Free Primary Education,FPE)。尽管该政策受到国际赞誉,但是不久后,公立学校开始没有额外教师或教室吸纳新生。

作为公立学校,学校会被要求尽可能多地接收学生。以至于,2007 年班级平均人数增至 84 人左右,且学生成绩开始下降。之所以如此,是因为 FPE 政策可能会使更富有或更高能力的同龄人进入私立学校。

在此背景下,Lucas 和 Mbiti (2012) 先使用 DID 方法,来评估 FPE 政策对不同地区的影响。随后,进一步使用 Athey 和 Imbens (2006) 一文中提到的 CIC 模型策略,来评估肯尼亚 FPE 政策对市区小学升学考试成绩分布以及入学分流(私立、公立)的影响。

3.2 研究设计

3.2.1 参照组与对照组设置

尽管 FPE 政策是全国性的,但由于政策出台之前,在升学率为 100%(或辍学率为 0%)的地区,该政策的影响应该很小甚至没有,而在升学率最低的地区,该政策的影响应该很大。

为此,作者利用肯尼亚不同地区的 FPE 政策强度的差异,假设接受政策干预的处理组的反事实状态(即考试成绩的分布)同控制组的分布一样。然后,用市区中辍学人数占八年级(毕业班)总人数的比例衡量小学义务教育政策实施的强度,并将强度大于平均值的市区作为处理组,将强度低于平均值的市区作为控制组,将标准化的升学考试成绩作为衡量政策效果的变量。

3.2.2 研究框架

在这个假设下,构建 DID 模型:

其中,ysjt 是第 t 年 j 区 s 类学校(公立或私立)的结果(例如,毕业生人数);intensityjt 是政策的有效强度;publics 是一个虚拟变量,对于公立学校等于1; δs 是一个虚拟变量,对于私立学校,等于1; δj 和 deltat 是地区和时间固定效应; δjpublics 是一组学校类型的地区固定效应;而 δjtrendt 则是除一个地区外的所有地区的特定线性趋势。

使用标准的 2x2 CIC 估计量,具有两个时间段和两组:

CIC 估计量应用于这些 “调整” 残差的经验分布:

3.3 核心结果

基于 CIC 模型,Lucas 和 Mbiti (2012) 发现,FPE 政策显著增加了学生的入学机会,尤其是贫困学生。并且,即使公立学校的质量没有增加,接受了 FPE 政策的学生的分数也只会出现小幅下降。他们的研究结果表明,与广为宣传的报告相比,FPE 计划提高了福利,因为它在短期内为相当多的儿童提供了小学入学机会,而不会严重损害教育系统的质量。

从下表可知,模型 (1) 的结果表明小学义务教育政策对成绩位于中位数水平的学生的影响为正值但很小,且在统计上没有显著异于 0;对成绩在更高分位点的学生具有负向影响但其绝对值都不大于 0.051,其中对成绩在 75% 和 80% 的学生具有负向影响,值约为 -0.03,在 1% 显著水平下显著。

总的来说,实施小学义务政策的市区学生参加小学升学考试的成绩会比其他市区学生低 0 至 5% 标准误,表明小学义务教育政策对学生的升学考试成绩影响较弱。其他模型均为模型(1)的稳健性检验模型,结果均支持模型(1)的结论,在此不多述。因此,利用 CIC 模型能够有效分析政策对结果变量分布的影响。

Note: 上图节选自胡日东和林明裕 (2018) 。

4. 双重变换模型延伸 — QDID 模型

邓国营等 (2012) 基于 CIC 方法考察了成都市成华区电厂搬迁带来的环境改善对该区域住房市场「均价分布」的影响。

从下图作者得到三方面结论:第一,±2 倍的标准误曲线与估计值曲线非常接近,表明估计得到的分布处理效应十分显著。第二,在大于 10% 的分位数上,估计出的分布处理效应都显著为正,其数值在 0 ~ 0.2 之间,电厂搬迁在整个分布上提高了成华区的住房价格。第三,估计得到的分位数处理效应是一条向上倾斜的曲线,意味着成华区均价越高的住房,其在电厂搬迁后价格上升幅度也越大。

Mudit 和 Shamika (2020) 分别用 DID 模型和 CIC 模型的均值和中位数估计了特定欧洲国家封锁对每百万人中与 COVID-19 相关的总死亡人数和每日死亡人数的影响。通过比较实行全国封锁的国家 (处理组):比利时、丹麦、法国、德国、意大利、挪威、西班牙、英国和美国,与没有实施国家封锁的瑞典 (对照组) ,发现对于德国和美国,CIC 和 DID 的估计值为负,95% 置信区间不相交于 0 ,表明国家对全国封锁对每百万人的总死亡人数有显著的负影响。并且这种负面效应对德国的影响更大。下图中,我们还发现 DID 在丹麦和挪威国家上的估计量与 CIC 模型的结论不吻合。

与 CIC 模型相似的另一个特殊形式的非线性 DID 方法是分位数双重差分 (Quantile Difference in Difference,QDID)。QDID 方法和经典 DID 方法的主要区别在于 QDID 方法能够求出不同分位点上的处理效应,而不是平均处理效应,因此该方法可以用来分析不同分布的协变量下政策实施的效应 (Athey 和 Imbens,2006)。

彭飞 (2016) 利用经典 DID 方法证实捐赠抵税政策确实增加了企业的捐赠额,但是作者不清楚该政策到底是对那些刚捐赠的企业有效,还是对捐赠较多的企业更有效,如果一个企业的捐赠力度在政策调整前后都未达到 3% 的临界值,理论上该政策就不会对企业捐赠产生影响,因而该政策对于那些捐赠较多的企业应该更有效。为此,作者采用 QDID 方法将捐赠力度的平均效应进一步细分为 9 个分位段,以详细考察税收优惠对不同捐赠企业的影响差异。

分位数回归的结果详见下图,实线即为作者所关心的税收优惠政策变动对不同捐赠企业的影响差异,虚线分别为捐赠抵税效应 95% 置信区间的上限和下限,70 分位及以下捐赠企业的抵税效应在 1% 水平上显著为正,而高于 75 分位捐赠企业的这一效应仅在 10%-25% 水平上显著为正。据民营企业调查数据显示,66.31% (4492/6774) 的捐赠企业捐赠力度未超过 3%,即企业捐赠额没有超过应纳税额的 3%,说明这种效应并不完全是来自于抵税比例的变化,而是来自于抵税依据的调整。结果发现捐赠抵税政策对不同捐赠力度区间的企业都有正向作用,但这种作用主要集中在捐赠规模较小企业内,即表明捐赠规模较小的企业在捐赠抵税政策的影响下更能扩宽其捐赠额度。

6. 参考资料

  • 连享会 DID 专题推文 -Link-
  • 知乎专栏:非线性DID模型——CIC模型的识别 -Link-
  • 胡日东,林明裕.双重差分方法的研究动态及其在公共政策评估中的应用[J].财经智库,2018,3(03):84-111+143-144.
  • 邓国营,徐舒,赵绍阳.环境治理的经济价值:基于CIC方法的测度[J].世界经济,2012,35(09):143-160.
  • 彭飞,范子英.税收优惠、捐赠成本与企业捐赠[J].世界经济,2016,39(07):144-167.
  • Athey S, Imbens G W. Identification and inference in nonlinear difference‐in‐differences models[J]. Econometrica, 2006, 74(2): 431-497. -Link-
  • Lucas A M, Mbiti I M. Access, sorting, and achievement: The short-run effects of free primary education in Kenya[J]. American Economic Journal: Applied Economics, 2012, 4(4): 226-53. -Link-
  • Borah B J, Burns M E, Shah N D. Assessing the impact of high deductible health plans on health‐care utilization and cost: a changes‐in‐changes approach[J]. Health economics, 2011, 20(9): 1025-1042. -Link-
  • Melly B, Santangelo G. The changes-in-changes model with covariates[J]. Universität Bern, Bern, 2015. -Link-
  • Callaway B, Li T, Oka T. Quantile treatment effects in difference in differences models under dependence restrictions and with only two time periods[J]. Journal of Econometrics, 2018, 206(2): 395-413. -Link-
  • Kapoor M, Ravi S. Impact of national lockdown on COVID-19 deaths in select European countries and the US using a Changes-in-Changes model[J]. arXiv preprint arXiv:2006.12251, 2020. -Link-

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD