xtdpdgmm:动态面板数据模型一网打尽

发布时间:2021-01-16 阅读 693

Stata连享会   主页 || 视频 || 推文 || 知乎

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者:谭睿鹏 (南京大学)
邮箱:rptan@nju.edu.cn

编者按:本文摘译自以下文献,特此致谢!

Source: Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-


目录


1. 引言

断点回归 (RDD) 由于其依赖的假设较弱,并可以为局部政策效应提供稳健的估计和推断,故被广泛应用于实证研究中。在断点回归中,若使用最小二乘法估计,研究者通常会加入不受政策影响的协变量,如人口统计特征;而使用非参数局部多项式法,研究者大都不考虑协变量,这使得估计量并不总是参数的一致估计。为此,Calonico 等 (2019) 将协变量纳入非参数多项式回归中,以估计局部政策效应,并对相应的统计推断进行了数理论证。

当然,本文的目的是对 Calonico 等 (2019) 方法的具体应用进行介绍。

2. 方法优点

Calonico 等 (2019) 论证了包括协变量以后,非参数多项式回归中估计量的一致性和大样本性质。同时,该方法也具有以下优点:

  • 允许多种形式的协变量进入待估模型,如连续型变量或非连续型变量;
  • 可以使用同样的方法选择关键解释变量和协变量的窗宽;
  • 无需假设协变量进入模型的形式,可以是参数形式,也可以是非参数形式。如果是参数形式,也不需要对函数形式进行假定。

3. 实例应用

接下来,将使用 Calonico 等 (2019) 的方法估计美国 “启智计划” 对儿童死亡率的影响 (Ludwig 和 Miller,2007)。“启智计划” 是美国联邦政府为贫困家庭设立的幼儿园资金项目,该政策于 1965 年向美国 300 个最贫困的县提供了援助。作为向贫困宣战的一种策略,“启智计划” 每年为 90 多万名 3 至 5 岁的贫困儿童、及其家庭提供学前教育、健康和其他方面的社会服务。

其中,实施对象的选择是根据 1960 年的美国县级贫困指数,当该指数在 59.1984 以上时,联邦政府就在该县实施 “启智计划”,反之,则不实施。这里的 59.1984 就是一个很好的断点,学者可以利用该断点设计 RDD,来估计 “启智计划” 的政策效应。

但是,影响儿童死亡率的因素还很多,除 “启智计划” 外,还应包括人口数、黑人比例,城市人口比例,3-5 岁的儿童人口数及占比、14-17 岁的人口数及占比、以及 25 岁以上的人口数及占比。因此,在估计 “启智计划” 对儿童死亡率的影响时,应该控制这些协变量。

在本节,本文将展示标准 RD 和纳入协变量后的 RD 政策效应估计量。需要用到的 Stata 命令为 rdrobust,安装代码和数据如下:

*命令安装 
ssc install rdrobust, replace // 或链接:http://fmwww.bc.edu/repec/bocode/r/

*数据地址
*https://gitee.com/arlionn/data/raw/master/data01/headstart.dta
*https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LPZLBF

定义全局暂元:

use headstart.dta, clear 
global y mort_age59_related_postHS  // y 为因变量 (儿童死亡率)
global x povrate60                  // x 为分配变量 (forcing variable), 美国县级 1960 年贫困指数
global z census1960_pop census1960_pctsch1417 census1960_pctsch534    ///
         census1960_pctsch25plus census1960_pop1417 census1960_pop534 ///
         census1960_pop25plus census1960_pcturban census1960_pctblack // z 为上文提到的协变量

对于 RD 的点估计和偏差估计可以有不同的窗宽,这里分别用 h 和 b 来表示,在实际操作中可以限制 h = b,也可以不加限制。在统计推断时,可以使用 RD 标准的统计推断方法,也可以使用协变量调整的 RD 统计推断方法。因此,又可以分为以下几种情形进行讨论:

情形一:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968)
global  h = e(h_l)
global  b = e(b_l)
global  IL =  e(ci_r_rb) - e(ci_l_rb)

其中,y 为被解释变量,x 为解释变量,c 括号中为分配变量的值,暂元 h 中存储了 RD 点估计时使用的窗宽,暂元 b 中存储了 RD 偏差估计时使用的窗宽,IL 为 95% 置信区间对应的区间长度。


Sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2783
-------------------+----------------------      BW type       =      mserd
     Number of obs |      2489         294      Kernel        = Triangular
Eff. Number of obs |       234         180      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.809       6.809
       BW bias (b) |    10.724      10.724
         rho (h/b) |     0.635       0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102     1.2053   -1.9996  0.046   -4.77264     -.047753
      Robust |     -          -     -2.0340  0.042   -5.46284      -.10125
--------------------------------------------------------------------------

可以看出,此时政策效应大小为 -2.41,p 值为 0.042,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 [5.46,0.10]

情形二:对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h) b($b)

h 为情形一中计算 RD 点估计时使用的窗宽,b 为情形一计算 RD 偏差估计时使用的窗宽。h($h)b($b) 这两个选项很重要,只有加了它们,才能保证情形二是在情形一的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。

Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779
-------------------+----------------------      BW type       =     Manual
     Number of obs |      2485         294      Kernel        = Triangular
Eff. Number of obs |       234         180      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.809       6.809
       BW bias (b) |    10.724      10.724
         rho (h/b) |     0.635       0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073     1.0973   -2.2849  0.022   -4.65808     -.356569
      Robust |     -          -     -2.3160  0.021   -5.36613     -.446789
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.51,p 值为 0.022,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为 [5.37,0.45]

情形三:对 h 和 b 间关系不加限制,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z)

Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779
-------------------+----------------------      BW type       =      mserd
     Number of obs |      2485         294      Kernel        = Triangular
Eff. Number of obs |       240         184      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.977       6.977
       BW bias (b) |    11.636      11.636
         rho (h/b) |     0.600       0.600

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746     1.0888   -2.2729  0.023   -4.60858     -.340674
      Robust |     -          -     -2.2586  0.024   -5.20688     -.368638
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.4746,p 值为 0.023,h 值为 6.977,b 值为 11.636,稳健性 95% 置信区间为 [5.21,0.37]

情形四:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,同时,不加入协变量,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968) rho(1)
global h1 = e(h_l)
global b1 = e(b_l)

其中,rho 括号中写 1,表示限制 h 和 b 相同。


Sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2783
-------------------+----------------------      BW type       =      mserd
     Number of obs |      2489         294      Kernel        = Triangular
Eff. Number of obs |       234         180      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.809       6.809
       BW bias (b) |     6.809       6.809
         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102     1.2053   -1.9996  0.046   -4.77264     -.047753
      Robust |     -          -     -2.7627  0.006   -6.41372     -1.09023
--------------------------------------------------------------------------

如果不加入协变量,但限制 h=b,政策效应大小的估计值为 -2.4102,p 值为 0.046,b 和 h 值均为 6.809,稳健性 95% 置信区间为 [6.41,1.09]

情形五:限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h1) b($b1) rho(1)

其中,h 为情形四中计算 RD 点估计时使用的窗宽,b 为情形四计算 RD 偏差估计时使用的窗宽。h($h1)b($b1) 这两个选项很重要,只有加了它们,才能保证情形五是在情形四的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。


Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779
-------------------+----------------------      BW type       =     Manual
     Number of obs |      2485         294      Kernel        = Triangular
Eff. Number of obs |       234         180      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.809       6.809
       BW bias (b) |     6.809       6.809
         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073     1.0973   -2.2849  0.022   -4.65808     -.356569
      Robust |     -          -     -3.0701  0.002   -6.63546     -1.46441
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

在限制 h=b 后,政策效应大小的估计值为 -2.5073,p 值为 0.022,b 和 h 值均为 6.809,稳健性 95% 置信区间为 [6.64,1.46]

情形六:限制 h=b,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) rho(1)

Covariate-adjusted sharp RD estimates using local polynomial regression.

 Cutoff c = 59.1968| Left of c Right of c       Number of obs =       2779
-------------------+----------------------      BW type       =      mserd
     Number of obs |      2485         294      Kernel        = Triangular
Eff. Number of obs |       240         184      VCE method    =         NN
    Order est. (p) |         1           1
    Order bias (q) |         2           2
       BW est. (h) |     6.977       6.977
       BW bias (b) |     6.977       6.977
         rho (h/b) |     1.000       1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
      Method |   Coef.    Std. Err.    z     P>|z|    [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746     1.0888   -2.2729  0.023   -4.60858     -.340674
      Robust |     -          -     -3.0182  0.003    -6.5421     -1.39074
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小的估计值为 -2.4746,p 值为 0.023,b 和 h 值均为 6.977,稳健性 95% 置信区间为 [6.54,1.39]

4. 参考文献

  • Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-
  • Ludwig J, Miller D L. Does Head Start improve children's life chances? Evidence from a regression discontinuity design[J]. The Quarterly journal of economics, 2007, 122(1): 159-208. -PDF-

5. 相关推文

Note: 产生如下推文列表的命令为:
lianxh RDD, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看

专题 嘉宾 直播/回看视频
最新专题 因果推断, 空间计量,寒暑假班等
数据清洗系列 游万海 直播, 88 元,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh