Stata 连享会 主页 || 视频 || 推文
温馨提示: 定期 清理浏览器缓存 ,可以获得最佳浏览体验。
✨ 课程主页 : https://gitee.com/arlionn/Course
作者:高娜娜(中南财经政法大学)
Email: 568874936@qq.com
目录
内生性是实证经济分析中不容忽视的问题,当模型存在内生性时,会导致系数估计的不一致。工具变量法是解决内生性的主要方法之一,除了寻找外部工具变量以外,用内生变量的滞后项作为工具变量在经济学的各个学科中也非常普遍。使用该方法的文章不乏发表在AER、JF、RFS等顶级期刊上。
但是,在理论上,滞后的解释变量是否真正有效地解决了内生性问题?如果不是,在什么条件下可以使用内生变量的滞后项作为工具变量?
1. 滞后项可以作为工具变量吗?
这实际问题中,一个变量往往受到许多变量的影响。然而,由于理论认识不充分、变量无法观测等原因,在实际建模中无法将解释变量全部列出。
在这种情况下,遗漏变量就被纳入到了随机扰动项中。如果该遗漏变量与其他解释变量相关,就会引起解释变量与随机扰动项相关,导致内生性问题。
下面,分别用有向无环图和数理分析来解释该问题背后的原理,并分析用滞后项作为工具变量是否能解决内生性问题。
1.1 有向无环图
如下图 A 所示,假设在 X → Y 的模型中存在遗漏重要解释变量的问题。被遗漏的变量为 U,从而导致 X → Y 的因果识别受到与 X 和 Y 相关的 U 的影响,模型存在内生性问题。
那么,是否可以用 X t 的滞后值 X t − 1 作为 X t 的工具变量呢?工具变量需同时满足两个条件,即相关性和外生性。首先,从相关性上而言,要求 X t − 1 和 X t 相关。由于 X t 和 X t − 1 都是可观测的变量,因此可以用计量方法来检验二者之间的相关性。其次,从外生性上而言,要求 X t − 1 和 ( U t + ε t ) 不相关。这是显而易见的,因为 t 期的扰动不可能影响到 t-1 期的观察值。如果经检验可证明X t − 1 和 X t 相关,那么X t − 1 似乎可以作为 X t 的工具变量。
但是,如果 U t 存在序列相关,用 X t − 1 替代 X t 仅仅是将内生性问题向后移了一个时期,并不能解决模型的内生性问题。如下图 B 所示,X t − 1 虽然不受 U t 的影响,但 X t − 1 受到 U t − 1 的影响,如果 U t 存在序列相关,则 U t − 1 → U t → Y t 和 U t − 1 → X t − 1 → X t → Y t 两条路径使得用 X t − 1 来识别因果不再有效。
因此,用内生变量的滞后项作为工具变量无法解决内生性问题。
1.2 数理分析
我们根据上图 B 建立如下模型,来说明在这种情况下,用 X t − 1 替换 X t 无法解决内生性导致的系数估计偏误。
在该模型中,Y 受到 X 和不可观测因素 U 的影响,X 受到其滞后一期值和不可观测因素 U 的影响,U 是序列相关的。我们的目标是估计系数 β 。
Y i t = β X i t + δ U i t + ε i t , ε i t ∼ N ( 0 , σ ε 2 )
X i t = ρ X i t − 1 + k U i t + μ i t , μ i t ∼ N ( 0 , σ μ 2 ) 0 ≤ ρ < 1
U i t = φ U i t − 1 + v i t , v i t ∼ N ( 0 , σ v 2 ) 0 ≤ φ < 1
下面考虑用 X t − 1 替换 Xt,假设不可观测因素 U 是 X 内生性的唯一来源,则待估计的模型和 b X t − 1 的估计式如下所示(此处省略复杂的推导过程,详情参见 Bellemare et al(2017)的文章)。
plim ( b ^ X t − 1 ) = β ρ + φ k ( β k + δ ) V ( U ) ( 1 − φ ρ ) V ( X )
在上述式子中,ρ 是 X t 的自回归系数,因为 0 ≤ ρ < 1 ,β ρ 的值相当于是对 β 的低估。然而,由于 U 存在序列相关(即 φ≠0),b ^ X t − 1 并不是 ρ 或 β ρ 的一致估计。
因此,在遗漏重要解释变量导致内生性时,如果被遗漏的变量是序列相关的,用内生变量的滞后项作为工具变量并不能得到系数的一致性估计。
2. 滞后项作为工具变量的适用条件
Bellemare et al.(2017)指出,当模型存在不可观测的因素时,如果能同时满足以下两个条件(即满足图C所示的有向无环图),则可以用 X t − 1 作为 X t 的工具变量。
即便如此,在使用内生变量的滞后项作为工具变量时仍需十分谨慎。
一方面,该因素是不可观测,我们无法检验其是否满足不存在序列相关的假设; 另一方面,在实际中,这些因素可能往往是序列相关的。
3. 参考资料
Bellemare, M. F., T. Masaki, T. B. Pepinsky, 2017, Lagged explanatory variables and the estimation of causal effect, The Journal of Politics, 79 (3): 949-963. -PDF- Reed, W. R., 2015, On the practice of lagging variables to avoid simultaneity, Oxford Bulletin of Economics and Statistics, 77 (6): 897-905. =PDF-
相关课程
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
课程一览
支持回看,所有课程可以随时购买观看。
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。公众号推文分类: 计量专题 | 分类推文 | 资源工具 。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会主页 lianxh.cn
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD