reghdfe:多维面板固定效应估计

发布时间:2020-05-21 阅读 379

reghdfe:多维面板固定效应估计


作者:胡雨霄 (伦敦政治经济学院)

Stata连享会   主页 || 视频 || 推文

连享会 - Stata 暑期班

线上直播 9 天:2020.7.28-8.7
主讲嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
课程主页https://gitee.com/arlionn/PX | 微信版


目录


实证分析中,我们经常需要控制各个维度的个体效应,以便尽可能减轻 遗漏变量 导致的偏误。在最常用的二维面板数据中,我们通常会采用 xtreg y x i.year, fe 的形式来控制 公司个体效应年度效应。然而,在有些情况下,我们需要对三维甚至更高维度的数据进行分析 (例如,公司-年度-高管省份-城市-行业-年度),此时,一方面要考虑估计的可行性,另一方面还需兼顾计算速度问题。

本文介绍的 reghdfe 命令可以很好地达成上述目的。reghdfe 主要用于实现多维固定效应线性回归。该命令类似于 aregxtreg,fe,但允许引入多维固定效应。此外,该命令在运行速度方面远远优于 aregxtreg, 因此倍受研究者青睐。

本文对该命令的介绍基于 A Feasible Estimator for Linear Models with Multi-Way Fixed Effects (Correia, 2016)。

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」

1. 命令的安装

我们可以使用 ssc install 命令安装最新版本的 reghdfe 相关程序文件。需要特别说明的是,该命令依赖于最新版的 gtools 命令,因此,需要同时安装后者,否则执行 reghdfe 时可能会提示 错误信息

  • ounter(line
  • ounter(line
ssc install gtools, replace  ssc install reghdfe, replace // 安装最新版命令

可以使用如下命令查看你使用的版本是否为最新版本 (如下是写作本文是的版本信息):

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. which ftoolsD:\stata15/ado\plus\f\ftools.ado*! version 2.37.0 16aug2019
. which reghdfeD:\stata15/ado\plus\r\reghdfe.ado*! version 5.7.3 13nov2019

连享会 - 文本分析与爬虫 - 专题视频

主讲嘉宾:司继春 || 游万海

连享会-文本分析与爬虫-专题视频教程
连享会-文本分析与爬虫-专题视频教程

2. 命令的语法

该命令的具体语法如下:

  • ounter(line
reghdfe depvar [indepvars] [if] [in] [weight], absorb(absvars) [options]

其中,

  • depvar: 因变量
  • indepvars: 解释变量
  • absorb(absvars):引入固定效应
    • 可以包含多维固定效应,即 absorb (var1,var2,var3,...)。若想保存对某变量的固定效应,则运行命令absorb (var1,var2,FE3=var3) , 变量 FE3 将保存对 var3 的固定效应估计结果。
    • 可以包含不同效应间的交互影响,即absorb(var1#var2)

值得注意的是,reghdfe 允许定类变量 (categorical variable) 与连续性变量 (continuous variable) 进行交互,即 absorb(i.var1#c.var2) 。实证中很少引入这样的交互项。但如果对该问题感兴趣,可参考 Duflo (2014) 。

3. 命令的操作

这一部分用两个实证的例子介绍如何运用 reghdfe

3.1 估计双重差分的固定效应模型(DID)

该命令可用于估计双重差分的固定效应模型(DID)。在 「连享会推文专辑:倍分法 (DID)」 系列推文中 (连享会 主页版:https://www.lianxh.cn/blogs/39.html ),列举了用于估计 DID 模型的三个命令:reg, areg, 以及 xtregreghdfe 也可实现同样的估计结果,而且运行速度优于其他命令。

使用的数据请参考之前推文Stata: 双重差分的固定效应模型。该数据模拟的情况为,政策冲击发生在 t=14 时,对照组为 i=1,控制组为 i=0。模型为 y=0.3+0.19×i+1.67×d+0.56×i×d+e

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. set obs 400. gen firm=_n  ///生成企业数量. expand 24. bysort firm: gen t=_n  ///时间跨度设定为24个季度(6年). gen d=(t>=14). label var d "=1 if post-treatment" ///设定事件冲击发生在第14期. gen r=rnormal(). qui sum r, d. bysort firm: gen i=(r>=r(p50)) if _n==1. bysort firm: replace i=i[_n-1] if i==. & _n!=1 ///设定处理组和对照组. drop r. label var i "=1 if treated group, =0 if untreated group" . gen e = rnormal() ///设定随机变量. label var e "normal random variable". gen y = 0.3 + 0.19*i + 1.67*d + 0.56*i*d + e ///模型设置

首先,回顾双重差分模型的设定形式,

其中,Gi 为分组虚拟变量(处理组=1,控制组=0);Di 为分期虚拟变量(政策实施后=1,政策实施前=0);交互项 Gi×Di 表示处理组在政策实施后的效应。μi 与 λt 分别为个体固定效应和时间固定效应。

具体用于估计政策冲击对公司的影响的命令如下。

  • ounter(line
  • ounter(line
gen did = i*d ///生成交互项reghdfe y did, absorb(firm t) vce(cluster firm)

变量 did 即为交互项,其系数为双重差分模型重点考察的处理效应。命令 absorb(firm t) 同时引入了公司固定效应以及时间固定效应。结果如下。

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. reghdfe y did, absorb(firm t) vce(cluster firm)(MWFE estimator converged in 2 iterations)
HDFE Linear regression Number of obs = 9,600Absorbing 2 HDFE groups F( 1, 399) = 175.80Statistics robust to heteroskedasticity Prob > F = 0.0000 R-squared = 0.5102 Adj R-squared = 0.4875 Within R-sq. = 0.0198Number of clusters (firm) = 400 Root MSE = 1.0043
(Std. Err. adjusted for 400 clusters in firm)------------------------------------------------------------------------------ | Robust y | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- did | .5656247 .0426601 13.26 0.000 .4817581 .6494914 _cons | 1.143579 .0084565 135.23 0.000 1.126954 1.160204------------------------------------------------------------------------------
Absorbed degrees of freedom:-----------------------------------------------------+
Absorbed FE | Categories - Redundant = Num. Coefs |-------------+---------------------------------------| firm | 400 400 0 *| t | 24 0 24 |-----------------------------------------------------+* = FE nested within cluster; treated as redundant for DoF computation

连享会计量方法专题……

3.2 估计多维固定效应的线性模型(复制一篇 AER 论文)

这一小节将介绍如何运用 reghdfe 估计多维固定效应的线性模型。American Economic Review一篇文章,The Costs of Patronage: Evidence from the British Empire (Xu, 2018), 提供的可供复制的代码中出现了大量 reghdfe 命令。本小节介绍该作者如何用 reghdfe 命令输出其文章Table 2第六列的结果。

Source: Xu, G. (2018). The Costs of Patronage: Evidence from the British Empire. American Economic Review, 108 (11): 3170-98.
Source: Xu, G. (2018). The Costs of Patronage: Evidence from the British Empire. American Economic Review, 108 (11): 3170-98.

作者在这篇文章中想要探究 任命制 (patronage) 对英国 政治体系 的影响。具体于 Table2,作者意图研究社会联系(social connections) 是否会影响政府官员的工资水平。Table 2中,第六列所估计的回归为:

其中,

  • logwist为政府官员 i 于时间 t 在 j 州执政时的对数工资水平。Stata 命令中,该变量名为 log_salary_governor_gbp
  • cit 为虚拟变量(Dummy Variable),当政府官员与其上任官员存在社会联系时,该变量取1。如若不然,则取0。社会联系包括:共同祖先,贵族身份以及教育背景。Stata 命令中,该变量名为 connected
  • θi 为政府官员固定效应。该部分的设置为了解决政府官员的异质性 (heterogeneity) 问题。例如,具有较强能力的政府官员更有可能建立更多的社会关系。Stata 命令中, aid 为不同官员的 unique ID 变量。
  • ωi 为政府官员执政时长固定效应。设置该部分是因为,执政时间的长短可能也会对社会关系产生影响。Stata 命令中, duration 为官员执政时长变量。
  • xit 为控制变量。作者选用了执政者在历史上执政过的州的数目。Stata 命令中,该变量名为 no_colonies
  • γt 为年份固定效应。该部分的设置是为了吸收执政者们在不同时期受到的共同时间冲击。Stata 命令中, year 为年份变量。
  • ϵist 为残差。作者使用了聚类标准误的方法。

该回归的原假设为,H0: 社会联系 (connected) 与政府官员的工资水平 (log_salary_governor_gbp) 无关。若 connected 的系数 β 不显著,则不拒绝原假设。若 β 显著,则拒绝原假设,并可以判定社会联系对政府官员的工资水平显著相关。

用 Stata 实现该回归的命令如下。

  • ounter(line
  • ounter(line
reghdfe log_salary_governor_gbp no_colonies connected, ///        absorb(aid year duration) vce(cluster bilateral)

其中,absorb(aid year duration) 同时引入了官员固定效应、时间固定效应以及执政时长固定效应。

连享会 - 效率分析专题

已上线:可随时购买学习+全套课件,课程主页 已经放置板书和 FAQs
主讲嘉宾:连玉君 | 鲁晓东 | 张宁
课程主页微信版https://gitee.com/arlionn/TE

连享会-效率分析专题视频
连享会-效率分析专题视频

命令运行后的结果如下所示。数据请于 AER 官网 「下载」

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. quietly use "analysis.dta", replace. reghdfe log_salary_governor_gbp no_colonies connected, ///          absorb(aid year duration) vce(cluster bilateral)(MWFE estimator converged in 26 iterations)
HDFE Linear regression Number of obs = 3,510Absorbing 3 HDFE groups F( 2, 1517) = 25.45Statistics robust to heteroskedasticity Prob > F = 0.0000 R-squared = 0.9255 Adj R-squared = 0.9109 Within R-sq. = 0.0978Number of clusters (bilateral) = 1,518 Root MSE = 0.2374
(Std. Err. adjusted for 1,518 clusters in bilateral)------------------------------------------------------------------------------ | Robustlog_salary~p | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- no_colonies | .2234767 .0347473 6.43 0.000 .1553189 .2916346 connected | .0972969 .0355508 2.74 0.006 .0275628 .1670309 _cons | 7.485619 .065766 113.82 0.000 7.356617 7.614621------------------------------------------------------------------------------
Absorbed degrees of freedom:-----------------------------------------------------+ Absorbed FE | Categories - Redundant = Num. Coefs |-------------+---------------------------------------| aid | 456 0 456 | year | 110 1 109 | duration | 7 1 6 ?|-----------------------------------------------------+? = number of redundant parameters may be higher

上述结果表明,变量 connected 的系数为 0.097, 标准误为 0.036。这说明该变量在 1% 的水平上显著大于 0 。其经济学含义为,与上一任官员存在社会联系的官员,相较于无社会联系的官员,工资水平要高出 9.7%。也就是说,官员的工资水平和其社会关系显著相关。

4.结语

这篇推文主要介绍了如何在实证中运用 reghdfe。具体而言,本推文列举了两个例子。其一,为运用该命令对 DID 模型进行估计。其二,为运用该命令进行多维固定效应线性模型的估计。

文献来源

  • Correia, S. (2016). Linear Models with High-Dimensional Fixed Effects: An Efficient and Feasible Estimator, Working Paper. [PDF]
  • Duflo, E. (2004). The medium run effects of educational expansion: Evidence from a large school construction program in Indonesia. Journal of Development Economics, 74(1), 163-197. [PDF]
  • Xu, G. (2018). The Costs of Patronage: Evidence from the British Empire. American Economic Review, 108 (11): 3170-98. [PDF]

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
Stata暑期班 连玉君
江艇
线上直播 9 天
2020.7.28-8.7
效率分析-专题 连玉君
鲁晓东
张 宁
视频-TFP-SFA-DEA
已上线,3天
文本分析/爬虫 游万海
司继春
视频-文本分析与爬虫
已上线,4天
空间计量系列 范巧 空间全局模型, 空间权重矩阵
空间动态面板, 空间DID
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:
    • 课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
    • stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
    • DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
    • Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
    • 空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
    • Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注, 盈余管理, 特斯拉, 甲壳虫, 论文重现, 易懂教程, 码云, 教程, 知乎

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD