正确姿势:回归系数的解释与评估

发布时间:2020-09-23 阅读 1302

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者: 陈贤孟 (厦门大学)
邮箱: cxminjnu@163.com


目录


编者按: 本文主要源于江艇老师和连玉君老师在「连享会-2020 暑期班」上讲授的内容,特此致谢!

1. 引言

在研究过程中,当得到实证结果后,除了看系数的正负和统计显著性以外,如何对系数进行解释以及评估系数的大小,同样也是一个重要的问题。本文对不同模型设定形式下的估计系数的解释进行梳理,同时也对如何评估系数的大小进行一定的讨论。

2. 系数的解释

2.1 对数相关的模型

在实证研究过程中,根据研究目的的需要,研究者往往会对变量进行取对数的处理。根据变量是否取对数,我们可以将模型设定分成如下四种情形。

情形 1: X 和 Y 均不取对数,具体方程如下:

在 X 和 Y 均取水平值的情况下, β1 的含义是,当 X 变动 1 单位, Y 平均变动 β1 个单位。

情形 2: X 和 Y 均取对数,具体方程如下:

在 X 和 Y 均取对数值的情况下, β1 的含义是,当 X 变动 1%, Y 平均变动 β1% 。

X 和 Y 均取对数的模型也称为常弹性模型。上述两种情形的系数解释较为容易理解与记忆。当 X 和 Y 仅有一个取对数的情形称为半弹性模型。对半弹性模型的系数解释往往容易遗忘。具体如下:

情形 3:X 取对数而 Y 取水平值,具体方程如下:

在 X 取对数值 而 Y 取水平值的情况下, β1 的含义是,当 X 变动 1%, Y 平均变动 0.01β1 个单位 。

情形 3 下的系数解释,可结合以下式子进行理解:

X 变动 1%, 即 dXX=0.01 , 此时 dY=0.01β1, 所以 β1 的含义是,当 X 变动 1%, Y 平均变动 0.01β1 个单位 。

情形 4:X 取水平值而 Y 取对数,具体方程如下:

在 X 取水平值 而 Y 取对数值的情况下, β1 的含义是,当 X 变动 1 单位, Y 平均变动 100β1% 。

情形 4 下的系数解释,可结合以下式子进行理解:

X 变动 1 个单位, 即 dX=1 , 此时 dYY=β1, 所以 β1 的含义是,当 X 变动 1 个单位, Y 的平均变动率为 β1 。假设 β1=0.05, 我们可称 Y 平均变动 5% (即 100β1%)

2.2 交互项模型

交互项模型作为实证研究过程中一种常见的模型,其基本设定如下:

首先,通过 Y 对 X1 求偏导, 得到如下等式:

由式 (8) 可知,X1 对 Y 的边际效应不是常数,而是随着 X2 的取值不同而发生变化。交互项的系数 β3 的含义为, 变量 X2 对 X1 对 Y 的边际效应的影响。

值得注意的是,在交互项模型中,对 X1 的系数 β1 的解释需格外小心。在交互项模型中,我们有:

因此,在交互项模型中,β1 的含义为, 当 X2=0 时, X1 变动 1 单位, Y 变动 β1 单位。正因如此,当模型中加入交互项时,β1 的估计值会发生一定的变动。

更多关于交互项系数的讨论,可参考连享会推文专题:【交乘-调节-中介】

3. 评估系数大小

在实证研究过程中,研究者除了关心系数的统计显著性以外,为了评估研究结果的经济意义,往往需要对估计系数的大小进行相应的评估。一般而言,可以通过检验系数的经济显著性和变量的解释力来评估系数大小。

3.1 经济显著性

吴小康 (2019) 一文详细地阐述了统计显著性与经济显著性的区别,以及经济显著性的重要性。该文指出,考虑用一个采用新药治疗癌症的例子,统计显著性告诉我们的往往是该药是否有效,而现实生活中,患者更关心的往往是该药的效果究竟有多大。后一个问题所涉及的,便是研究结果的经济显著性的问题。关于经济显著性的评估,目前尚未有一种统一的方法与标准,此处梳理了较为常见的两种方法:

方法 1:与 Y 的均值做对比

Chen and Lan (2020) 的文章研究了家庭联产承包责任制对农民耕地技术的影响。该文指出,在家庭联产承包责任制实施以后,小规模的家庭农场更多地采用了役畜进行耕地,拖拉机逐渐被役畜所取代。在文章的实证结果描述中,有着这样的一段表述:

After six years, the gradual buildup accumulated into a large causal effect: an increase of 69 head or 66 percent of the pre-reform mean.

这段话的含义是,在实施家庭联产承包责任制以后,每 100 公顷的役畜数量六年内增长了 69 头,是改革前平均值的 66%。

作者通过把 X 对 Y 的影响与 Y 的均值做比较,表明这是一个大的因果效应 ( large causal effect )

通过将系数大小以 Y 的均值做对比来评估经济显著性的文献还有 Li et al. (2016) 等。

方法 2:评估 X 变动一个标准差引起 Y 变动几个标准差

数据的标准差表示数据的平均偏离幅度,相比评估 X 变动一单位, Y 变动多少单位,从标准差层面来讨论往往更具经济意义。因此,研究者会通过观察标准差相对大小的变动,即 X 变动一个标准差引起 Y 变动多少个标准差,来评估结果的经济显著性。

Huang et al. (2017) 的论文研究了企业到当地政府的距离与国企权力下放的关系,以验证哈耶克假说。该文在表述实证研究结果的经济含义时,采用了如下的表述方式:

Using the pooled sample estimates, increasing the distance by one standard deviation (SD, here 2.40) would increase the probability of decentralization by 1.3 percentage points, or 9 percent of the SD of the dependent variable.

这一段的含义为,当 X (企业到当地政府的距离)增加一个标准差时, Y (权力下放的概率)增加 0.09 个标准差,表明具有一定的经济显著性。

通过评估标准差的相对变动来说明系数的经济显著性的文献还有 Nunn and Wantchekon (2011)、 Adit & Franck (2015)、Hoynes et al.(2016) 等。

3.2 评估 X 解释的 Y 的变动有多少

除了通过判断经济显著性来解释系数的经济含义外,还可以通过评估 X 相对于其他解释变量的解释力 (explanatory power) 来解释系数的经济含义。江艇老师「连享会-2020 暑期论文班」上的讲义,为我们提供了一种评估 X 的解释力的方法。具体如下:

式 (10) 为我们提供了一种计算 X 解释了多少 Y 的 variation 的方法。下面结合 Nunn and Wantchekon (2011) 对式 (10) 进行解读。

Nunn and Wantchekon (2011) 研究奴隶贸易对当今非洲人民的信任程度的影响,在原文中,有如下一段表述:

" We find that slave exports and the other covariates together explain 5.4 percent of the total variation of trust in neighbors. Of this 5.4 percent, 16–27 percent is explained by slave exports"

该段话的含义为:除了国家固定效应以外,奴隶贸易和其他解释变量,一共解释了对邻居的信任的变动中的 5.4%, 在这 5.4%中,大约有 16%-27% 是由奴隶贸易解释的。

考虑以下模型:

具体到本例中, X1 为奴隶贸易, X2 为其他控制变量, W 为国家固定效应。式 (10) 中,R2(W) 指由国家固定效应所解释的 Y 的 variation,R2(X1,X2,W)R2(W) 表示除国家固定效应以外, 奴隶贸易和其他控制变量所解释的 Y 的 variation,即文中所述的 5.4%。

为理解式 (10) 的分子部分,下面结合连享会推文:加入控制变量后结果悲催了?!(微信版) 中的图 6 进行解读。(有关 R2 分解以及系数解释力对比这一问题,可以参考连享会推文 R2分解:相对重要性分析 (Dominance Analysis),以及 如何比较解释变量的系数相对大小?)。

上图表明:

  • 由于 X1 和 X2 具有一定的相关性,图中的 C 为 X1 和 X2 共同解释的 Y 的 variation。
  • R2(X1,X2,W) 可以近似理解为上图中的 B+C+D, 而 R2(X2,W) 可以近似理解为上图中的 C+D, 因此,R2(X1,X2,W)R2(X2,W) 的含义为,将 X1 和 X2 共同解释的 Y 的 variation 完全归因于 X2,进而得到 X1 解释的 Y 的 variation 的下界。
  • 类似地,通过将 X1 和 X2 共同解释的 Y 的 variation 完全归因于 X1,进而得到 X1 解释的 Y 的 variation 的上界。

相关的 Stata 代码如下所示 (你可以到 连享会推文数据主页 下载范例中使用的数据文件) :

// 调用数据
*-数据下载地址:
*  https://gitee.com/arlionn/data/tree/master/data01
use "nunnw_2011.dta", clear

preserve

// 删除缺失值
global x1 "trust_neighbors ln_export_area murdock_name age age2 male urban_dum "
global x2 "education occupation religion living_conditions "
global x3 "district_ethnic_frac frac_ethnicity_in_district isocode"
global x "$x1 $x2 $x3"
foreach v of varlist $x{
   drop if missing(`v')==1
}


/* None */
quietly xi: reg trust_neighbors i.isocode
gen r_w=e(r2) //计算仅加入国家固定效应时的R方

/* Slave Trade Only */
quietly xi: reg trust_neighbors ln_export_area i.isocode
gen r_x1_w=e(r2) //计算加入奴隶贸易变量及国家固定效应时的R方

/* Other Characteristics */
quietly xi: reg trust_neighbors age age2 male urban_dum i.education i.occupation i.religion i.living_conditions district_ethnic_frac frac_ethnicity_in_district i.isocode
gen  r_x2_w=e(r2) //计算加入其他控制变量及国家固定效应时的R方

/* Both */
quietly xi: reg trust_neighbors ln_export_area age age2 male urban_dum i.education i.occupation i.religion i.living_conditions district_ethnic_frac frac_ethnicity_in_district i.isocode
gen r_x1_x2_w=e(r2) //计算加入所有变量时的R方

dis r_x1_x2_w - r_w //计算X1、X2对 Y 的variation的贡献
.05397503

dis (r_x1_x2_w-r_x2_w)/(r_x1_x2_w-r_w) //计算下界
.16039986

dis (r_x1_w-r_w)/(r_x1_x2_w-r_w) //计算上界
.27154186

restore

4. 参考文献和资料

  • 连享会推文:加入控制变量后结果悲催了?!(微信版)
  • 连享会推文:R2分解:相对重要性分析 (Dominance Analysis)
  • 连享会推文:如何比较解释变量的系数相对大小?
  • 吴小康.关于统计显著与经济显著的若干讨论[J].经济学动态,2019(01):145-158.
  • Chen S, Lan X. Tractor vs. animal: Rural reforms and technology adoption in China[J]. Journal of Development Economics, 2020: 102536.
  • Li P, Lu Y, Wang J. Does flattening government improve economic performance? Evidence from China[J]. Journal of Development Economics, 2016, 123: 18-37.
  • Huang Z, Li L, Ma G, et al. Hayek, local information, and commanding heights: Decentralizing state-owned enterprises in China[J]. American Economic Review, 2017, 107(8): 2455-78.
  • Nunn N, Wantchekon L. The Slave Trade and the Origins of Mistrust in Africa[J]. The American Economic Review, 2011, 101(7): 3221-3252
  • Aidt T S, Franck R. Democratization under the threat of revolution: Evidence from the Great Reform Act of 1832[J]. Econometrica, 2015, 83(2): 505-547.
  • Hoynes H, Schanzenbach D W, Almond D. Long-run impacts of childhood access to the safety net[J]. American Economic Review, 2016, 106(4): 903-34.

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD