Stata:时间虚拟变量还是时间趋势项?

发布时间:2020-10-09 阅读 41

作者: 徐婷 (厦门大学)

Stata 连享会: 知乎 | 简书 | 码云 | CSDN

在不同的实证研究中,有些回归模型为每个年份设置了时间虚拟变量,另一些模型加入了时间趋势项。那么,在模型中加入时间虚拟变量和时间趋势项的区别是什么呢?在什么情况下,应该加入那种表示时间变化的变量呢?

1. 两者的区别

1.1 时间虚拟变量

当观察值所在年份等于指定年份,时间虚拟变量等于 1,否认为 0。通过设置时间虚拟变量,能够控制年份层面的固定效应,例如:特定时间内发生的外部冲击,无法被其他解释变量控制。一般而言,当数据集中包含 T 期时,应该加入 T-1 个时间虚拟变量。

如以上公式所示,τj 是时间虚拟变量 Tj 的系数,若观测值在 j 年,Tj 等于1,否则为 0。对于任意给定年份,可以令 Tj 等于1,其他年份为 0,来估计 τj 的系数的大小。

如以上公式所示,大小为 τj 的特定年份的效应,能影响所有的第 j 年的样本。如果认为某一年有特殊效应,并且希望衡量其大小,那么设置时间虚拟变量是最合适的方法。

1.2 时间趋势项

指定年份的时间趋势变量等于数据集中时间变量的顺序,例如:如果数据集中包含了 2000 年到 2010 年的样本,那么 2000 年的样本的时间趋势项为 1,2001 年的样本为 2,以此类推。通过设置时间趋势变量,可以控制由其他变量无法解释的因变量的外生变动。

以上公式中的 λ 是时间趋势项t的回归系数,t 是等步递增的。为了获得可以解释的表达方式,我们可以进行求导如下:

所以,随着时间从某一年变化到另一年,如:时间趋势项 t 变动一个单位,会对因变量产生一个大小为 λ 的影响。由此生成一个线性的趋势项,它可以被解释为因变量随时间变动的总体方向。事前假设时间趋势项的效应并非对应于某一特定年份,但是产生变化的过程是跨年份的。

2. 如何选择加入时间虚拟变量还是时间趋势项?

时间趋势项通常用于表示技术进步,而时间虚拟变量用于控制某一特定年份的效应,例如发生严重的洪水等自然灾害的年份。如何选择时间虚拟变量或时间趋势项,这取决于模型希望解决的问题是某个特定年份的变化还是时间趋势。

只要有可靠的理论依据,可以同时包含时间虚拟变量和时间趋势项。但加入这两种变量都无法解决时间序列的非平稳问题,因此要利用面板数据的单位根检验来检查数据是否平稳。

3. 实例说明

下面本文基于数据集 gss.dta 来简要说明在模型中加入时间虚拟变量和时间趋势项的区别和联系。degree为因变量,表示被调查者的受教育程度;coh为时间趋势项,用被调查者出生的年份减 1900 后除以10来衡量;year为时间虚拟变量,用被调查者出生的年份减 1900 后设置的虚拟变量来衡量。

.use http://fmwww.bc.edu/repec/bocode/g/gss.dta, clear
.gen year = coh*10

3.1 加入时间趋势项

在这里,我们在模型一中同时加入时间虚拟变量i.year、时间趋势项c.coh,在模型二中仅加入时间虚拟变量。回归后分别求取拟合值yhat1yhat2,通过比较两种拟合值的差异来分析两个模型的异同。

.reg degree i.year c.coh
.predict yhat1
.reg degree i.year
.predict yhat2
.twoway scatter yhat1 yhat2, aspect(1) ||    ///
       function identity = x, range(.5 2.1) ///
       ytitle(trend + dummies)              ///
       xtitle(only dummies)

如下图所示,在包含时间虚拟变量的模型中加入时间趋势项后,并没有改变模型,只是将相同的信息以不同的系数进行区分。在本例中,两种模型得出的拟合结果是完全相同的。所以,如果在模型中同时加入时间虚拟变量和趋势项难以解释,在没有损失信息的情况下,可以去掉时间趋势项。

graph1.png
graph1.png

3.2 改变划分时间虚拟变量的时间跨度

在这里,我们将时间虚拟变量以每 10 年为单位进行划分,在模型三中同时加入以每 10 年为单位的时间虚拟变量i.decade、时间趋势项c.coh,在模型四中仅加入时间趋势项。回归后分别求取拟合值yhat3yhat4,再加上模型二的拟合值yhat2,通过比较三个拟合值的差异来分析模型的异同。

.gen decade = floor(coh)
.reg degree i.decade coh
.predict yhat3
.reg degree coh
.predict yhat4
.sort coh
.by coh : gen byte mark = _n == 1
.twoway line yhat3 coh if mark ||            ///
       line yhat4 coh if mark ||            ///
       scatter yhat2 coh if mark,           ///
       legend(order( 1 "trend + decade"     ///
                     2 "just trend"         ///
                     3 "annual estimate" ))

如果划分时间虚拟变量的时间跨度更长,例如,时间趋势项按年度划分,而时间虚拟变量按 10 年划分,那么这两个模型实质上是不同的。

graph2.png
graph2.png

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD