utest:检验U型和倒U形关系

发布时间:2020-06-22 阅读 205

作者:李森林 (中南财经政法大学)
邮箱Senlin6835@163.com

Stata连享会   主页 || 视频 || 推文

连享会 - Stata 暑期班

线上直播 9 天:2020.7.28-8.7
主讲嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
课程主页https://gitee.com/arlionn/PX | 微信版
助教招聘: 15 名,免费听课,详见课程主页


目录


1 应用背景

在实证分析中,我们通常假设解释变量和被解释变量为「线性关系」。然而,在很多情况下,解释变量和被解释变量可能存在「非线性关系」。为解决该问题,研究者往往会在模型中加入平方项,甚至是高阶项 (断点回归分析 RDD 中常用的处理方法)。

「平方项 = 倒 U 型 ?」推文中,我们介绍了模型中加入平方项后应如何解释系数的含义及注意事项。但是,通过浏览现有的期刊论文,我们发现不少文章作者只要平方项的系数 c 在统计上显著,便声称 y 和 x 之间存在「U 形关系」 或「倒 U 形关系」。实际上,这并不严谨,有时甚至是错误的。

在 Statalist 的一个帖子 Testing whether to include a squared term 中,大家也对此问题进行了深入的讨论。

平方项显著就一定意味着存在 U 形关系吗?

在大多数试图识别 U 形关系的实证中,研究人员会在一个标准的线性回归模型中包括一个非线性 (通常是二次型) 项。如果这一项是显著的,并且估计的极值点在数据范围内,则认为存在 U 形关系。然而,Lind and Mehlum (2010)1 认为,这一标准过于薄弱。当真正的关系是凸而单调时,模型估计将错误地产生一个极值点和 U 形关系。

对 U 形的测试比较复杂,因为原假设要求在区间的左边是递增的 (或递减的),而在右边是递减的 (或递增的)。对于这个复合的原假设,标准的测试方法不再适用。Lind and Mehlum (2010) 借鉴 Sasabuschi (1980) 开发的通用框架,来测试两变量间是否存在 U 形和倒 U 形关系,并且利用这个检验原理编写了 utest 检验命令。utest 提供了一个 U 形 (或倒 U 形) 关系在一个区间上存在与否的「精确测试」。

本文的目的在于介绍 utest 命令的具体使用方法,并结合案例加以说明。

2 用法介绍

在正式介绍之前,我们需使用 ssc install utest, replace 安装该命令,并使用 help utest 查看该命令的帮助文件。

2.1 基本语法

utest 的基本语法:utest x f(x) [, options]

  • 其中,utest 为命令主体;

  • 估计必须包括解释变量 x 和非线性项 f(x)

  • options 为在基础命令上添加的选项,「详见 2.2 小节」。

2.2 选项介绍

下面将对 utest 命令的选项进行说明。

选项 用途
min(#) #为数据范围的左端点
max(#) #为数据范围的右端点
quadratic 设定检验 f(x) =x^2
inverse 设定检验 f(x) =1/x
fieller 包括极值点的费勒区间
level(#) 设置菲勒区间的置信水平
prefix(因变量) 模型估计的因变量

注意utest 是在回归之后使用的。

  • prefix(因变量) 选项适用于普通 regress 之外的其它模型,例如 logit 等;

  • 默认情况下,测试区间为完整的数据范围,但是可以通过设置选项 min(#)max(#) 来控制;

  • 选项 Fieller 也提供了极值点的「Fieller 区间」,即使对于有限样本,这个区间也是正确的;

  • 菲勒区间的置信水平默认是 95%。

3 应用案例

3.1 案例一

以「nlsw88」数据为例,检验妇女工资 wage 与工作经验 ttl_exp 间是否存在倒 U 形关系。

代码如下:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
*-调用数据  sysuse "nlsw88.dta", clear*-生成二次项  gen ttl_exp2 = ttl_exp * ttl_exp*-ols 回归  reg wage ttl_exp ttl_exp2*-检验 U 形关系  utest ttl_exp ttl_exp2, fieller*-ttl_exp 取值范围  sum ttl_exp

检验结果如下:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. *-检验 U 形关系.   utest ttl_exp ttl_exp2, fieller
Specification: f(x)=x^2Extreme point: 29.60629
Test: H1: Inverse U shape vs. H0: Monotone or U shape
------------------------------------------------- | Lower bound Upper bound-----------------+-------------------------------Interval | .1153846 28.88461Slope | .5548667 .0135783-------------------------------------------------
Extremum outside interval - trivial failure to reject H0
95% Fieller interval for extreme point: [20.930938; 244.46717]
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
. sum ttl_exp
Variable | Obs Mean Std. Dev. Min Max-------------+--------------------------------------------------------- ttl_exp | 2,246 12.53498 4.610208 .1153846 28.88461

可以看出,计算出的极值点为 29.61,ttl_exp 的最大值为 28.88。可知,检验出的 “极值点” 并不在数据范围内,无法拒绝原假设。因此,我们可以认为不存在 U 形或倒 U 形关系。同时,fieller 选项还汇报了极值点的置信区间。

3.2 案例二

以「nlswork」数据为例,考察女性年龄与对数工资之间是否存在倒 U 形关系。

代码如下:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
*-调用数据/*  copy http://www.stata-press.com/data/r9/nlswork.dta nlswork.dta, replace  use nlswork.dta, clear*/    webuse "nlswork.dta", clear *-生成二次项  generate age2 = age^2*-ols 回归  xtset idcode  xtreg ln_w age age2*-检验 U 形关系  utest age age2, fieller level(99) //设置99%的置信度*-age 取值范围  sum age

检验结果如下:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line

. *-检验 U 形关系. utest age age2, fieller level(99) //设置99%的置信度(24 missing values generated)(24 missing values generated)
Specification: f(x)=x^2Extreme point: 43.67398
Test: H1: Inverse U shape vs. H0: Monotone or U shape
------------------------------------------------- | Lower bound Upper bound-----------------+-------------------------------Interval | 14 46Slope | .0401102 -.0031441t-value | 27.22722 -2.117613P>|t| | 1.8e-161 .0171082-------------------------------------------------
Overall test of presence of a Inverse U shape: t-value = 2.12 P>|t| = .0171
99% Fieller interval for extreme point: [41.577944; 46.604849]
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line

. *-age 取值范围. sum age
Variable | Obs Mean Std. Dev. Min Max-------------+--------------------------------------------------------- age | 28,510 29.04511 6.700584 14 46

可以看出,计算出的极值点为 43.67398,age 取值范围为 [14, 46]。可知,极值点在数据范围内,并能够在 5% 的统计水平上拒绝原假设。同时,结果中的 slope 在区间里是存在负号,因而我们可以认为是倒 U 形关系。

值得说明的是,utest 程序并未设置单独的方法检验是不是倒 U 形关系。但是,我们可以通过 slope 区间里的负号特征进行判断。

参考文献

  • Lind J T, Mehlum H. With or without U? The appropriate test for a U‐shaped relationship[J]. Oxford bulletin of economics and statistics, 2010, 72(1): 109-118. PDF
  • Sasabuchi S. A test of a multivariate normal mean with composite hypotheses determined by linear inequalities[J]. Biometrika, 1980, 67(2): 429-439. PDF
  • Haans, Richard F. J., Constant Pieters, and Zi‐Lin He. 2016. “Thinking about U: Theorizing and Testing U‐ and Inverted U‐shaped Relationships in Strategy Research.” Southern Medical Journal 37 (7): 1177–95.

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
Stata暑期班 连玉君
江艇
线上直播 9 天
2020.7.28-8.7
效率分析-专题 连玉君
鲁晓东
张 宁
视频-TFP-SFA-DEA
已上线,3天
文本分析/爬虫 游万海
司继春
视频-文本分析与爬虫
已上线,4天
空间计量系列 范巧 空间全局模型, 空间权重矩阵
空间动态面板, 空间DID
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:
    • 课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
    • stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
    • DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
    • Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
    • 空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
    • Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注, 盈余管理, 特斯拉, 甲壳虫, 论文重现, 易懂教程, 码云, 教程, 知乎

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD