Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:彭甲超 (中国地质大学)
邮箱:pengjiachao@cug.edu.cn
编者按:本文摘译自下文,特此致谢! Source:Andresen M E. Exploring marginal treatment effects: Flexible estimation using Stata[J]. The Stata Journal, 2018, 18(1): 118-158. -PDF-
目录
在经验研究中使用面板数据可以将个体之间的差异效应 (个体效应) 与个体内随时间变化的效应区分开。尽管时变效应和个体效应通常是不可观测,但它们又是数据异质性的重要部分。无论异质性的来源如何,尤其是当个体效应与模型中其他解释变量之间存在相关性时,无法控制的个体效应都可能使估计结果产生偏差。
为了解决大学教育由选择性动机导致的异质性回报问题,Heckman 等 (2006) 提出边际处理效应 (Marginal Treatment Effect,MTE) 方法。该方法基于广义 Roy 模型 (generalized Roy model) 估计大学教育回报率如何随着大学选择意愿的不同而变化。估计 MTE 的最常见方法是通过局部 IV 方法 (Heckman 和 Vytlacil,2007),Brave 和 Walstrum (2014) 的 margte
命令可以灵活估计 MTE 并输出结果。
考虑广义 Roy 模型
由于对于个体
在给定
而那些已经选择了上大学的个体的大学教育平均处理效应为 (ATT) 为:
为了解决由选择性导致的估计偏误,微观经济计量文献通常基于排除性约束工具变量法对处理效应进行估计。也就是找到一个工具变量
然而在实践中 在给定
这里当
其意义为在给定个人的特征向量满足
边际处理效应有两个方面的明显优势:
与现有实证文献一样,文章假定
其中,
现有的文献对 MTE 已经提出了多种估计方法:
一是极大似然估计。极大似然估计是一种参数估计方法,它假定
其中,
二是多项式估计。Basu 等 (2007) 曾提出一种灵活的多项式近似方法对
根据 OLS 可以对
三是非参数估计。在 MTE 估计实践中,由于
*命令安装
cnssc install lxhget, replace
lxhget t309.pkg, install replace
lxhget t309.pkg, replace
mtefe depvar [indepvars] (depvar_t = varlist_iv) [if] [in] [weight] [,
polynomial(#) splines(numlist) semiparametric restricted(varlist)
link(string) separate mlikelihood trimsupport(#) fullsupport
prte(varname) bootreps(#) norepeat1 vce(vcetype) level(#) degree(#)
ybwidth(#) xbwidth(#) gridpoints(#) kernel(string) first second
noplot omit(varlist) savefirst(string) savepropensity(newvar) savekp
saveweights(string) mtexs(matrixlist)]
polynomail
: 多项式估计,与之对应的通常为 normal
;splines
: 仅适用与多项式估计模型;semiparametric
: 半参数估计;restricted
:指定变量同时包含在第一个和第二个阶段,但在两种阶段状态下具有相同的效果;link
: 使用不同模型来估计,包括probit
,logit
,或者 lpm
等;separate
: 使用单独方法拟合结果,否则默认为局部工具变量法拟合。mlikelihood
: 使用极大似然估计拟合结果,否则默认局部工具变量法拟合。
作者的示例主题主要是分析大学教育的工资回报问题。由于大学教育是内生的,能力较高的人在劳动力市场上做得更好,受过更多的教育;人们选择教育的部分原因是基于对自己从大学中获得的收益的了解。因此,在估计大学教育的工资回报效应时需要面对难以抉择水平和收益等问题。
传统的教育文献使用观测样本离大学的距离这一工具变量,但该工具变量仍有待考量。为修正该工具变量,文章假设某个地区到大学的平均距离与劳动力市场上的平均产出相关。例如,更多的农村劳动力市场可能会提供更差的平均就业机会,尤其是对应大学学历的工作。但是,如果这些差异在学区范围内起作用,则该工具在控制学区平均距离变化的学区固定效应的前提下有效。因此,距大学的距离之内的其余区域之内的变化是大学出勤的有效手段。在此背景下,作者模拟了相关数据,描述性结果如下:
. set seed 1234567
. mtefe_gendata, obs(10000) districts(10)
. summarize
Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------
district | 10,000 5.526 2.833148 1 10
distCol | 10,000 40.15583 10.4995 1.699695 79.81116
exp | 10,000 15.0267 8.941173 0 30
exp2 | 10,000 305.7383 276.8862 0 900
col | 10,000 .4998 .500025 0 1
-------------+---------------------------------------------------------
lwage | 10,000 3.667306 .836446 .2340348 6.625723
其中,lwage 表示收入的对数形式,distCol 为工具变量,具体指标解释请参阅 Andresen (2018)。
作者首先使用参数法估计,结果如下:
. mtefe lwage exp exp2 i.district (col=distCol)
. estimates store normal
Parametric normal MTE model Obs. : 10,000
Treatment model: Probit
Estimation method: Local IV
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
beta0 |
exp | .0358398 .0064408 5.56 0.000 .0232145 .0484651
exp2 | -.0008453 .0002019 -4.19 0.000 -.0012411 -.0004496
|
district |
2 | .2352456 .0680412 3.46 0.001 .1018712 .36862
3 | .6294914 .0701091 8.98 0.000 .4920634 .7669194
4 | .0131179 .0597721 0.22 0.826 -.1040474 .1302832
5 | .0338606 .0705835 0.48 0.631 -.1044974 .1722186
6 | .1699366 .0605086 2.81 0.005 .0513275 .2885458
7 | -.1899241 .060115 -3.16 0.002 -.3077617 -.0720865
8 | -.1842254 .0676843 -2.72 0.007 -.3169003 -.0515504
9 | -.7908301 .0578436 -13.67 0.000 -.9042153 -.677445
10 | -.4432749 .0597237 -7.42 0.000 -.5603455 -.3262044
|
_cons | 3.164706 .0650331 48.66 0.000 3.037228 3.292184
-------------+----------------------------------------------------------------
beta1-beta0 |
exp | -.0386384 .010241 -3.77 0.000 -.0587128 -.018564
exp2 | .0012967 .0003288 3.94 0.000 .0006523 .0019412
|
district |
2 | .265112 .107039 2.48 0.013 .0552939 .4749301
3 | -.5176346 .1077809 -4.80 0.000 -.7289069 -.3063623
4 | -.3915954 .1058642 -3.70 0.000 -.5991107 -.1840801
5 | .0673847 .107471 0.63 0.531 -.1432801 .2780495
6 | -.1207493 .1044501 -1.16 0.248 -.3254926 .083994
7 | .3108071 .1039006 2.99 0.003 .1071408 .5144733
8 | .4659728 .1076252 4.33 0.000 .2550056 .67694
9 | .4941665 .1075267 4.60 0.000 .2833925 .7049404
10 | .3143661 .1072555 2.93 0.003 .1041237 .5246085
|
_cons | .4255863 .0983572 4.33 0.000 .2327863 .6183863
-------------+----------------------------------------------------------------
k |
mills | -.4790282 .0611081 -7.84 0.000 -.5988124 -.359244
-------------+----------------------------------------------------------------
effects |
ate | .3283373 .0242932 13.52 0.000 .2807177 .3759568
att | .5369432 .0388809 13.81 0.000 .4607287 .6131576
atut | .1195067 .0384691 3.11 0.002 .0440995 .194914
late | .3279726 .0245142 13.38 0.000 .2799198 .3760254
mprte1 | .3463148 .0256971 13.48 0.000 .2959433 .3966862
mprte2 | .3309428 .024298 13.62 0.000 .2833137 .3785719
mprte3 | -.016257 .0498984 -0.33 0.745 -.1140679 .0815538
------------------------------------------------------------------------------
Test of observable heterogeneity, p-value 0.0000
Test of essential heterogeneity, p-value 0.0000
------------------------------------------------------------------------------
Note: Analytical standard errors ignore the facts that the propensity score,
the mean of X and the treatment effect parameter weights are estimated objects
when calculating standard errors. Consider using bootreps() to bootstrap the
standard errors.
mtefe
绘制个体估计倾向分数分布和 MTE 密度曲线。示例中的倾向得分图示处理组和控制组的倾向得分分布情况,可以看到处理组和控制组的倾向得分有较大范围的共同支撑集。本示例中的 MTE 呈向下倾斜,在开始时处理效果相对较高,最终在分布的右端降至负面。
接着,作者使用多项式估计相关结果:
. qui probit col distCol exp exp2 i.district
. generate temp=distCol
. replace distCol=40 if distCol>40
. predict double p_policy
. replace distCol=temp
. mtefe lwage exp exp2 i.district (col=distCol), pol(2) prte(p_policy)
. estimates store polynomial
Parametric polynomial MTE model Obs. : 10,000
Treatment model: Probit
Estimation method: Local IV
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
beta0 |
exp | .0354803 .0064404 5.51 0.000 .0228558 .0481047
exp2 | -.0008357 .0002019 -4.14 0.000 -.0012315 -.00044
|
district |
2 | .2365711 .0680441 3.48 0.001 .1031909 .3699513
3 | .6319341 .0701157 9.01 0.000 .4944932 .7693749
4 | .0130924 .0597778 0.22 0.827 -.104084 .1302689
5 | .0364784 .0705884 0.52 0.605 -.1018892 .174846
6 | .1701521 .0605155 2.81 0.005 .0515295 .2887748
7 | -.1902319 .0601195 -3.16 0.002 -.3080782 -.0723856
8 | -.1819917 .0677087 -2.69 0.007 -.3147144 -.0492689
9 | -.793176 .0578571 -13.71 0.000 -.9065875 -.6797644
10 | -.4448738 .0597279 -7.45 0.000 -.5619525 -.3277951
|
_cons | 3.190907 .0660212 48.33 0.000 3.061492 3.320322
-------------+----------------------------------------------------------------
beta1-beta0 |
exp | -.038163 .0102356 -3.73 0.000 -.0582268 -.0180991
exp2 | .0012837 .0003287 3.91 0.000 .0006394 .0019281
|
district |
2 | .2634698 .107039 2.46 0.014 .0536518 .4732878
3 | -.5205257 .1077752 -4.83 0.000 -.7317869 -.3092645
4 | -.3913304 .1058763 -3.70 0.000 -.5988693 -.1837916
5 | .0643694 .1074588 0.60 0.549 -.1462714 .2750103
6 | -.1210701 .1044627 -1.16 0.246 -.325838 .0836979
7 | .3113951 .1039078 3.00 0.003 .1077149 .5150753
8 | .4629086 .1076572 4.30 0.000 .2518788 .6739383
9 | .4978603 .1075286 4.63 0.000 .2870825 .7086382
10 | .317057 .1072544 2.96 0.003 .1068168 .5272973
|
_cons | .4013895 .1016755 3.95 0.000 .202085 .600694
-------------+----------------------------------------------------------------
k |
p1 | -.6084944 1.081504 -0.56 0.574 -2.728461 1.511472
p2 | -.8451015 1.061658 -0.80 0.426 -2.926166 1.235963
-------------+----------------------------------------------------------------
effects |
ate | .3083362 .0346509 8.90 0.000 .2404135 .3762589
att | .496455 .0448869 11.06 0.000 .4084675 .5844424
atut | .1200149 .0440538 2.72 0.006 .0336605 .2063693
late | .3233841 .0251822 12.84 0.000 .274022 .3727463
mprte1 | .3411777 .0262273 13.01 0.000 .289767 .3925884
mprte2 | .2928298 .0526579 5.56 0.000 .1896096 .39605
mprte3 | -.0051932 .0639154 -0.08 0.935 -.1304802 .1200938
prte | .6265658 .0410595 15.26 0.000 .5460808 .7070508
------------------------------------------------------------------------------
Test of observable heterogeneity, p-value 0.0000
Test of essential heterogeneity, p-value 0.0000
------------------------------------------------------------------------------
Note: Analytical standard errors ignore the facts that the propensity score,
the mean of X and the treatment effect parameter weights are estimated objects
when calculating standard errors. Consider using bootreps() to bootstrap the
standard errors.
多项式估计的图示结果与标准化估计结果类似,其倾向得分分布与 MTE 密度曲线分布基本一致。
参数方法对 MTE 估计存在一定的局限性,MIE 假定
. mtefe lwage exp exp2 i.district (col=distCol), semiparametric gridpoints(100)
. estimates store semipar
Semiparametric MTE model Obs. : 10,000
Treatment model: Probit
Estimation method: Local IV
------------------------------------------------------------------------------
lwage | Coef.
-------------+----------------------------------------------------------------
beta0 |
exp | .0356061
exp2 | -.0008382
|
district |
2 | .2362298
3 | .6321138
4 | .012498
5 | .0359078
6 | .1698399
7 | -.1903168
8 | -.1813472
9 | -.7932724
10 | -.4451391
-------------+----------------------------------------------------------------
beta1-beta0 |
exp | -.0383496
exp2 | .001288
|
district |
2 | .2641407
3 | -.5205788
4 | -.3901379
5 | .0653821
6 | -.1194752
7 | .3120027
8 | .4623971
9 | .4988572
10 | .3189203
-------------+----------------------------------------------------------------
effects |
ate | .3038093
att | .5141665
atut | .0973168
late | .3114957
mprte1 | .3423103
mprte2 | .3104423
mprte3 | -.0123404
------------------------------------------------------------------------------
Note: Limited support. Regular, non-marginal treatment effect parameters (ATE, ATT,
ATUT, LATE and PRTE) cannot be estimated. Instead, reported parameters are
rescaled so that the treatment effect parameters weights sum to 1 within support.
以下是作者对几种不同边际处理效应的可视化结果:
. mtefeplot normal polynomial semipar, ///
memory names("Normal" "Polynomial" "Semiparametric")
. mtefeplot polynomial, late memory
. mtefeplot polynomial, separate memory
与传统的线性 IV 分析相反, MTE 揭示的是处理效果的分布。命令 mtefe
对现有边际效应估计的命令进行了许多改进,其中包括对固定效应、局部 IV 估计以及半参数和极大似然估计方法等支持。此外,mtefe
运行半参数模型时提高了速度,对相关图形输出作了较大改进。
Note:产生如下推文列表的 Stata 命令为:
lianxh 边际效应 处理效应 工具变量, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:Stata教程
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh