Stata:二元Probit模型

发布时间:2020-06-05 阅读 327

吴思锐 (湖南大学, wusirui@hnu.edu.cn)
连玉君 (中山大学, arlionn@163.com)

Stata连享会   主页 || 视频 || 推文

   

连享会 - Stata 暑期班

线上直播 9 天:2020.7.28-8.7
主讲嘉宾:连玉君 (中山大学) | 江艇 (中国人民大学)
课程主页https://gitee.com/arlionn/PX | 微信版

连享会 - 效率分析专题

已上线:可随时购买学习+全套课件,课程主页 已经放置板书和 FAQs
主讲嘉宾:连玉君 | 鲁晓东 | 张宁
课程主页微信版https://gitee.com/arlionn/TE

连享会-效率分析专题视频
连享会-效率分析专题视频


目录


1. 引言

本次推文主要介绍 biprobit 命令,以及其在 Stata 中的应用实例。

Bivariate Probit 模型是两个二元变量结果的联合模型。如果这两个二元变量的结果是不相关的,我们可以估计两个独立的 probit 模型,否则则需要使用 Bivariate Probit 模型。

Bivariate Probit 模型边际效应和预测值的估计和二元 probit 模型类似,但其是两种不同结果的联合概率。以公司违规为例,公司违规数据由公司自身违规行为和证券监管机构违规稽查共同决定。由于未被稽查出的公司违规行为是不可观测数据,公司的违规行为属于部分可观测数据。也就是说,我们只能观测到发生了违规并且被稽查出的公司样本。因此,若直接采用Probit 模型进行估计,则会低估违规影响因素(如舞弊的动机、压力、机会)对公司违规的影响程度。在 Bivariate Probit 模型中,不可观测到的潜变量可以表述为:

Bivariate Probit 模型将结果指定为:

由于无法直接观测到y1y2的取值,而只能观察到y1y2的取值,即

其中,ρe1e2之间的相关系数,ψ为二元正态分布的分布函数,根据以上公式可求得对数似然函数,再通过最大似然法进行模型的参数估计。需要特别注意的一点是,x1x2这两组解释变量不能完全相同

2. biprobit 命令

  • ounter(line
  • ounter(line
  • ounter(line

biprobit depvar1 depvar2 [indepvars] [if] [in] [weight] [, options]

其中, depvar 是被解释变量; indepvars 是解释变量。

_options 的选项: partial 是拟合部分观测模型,offset1(varname) 是抵消第一个方程中的变量,offset2(varname) 是抵消第二个方程中的变量; vce(vcetype) 是指稳健型标准误估计的类别选项,可以是异方差稳健型标准误 robust,聚类调整的稳健型标准误 cluster,自体抽样法稳健型标准误 bootstrap 或刀切法稳健型标准误 jackknife。

3. Stata实例

本次推文以 Pindyck and Rubinfeld (1998) school 数据集为例,对可观测的Bivariate Probit 模型的使用进行简要介绍。Pindyck and Rubinfeld (1998) school 数据集的变量包括:

  • 子女是否上私立学校(private)
  • 家庭在目前所在地的居住年限(years)
  • 财产税的对数(logpta)
  • 收入的对数(loginc)
  • 家庭业主是否对增加财产税投赞成票(vote)

我们希望根据其他协变量对子女是否上私立学校和家庭业主是否对增加财产税投赞成票的双变量结果进行建模。

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line

webuse school
biprobit private vote logptax loginc years------------------Fitting comparison equation 1:
Iteration 0: log likelihood = -31.967097 Iteration 1: log likelihood = -31.452424 Iteration 2: log likelihood = -31.448958 Iteration 3: log likelihood = -31.448958
Fitting comparison equation 2:
Iteration 0: log likelihood = -63.036914 Iteration 1: log likelihood = -58.534843 Iteration 2: log likelihood = -58.497292 Iteration 3: log likelihood = -58.497288
Comparison: log likelihood = -89.946246
Fitting full model:
Iteration 0: log likelihood = -89.946246 Iteration 1: log likelihood = -89.258897 Iteration 2: log likelihood = -89.254028 Iteration 3: log likelihood = -89.254028
Bivariate probit regression Number of obs = 95 Wald chi2(6) = 9.59Log likelihood = -89.254028 Prob > chi2 = 0.1431
------------------------------------------------------------------------------ | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+----------------------------------------------------------------private | logptax | -.1066962 .6669782 -0.16 0.873 -1.413949 1.200557 loginc | .3762037 .5306484 0.71 0.478 -.663848 1.416255 years | -.0118884 .0256778 -0.46 0.643 -.0622159 .0384391 _cons | -4.184694 4.837817 -0.86 0.387 -13.66664 5.297253-------------+----------------------------------------------------------------vote | logptax | -1.288707 .5752266 -2.24 0.025 -2.416131 -.1612839 loginc | .998286 .4403565 2.27 0.023 .1352031 1.861369 years | -.0168561 .0147834 -1.14 0.254 -.0458309 .0121188 _cons | -.5360573 4.068509 -0.13 0.895 -8.510188 7.438073-------------+---------------------------------------------------------------- /athrho | -.2764525 .2412099 -1.15 0.252 -.7492153 .1963102-------------+---------------------------------------------------------------- rho | -.2696186 .2236753 -.6346806 .1938267------------------------------------------------------------------------------LR test of rho=0: chi2(1) = 1.38444 Prob > chi2 = 0.2393

上图展示了多个迭代日志的结果,第一个迭代日志展示了运行第一个方程的单变量 probit 模型结果,第二个迭代日志展示了运行第二个方程的单变量 probit 模型结果。如果ρ=0,这两个模型的对数似然之和等于 Bivariate Probit 模型的对数似然函数值。最后一个迭代日志用来拟合完整的 Bivariate Probit 模型,结果后列示了该模型最大似然估计的似然比及其检验。但如果指定了 vce(robust) 选项,则该测试将作为Wald测试而非似然比检验。

如果是似不相关 Bivariate Probit 回归,Stata 命令和结果如下所示:

  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line
  • ounter(line

biprobit (private = logptax loginc years) (vote = logptax years)
------------------
Fitting comparison equation 1:
Iteration 0: log likelihood = -31.967097 Iteration 1: log likelihood = -31.452424 Iteration 2: log likelihood = -31.448958 Iteration 3: log likelihood = -31.448958
Fitting comparison equation 2:
Iteration 0: log likelihood = -63.036914 Iteration 1: log likelihood = -61.455896 Iteration 2: log likelihood = -61.452436 Iteration 3: log likelihood = -61.452436
Comparison: log likelihood = -92.901393
Fitting full model:
Iteration 0: log likelihood = -92.901393 Iteration 1: log likelihood = -92.220515 Iteration 2: log likelihood = -92.215279 Iteration 3: log likelihood = -92.215278
Seemingly unrelated bivariate probit Number of obs = 95 Wald chi2(5) = 4.77Log likelihood = -92.215278 Prob > chi2 = 0.4440
------------------------------------------------------------------------------ | Coef. Std. Err. z P>|z| [95% Conf. Interval]-------------+----------------------------------------------------------------private | logptax | -.194247 .6677031 -0.29 0.771 -1.502921 1.114427 loginc | .5289522 .5339413 0.99 0.322 -.5175536 1.575458 years | -.0107319 .0255361 -0.42 0.674 -.0607818 .039318 _cons | -5.108515 4.83203 -1.06 0.290 -14.57912 4.362089-------------+----------------------------------------------------------------vote | logptax | -.6138309 .4585021 -1.34 0.181 -1.512478 .2848167 years | -.0230864 .0143602 -1.61 0.108 -.0512319 .0050591 _cons | 4.773266 3.235681 1.48 0.140 -1.568552 11.11508-------------+---------------------------------------------------------------- /athrho | -.2801136 .2453392 -1.14 0.254 -.7609696 .2007424-------------+---------------------------------------------------------------- rho | -.2730102 .2270529 -.6416477 .1980887------------------------------------------------------------------------------LR test of rho=0: chi2(1) = 1.37223 Prob > chi2 = 0.2414

参考文献

  • 陆瑶, 胡江燕. CEO与董事间“老乡”关系对公司违规行为的影响研究[J]. 南开管理评论, 2016, 019(002): 52-62. [PDF]
  • Khanna, V., Kim, E. H., & Lu, Y. (2015). CEO connectedness and corporate fraud. The Journal of Finance, 70(3), 1203-1252. [PDF]
  • Poirier, D. J. 1980. Partial observability in bivariate probit models. Journal of Econometrics 12: 209–217. [PDF]
  • Ani Katchova, Bivariate Probit and Logit Models. [PDF]

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
Stata暑期班 连玉君
江艇
线上直播 9 天
2020.7.28-8.7
效率分析-专题 连玉君
鲁晓东
张 宁
视频-TFP-SFA-DEA
已上线,3天
文本分析/爬虫 游万海
司继春
视频-文本分析与爬虫
已上线,4天
空间计量系列 范巧 空间全局模型, 空间权重矩阵
空间动态面板, 空间DID
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:
    • 课程, 直播, 视频, 客服, 模型设定, 研究设计, 暑期班
    • stata, plus,Profile, 手册, SJ, 外部命令, profile, mata, 绘图, 编程, 数据, 可视化
    • DID,RDD, PSM,IV,DID, DDD, 合成控制法,内生性, 事件研究, 交乘, 平方项, 缺失值, 离群值, 缩尾, R2, 乱码, 结果
    • Probit, Logit, tobit, MLE, GMM, DEA, Bootstrap, bs, MC, TFP, 面板, 直击面板数据, 动态面板, VAR, 生存分析, 分位数
    • 空间, 空间计量, 连老师, 直播, 爬虫, 文本, 正则, python
    • Markdown, Markdown幻灯片, marp, 工具, 软件, Sai2, gInk, Annotator, 手写批注, 盈余管理, 特斯拉, 甲壳虫, 论文重现, 易懂教程, 码云, 教程, 知乎

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD