Stata检验:AIC-BIC-MSE-MAE-等信息准则的计算

发布时间:2020-10-08 阅读 4905

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course

作者: 贺旭 (中央财经大学)


目录


本文介绍 AIC, BIC 等信息准则以及在 Stata 中的相关命令。

1. 信息准则

该小节将介绍 AIC , BIC 等信息准则以及在 Stata 中的相关命令

1.1 简介

在建模过程中,会有一些备选解释变量,选择不同的变量组合会得到不同的模型,而信息准则就是刻画这些模型相对于 “ 真实模型 ” 的信息损失。AIC, BIC, HQIC 等信息准则的计算公式为:

赤池信息准则 (akaike information criterion):

贝叶斯信息准则 (bayesian information criterion):

汉南 - 奎因信息准则 (quinn criterion):

其中 : L 是该模型下的最大似然,n 是数据数量,k 是模型的变量个数。

在模型拟合时,增加参数可使得似然概率增大,但是却引入了额外的变量,因此 AIC 和 BIC 都在目标式中添加了模型参数个数的惩罚项,也就是第二项。当 n8 时, ln(n)k2k,所以,BIC 相比 AIC 在大数据量时对模型参数惩罚得更多,导致 BIC 更倾向于选择参数少的简单模型。

1.2 信息准则的 Stata 命令

在估计完模型后用,用命令 estat ic 来获得模型的 AIC,BIC , 例如 :

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型
. estat ic ///获得模型地AIC和BIC

结果为

Akaike's information criterion and Bayesian information criterion

-------------------------------------------------------------
 Model |  Obs  ll(null)  ll(model)  df         AIC        BIC
-------+-----------------------------------------------------
     . |   74 -695.7129  -685.0518   5    1380.104   1391.624
-------------------------------------------------------------

2. 回归评价指标

该小节将介绍 MSE、MAE、MAPE、R2、Adjusted R2 等回归评价指标以及在 Stata 中的相关命令。

2.1 简介

MSE、MAE、MAPE、R2、Adjusted R2 等指标用来表示回归模型拟合数据的精确程度。以下是各个指标的具体公式:

均方误差 MSE(Mean Square Error):

平均绝对误差 MAE(Mean Absolute Error):

平均绝对百分比误差 MAPE(Mean Absolute Percentage Error):

决定系数 R2(R-Square):

校正决定系数 adj-R2(Adjusted R-Square):

其中: yi为解释变量,y^i 为拟合值。相关说明如下:

  • MSE、MAE、MAPE 与 R2、Adjusted R2 都可以描述模型拟合的精确程度
  • 然而,R2 和 Adjusted R2,大致可以分为一类。因为 R2 范围为 0 到 1,给了所有模型一个相同的比较标准,Adjusted R2 有可能小于 0,但也大致在 0 到 1 这个范围内。
  • 相对而言,MSE、MAE、MAPE 的值与数据有关,范围没有限制。

2.2 回归评价指标的 Stata 命令

我们继续用 Stata 自带的 auto.dta 数据来做演示。

(一) R2 和 Adjusted R2 的计算:

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ,R2 和 Adjusted R2也在结果中显示了///

结果为:

   Source |       SS           df       MS      Number of obs   =        74
----------+----------------------------------   F(4, 69)        =      5.76
    Model |   158982705         4  39745676.1   Prob > F        =    0.0005
 Residual |   476082692        69  6899749.15   R-squared       =    0.2503
----------+----------------------------------   Adj R-squared   =    0.2069
    Total |   635065396        73  8699525.97   Root MSE        =    2626.7
---------------------------------------------------------------------------
    price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
----------+----------------------------------------------------------------
 headroom |  -680.2898   486.0063    -1.40   0.166    -1649.846    289.2663
    trunk |    80.9094   119.8176     0.68   0.502    -158.1201    319.9389
   length |   23.28608   27.02926     0.86   0.392    -30.63583    77.20798
      mpg |  -173.9507   87.75118    -1.98   0.051    -349.0095    1.108165
    _cons |   6416.948   6036.935     1.06   0.292    -5626.407     18460.3
---------------------------------------------------------------------------

(二) MSE 的计算:

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mse=(price-e)*(price-e) ///计算并创建变量 mse
. sum mse//得到结果栏中mean那一列为MSE

结果为:

 Variable |  Obs     Mean    Std. Dev.       Min        Max
----------+------------------------------------------------
      mse |   74  6433550    1.26e+07   2230.343   8.80e+07

(三) MAE 的计算:

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mae=abs(price-e) ///计算并创建变量 mae
. sum mae//mae的均值即为结果,也就是结果栏中mean那一列的值

结果为:

 Variable |  Obs        Mean    Std. Dev.       Min        Max
----------+---------------------------------------------------
      mae |   74    1958.684    1622.555   47.22651   9380.703

(三) MAE 的计算:

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mape=abs(price-e)/price ///计算并创建变量 mae
. sum mape///mape的均值即为结果,也就是结果栏中mean那一列的值

结果为:

 Variable |  Obs     Mean    Std. Dev.       Min        Max
----------+------------------------------------------------
     mape |   74 .3138812    .1892069   .0060338   .9669298

3. 参考资料

相关课程

连享会-直播课 上线了!
http://lianxh.duanshu.com

免费公开课:


课程一览

支持回看,所有课程可以随时购买观看。

专题 嘉宾 直播/回看视频
最新专题 DSGE, 因果推断, 空间计量等
Stata数据清洗 游万海 直播, 2 小时,已上线
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类: 计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会主页  lianxh.cn
连享会主页 lianxh.cn

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会学习群-常见问题解答汇总:
https://gitee.com/arlionn/WD