王群勇,经济学教授、博士生导师,南开大学数量经济研究所所长,中国数量经济学会常务理事,中国统计学会常务理事。主持国家自科基金、国家社科基金、教育部人文社科、国家统计局重大等多项课题。获得首届国家统计科技进步三等奖、天津市科技进步二等奖等多项荣誉。在《China Economic Review》、《Stata Journal》、《Journal of Family and Economics Issues》、《数量经济技术经济研究》、《统计研究》等SSCI和CSSCI期刊发表多篇论文,并担任期刊匿名审稿人。编写了 xthreg(平衡面板及非平衡面板固定效应面板门限模型)、cointreg(协整回归)、sax12(X12-ARIMA季节调整)、sax13(X-13ARIMA-SEATS季节调整)、stregress(平滑转换模型)、xtstregress(面板平滑转换模型)、midasreg(混频回归)、mixrereess 等 Stata 程序。
C. 更新内容
初级班
新增了「实证分析可视化」专题,中间介绍边际效应、分仓散点图、系数差异可视化,以及 Stata 绘图的基本架构
其二,希望诸位能建立起 Stata 的基本架构,熟知 Stata 能做什么、如何做?以期为后续学习打下宽厚扎实的基础。
翻阅 Top 期刊上的论文,你会发现多数论文并没有使用非常复杂的方法,关键在于论文的想法或视角比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了 2-3 篇比较经典的论文,展示这些方法的合理应用。
在内容安排上,基本上遵循了由浅入深,循序渐进的原则。
第 1-3 讲依序介绍 Stata 的基本用法、数据处理、程序编写和可视化分析,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益。
在第 1-2 讲中,我会以一篇文章为实例,说明 Stata 的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值等问题的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。此前有不少学完了高级班的同学又回炉初级班,便是感悟到了这一点。
第 3 讲介绍 Stata 编程的基础知识。但凡提及写程序,很多人都会产生恐惧心理,其实,一旦掌握了最基本的原理和语法格式,Stata 中的程序设定并没有想象的那么困难。更为重要的是,对于多数人而言,由于并不需要写完整的 ado 文档,因此只需要学会最基本的条件语句和循环语句即可,难度又会进一步降低。一旦掌握了基本的编程知识和理念,你的实证分析便开始进入「快车道」了。
Bai, J. S., 2009, Panel data models with interactive fixed effects, Econometrica, 77 (4): 1229-1279. -Link-, -PDF-
A7. 一篇 Top 期刊论文重现
Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, The Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Appendix-, -cited-, -Replication-
Sherman M G, Tookes H E. Female representation in the academic finance profession. Journal of Finance, 2022, 77(1): 317-365. -Link-, -cited-, -PDF-, -Replication-
Stata 高级班 是初级班的进一步深入,也为理解 进阶班 的各个专题的基础,涵盖目前主流分析方法和研究设计框架。高级班采用「庖丁解牛」的方式讲解目前 Top 期刊中使用的计量方法和模型,突出「研究设计」和方法的「应用背景和条件」。
2.2 专题介绍(Stata 高级班)
B1. 实证分析中各类检验方法
近期的 Top 期刊越来越强调模型不确定性,比如:控制变量也有好坏之分、是否存在非线性特征、不同模型的优劣对比等。这就需要进行各类检验,以便排除各种「混杂因素」和「似是而非」的论述,让论文的研究结论具有排他性,经济含义也更为清晰明确。本专题包括假设检验的基本原理、模型筛选和对比检验,以及「不容易做好」的稳健性检验等内容。在介绍检验方法和命令的同时,重点在于如何解释它们的经济含义,如何选择合适的检验方法并采用合适的方式加以呈现和分析。
系数的联合检验:Wald,LR,LM 检验
test, testparm, lincom, nlcom, testnl
结果的汇集与呈现
模型比较:嵌套模型比较、非嵌套模型比较
R2 分解和贡献度分析
系数差异检验:Chow 检验,SUR,Bootstrap,排序检验
内生性检验
稳健性检验、安慰剂检验
参考文献:
Hansen B E . 2021. Econometrics. Princeton University Press. Data and Contents, PDF. Chap 9.
Ye, D., Y. K. Ng, Y. Lian, 2015, Culture and happiness, Social Indicators Research, 123 (2): 519-547. -Link-, -PDF-, PDF2, -cited-,R2 分解,课件中提供复现代码
Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, The Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Appendix-, -cited-, -Replication-
B2. IV 和 GMM 基础
IV 的思想并不复杂,但想找到一个能说服审稿人的 IV 却往往是可遇不可求的事情。在横截面分析中确实如此。随着面板数据模型的快速发展,IV 的构造思路已经发生了很大的变化,「就地取材」、「差别反应」都是非常有用的构造思路。GMM 是估计动态面板的标准方法,它在投资方程、DSGE 等领域也是重要的估计方法。本讲以因果图为基础,介绍 IV,2SLS 和 GMM 的基本思想,辅以几篇经典论文的 Stata 实操。GMM
IV 和 2SLS 估计的原理
GMM 估计的原理
工具变量合理性检验
Stata 实操
参考文献:
Hansen B E . 2021. Econometrics. Princeton University Press. Data and Contents, PDF. Chap 12-13.
Lal, A., M. Lockhart, Y. Xu, Z. Zu, 2023, How much should we trust instrumental variable estimates in political science? Practical advice based on over 60 replicated studies, arXiv working paper. PDF, PDF+附录-260页, -cited-
B3. IV 进阶:Bartik IV (移动份额 IV)
本讲重点介绍弱工具变量、Judge IV,Jackknife IV 和 Bartik IV 的构造和应用方法。虽说经济学圈里流传着 Friends don't let Friends do IV 的说法,但 Bartik IV 应该可以独善其身,它是近年来在国际贸易、金融等多个领域频繁现身 Top 期刊的 IV 估计方法。
弱工具变量问题和多个 IV
Judge-FE IV 和 Jackknife IV
Bartik (shift-share) IV
参考文献:
Hou, Y., P. Wang, 2020, Unpolluted decisions: Air quality and judicial outcomes in china, Economics Letters, 194: 109369. -Link-, -PDF-, PDF2, Replication. Judge Fixed Effects
Borusyak, K., P. Hull, X. Jaravel, 2022, Quasi-experimental shift-share research designs, Review of Economic Studies, 89 (1): 181-213. -Link-, -PDF-
Adao, R., M. Kolesar, E. Morales, 2019, Shift-share designs: Theory and inference, Quarterly Journal of Economics, 134 (4): 1949-2010. -Link-, -PDF-
Goldsmith-Pinkham, P., I. Sorkin, H. Swift, 2020, Bartik instruments: What, when. Why, and how, American Economic Review, 110 (8): 2586-2624. -Link-, -PDF-, PDF2, Replication, -cited-
Roodman, David. 2009, How to do Xtabond2: An Introduction to Difference and System GMM in Stata, Stata Journal, 9(1): 86–136. -PDF-
Williams, R., P. D. Allison, E. Moral-Benito, 2018, Linear Dynamic Panel-data Estimation Using Maximum Likelihood and Structural Equation Modeling, Stata Journal, 18(2): 293–326. -PDF-, -PDF2-
B4b. 面板 VAR 模型
面板 VAR 模型可以视为多变量动态面板模型,多用于估计和检验几个内生变量的动态关系。基于 IRF 和 FEVD,我们也可以进行预测。该模型在经济增长、能源、财政、创新等领域有广泛应用。
VAR 模型简介
冲击反应函数 (IRF)
方差分解 (FEVD)
面板 Granger 检验
允许外生变量的 PVAR 模型
应用实例(介绍 2 篇论文)
参考文献:
Michael R. M. Abrigo, I. Love, 2016, Estimation of Panel Vector Autoregression in Stata, Stata Journal, 16(3): 778–804. -PDF-, -PDF2-, -cited-
Acheampong, A. O., 2018, Economic growth, co2 emissions and energy consumption: What causes what and where?, Energy Economics, 74: 677-692. -Link-, -PDF1-, -Replication-
Stata 范例:Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Replication-
扩展阅读:
Dell, M., B. F. Jones, B. A. Olken, 2012, Temperature shocks and economic growth: Evidence from the last half century, American Economic Journal-Macroeconomics, 4 (3): 66-95. -Link-, -PDF-, -Replication-
Kahn, M. E., K. Mohaddes, R. N. C. Ng, M. H. Pesaran, M. Raissi,J.-C. Yang, 2021, Long-term macroeconomic effects of climate change: A cross-country analysis, Energy Economics, 104: 105624. -Link-, -PDF1-, -PDF2-, -Replication-, Cited. lincom, xtmg
Ditzen, J. 2021. "Estimating long-run effects and the exponent of cross-sectional dependence: An update to xtdcce2". Stata Journal: Promoting communications on statistics and Stata, 21 (3): 687-707. Link, PDF1. PDF2.
Chudik, A., K. Mohaddes, M. H. Pesaran, M. Raissi, 2017, Is there a debt-threshold effect on output growth?, Review of Economics and Statistics, 99 (1): 135-150. -Link-, -PDF-
Seo, M. H., S. Kim, Y. J. Kim, 2019, Estimation of dynamic panel threshold model using stata, Stata Journal, 19 (3): 685-697. -Link-, -PDF-
Wang, Q., 2015, Fixed-Effect Panel Threshold Model using Stata, Stata Journal, 15(1): 121–134. -PDF-
Zhou, X., J. Du, 2021, Does environmental regulation induce improved financial development for green technological innovation in china?, Journal of Environmental Management, 300: 113685. -Link-, -PDF-
⭕ 3. Stata 进阶班
授课嘉宾: 王群勇 (南开大学)
时间: 2023 年 7 月 23-25 日 (三天)
方式: 网络直播 + 20 天回放
授课安排
授课方式: 幻灯片+Stata17 实操演示,全程电子板书+Stata 演示截图,课后以 PDF 形式分享给学员
Lundborg, P., E. Plug, A. W. Rasmussen, 2017, Can women have children and a career? Iv evidence from ivf treatments, American Economic Review, 107 (6): 1611-1637. -Link-, -PDF-, Appendix, Replication, -cited-
Cohn, J. B., Z. Liu, M. I. Wardlaw, 2022, Count (and count-like) data in finance, Journal of Financial Economics, 146 (2): 529-551. -Link-, PDF, Working Paper, -cited-, -Replication-
Angrist, J. D., W. N. Evans, 1998, Children and their parents' labor supply: Evidence from exogenous variation in family size, American Economic Review, 88 (3): 450-477. [-Link-], [-PDF-], PDF2, Appendix, Replication
Wu, J., J. Zhang, C. Wang, 2023, Student performance, peer effects, and friend networks: Evidence from a randomized peer intervention, American Economic Journal: Economic Policy, 15 (1): 510-542. -Link-, -PDF-, PDF2, Appendix, Replication
Angelucci, M., S. Prina, H. Royer, A. Samek, 2019, Incentives and unintended consequences: Spillover effects in food choice, American Economic Journal: Economic Policy, 11 (4): 66-95. -Link-, -PDF-, PDF2, Appendix, Replication,
Wang, C.-H., G. Akar, J.-M. Guldmann, 2015, Do your neighbors affect your bicycling choice? A spatial probit model for bicycling to the ohio state university, Journal of Transport Geography, 42: 122-130. -Link-, -PDF-, -cited-
Alatas, V., A. Banerjee, A. G. Chandrasekhar, R. Hanna,B. A. Olken, 2016, Network structure and the aggregation of information: Theory and evidence from indonesia, American Economic Review, 106 (7): 1663-1704. -Link-, -PDF-, PDF2, Appendix, Replication,
Bailey, M., R. Cao, T. Kuchler, J. Stroebel,A. Wong, 2018, Social connectedness: Measurement, determinants, and effects, Journal of Economic Perspectives, 32 (3): 259-280. -Link-, -PDF-, -PDF2-, Appendix, Replication, -cited-
Leister, C. M., Y. Zenou, J. Zhou, 2022, Social connectedness and local contagion, The Review of Economic Studies, 89 (1): 372-410. -Link-, -PDF-, -PDF2-
C5. 贝叶斯计量方法
贝叶斯方法在现代计量经济学和机器学习中扮演者越来越重要的角色,已经成为 DSGE、GVAR、社会网络等模型的标准估计方法,也是 Stata17、18 版本新增计量经济功能中最突出的部分。本章介绍贝叶斯的基本分析框架以及如何解读 Stata 贝叶斯估计的输出结果、如何判断蒙特卡洛模拟的质量、如何在线性模型和 Probit/Poisson 等非线性中进行贝叶斯估计等。
贝叶斯计量方法概述
Metropolis-Hasting 抽样与 Gibbs 抽样
如何诊断贝叶斯蒙特卡洛模拟的结果
如何解读贝叶斯估计结果
如何进行贝叶斯预测
非线性模型的贝叶斯估计
参考文献
Bianchi, F., L. Melosi, 2017, Escaping the great recession, American Economic Review, 107 (4): 1030-1058. -Link-, -PDF-, Appendix, Replication, -cited-
Battaglini, M., E. Patacchini, E. Rainone, 2022, Endogenous social interactions with unobserved networks, The Review of Economic Studies, 89 (4): 1694-1747. -Link-, -PDF-, PDF2
Chetty, V. K., U. Sankar, 1969, Bayesian estimation of the ces production function1, The Review of Economic Studies, 36 (3): 289-294. -Link-, -PDF-
C6. 贝叶斯应用:模型平均化和 Global-VAR
本章讲解贝叶斯方法在计量经济学中的几个典型应用:贝叶斯模型平均、全局 VAR(GVAR)、面板 VAR(PVAR)方法。贝叶斯模型平均整合了多个模型的结果,得到更加可靠的结论和更精确的预测。全局 VAR 模型将传统的单一国家或地区的 VAR 模型推广到多个国家或地区,既避免了大量的参数,又可以反应冲击在国家或行业之间的传递。
贝叶斯模型平均化(bayesian model averaging)
Global VAR 模型
参考文献
Ciccone, A., M. Jarociński, 2010, Determinants of economic growth: Will data tell?, American Economic Journal: Macroeconomics, 2 (4): 222-246. -Link-, -PDF-, Appendix, Replication, -cited-
复现:Feldkircher, M., S. Zeugner, 2012, The impact of data revisions on the robustness of growth determinants—a note on ‘determinants of economic growth: Will data tell?’, Journal of Applied Econometrics, 27 (4): 686-694. -Link-, -PDF-, Replication, -cited-
Moral-Benito, E., 2012, Determinants of economic growth: A bayesian panel data approach, Review of Economics and Statistics, 94 (2): 566-579. -Link-, -PDF-
Miranda-Agrippino, S., H. Rey, 2020, U.S. Monetary policy and the global financial cycle, The Review of Economic Studies, 87 (6): 2754-2776. -Link-, -PDF-, -PDF2-, PPT, -cited-
Georgiadis, G., 2015, Examining asymmetries in the transmission of monetary policy in the euro area: Evidence from a mixed cross-section global VAR model, European Economic Review, 75: 195-215. -Link-, -PDF-, Replication, -cited-
Tan, M. S.-L., 2016, Policy coordination among the asean-5: A global VAR analysis, Journal of Asian Economics, 44: 20-40. -Link-, -PDF-
Dąbrowski, M. A., M. Papież, M. Rubaszek, S. Śmiech, 2022, The role of economic development for the effect of oil market shocks on oil-exporting countries. Evidence from the interacted panel var model, Energy Economics, 110: 106017. -Link-, -PDF-, Replication
补充:
Feng, Y., Q. F. Liu, Q. S. Yao, G. Q. Zhao, 2021, Model averaging for nonlinear regression models, Journal of Business & Economic Statistics: 1-14. -Link-, -PDF1-
Breuer, M., H. H. Schutt, 2021, Accounting for uncertainty: An application of bayesian methods to accruals models, Review of Accounting Studies: 1-43. -Link-, -PDF1-
Steel, M. F. J., 2020, Model averaging and its use in economics, Journal of Economic Literature, 58 (3): 644-719. -Link-, -PDF1-
Magnus, J. R., G. De Luca, 2016, Weighted-average least squares (wals): A survey, Journal of Economic Surveys, 30 (1): 117-148. -Link-, -PDF1-
Fletcher, D. 2018, Model averaging, Springer Berlin Heidelberg, Berlin, Heidelberg. -Link-, -PDF1-, -PDF-. Text Book.