知乎热议:机器学习在经济学的应用前景

发布时间:2022-04-29 阅读 1859

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:赵莹(厦门大学)
邮箱zhaoying@stu.xmu.edu.cn

编者按:随着大数据时代的到来,机器学习在各个领域都成为了热门话题,那么机器学习在经济学研究领域是否有应用前景呢?一起来看看知乎答主们的不同意见吧。

来源:本文主要整理自知乎热议机器学习(machine learning)在经济学领域是否有应用前景? 特此致谢!


目录


1. 支持意见

1.1 发现新事实

答主「李佳飞」总结了斯坦福 Jonathan Levin 教授对该问题的看法:

  • 机器学习方法强大的地方在于拟合预测模型以及对高维度的大数据进行分类。而大数据正在越来越多地被应用到经济学中,因此毫无疑问,机器学习会被越来越频繁地使用。并且,机器学习与因果推断相结合的领域在未来会得到很多关注,实证微观经济学有很大一部分是寻找不同方法来利用自然实验,而大数据的好处在于发现自然实验。
  • 除此之外,大数据能够产生出各种关于个体行为、劳动力市场、企业生产力和宏观经济层面新奇有趣的事实发现,这些会为经济理论的研究注入新能量。

1.2 处理复杂性

答主「扣小米」总结了 Varian (2014) 的观点:

  • 计算机技术现在已经深入到了经济学的研究中,如今数据量越来越大,大数据量让变量之间的关系变得更加灵活,传统计量中的线性以及大多非线性模型可能都无法满足这一要求,所以经济学家需要寻找新的研究方法。
  • 机器学习理论中的 Decision Trees(决策树),Support Vector Machines(支持向量机)和 Deep Learning(深度学习)等技术可以更加有效率地处理复杂关系。

2. 应用领域

2.1 理论和实证

答主「王也」认为机器学习在经济学理论和实证层面的应用有不同的侧重。

  • 在理论层面:机器学习的主要作用是实现预测的功能,比如估计Propensity Score(倾向得分)。现在比较热门的话题是用机器学习来估计潜在结果,预测控制组的结果,Lasso 回归在这个环节可以大显身手。另一个方向是用机器学习来看平均处理效应(ATE)的异质性。
  • 而在实证层面,机器学习往往是起到辅助的作用,比如利用分类等方法提高数据处理效率,或利用文本分析构造新的变量。Burgess et al. (2012) 通过卫星照片测量了印尼的森林砍伐率。他们先找人手动把一部分照片上不同颜色的区块归到各个类别,基于这个训练集估计一个Regression Tree(回归树),再用该模型对剩下的色块分类。

2.2 解决实际问题

答主「黄一飞」认为,机器学习在实际应用中的成功会倒逼经济学在工程性上与时俱进。

  • 商学院在这点上走在了经济系的前面,很大程度上是因为商学院的评价体系和价值取向更容易鼓励实际应用问题导向的研究。具体来说,金融、会计领域的顶级期刊上已经有很多利用文本挖掘、自然语言处理、语音识别等技术从文本、音频等非结构化数据中提取信息,来预测上市公司财务舞弊和股价等的研究。
  • 例如,搜索引擎关键词广告竞价拍卖的巨大商业价值催生了一批非常高质量的交叉学科研究和学术社区。Nekipelov et al. (2015) 研究了一个非常经典的拍卖实证问题:如何从卖拍的报价数据推断竞拍者对拍卖标的的真实估值。但是作者并不依赖拍卖结果是纳什均衡的假设,而假设竞拍者是不断地在学习最好的竞拍策略。这对于搜索引擎关键词竞价拍卖这个高频率并且拍卖利益巨大应用场景是很贴切的。

3. 前沿文献汇总

答主「meta318」总结了部分近年来经济学不同领域应用机器学习的有关文献:

3.1 因果推断领域

  • Pearl (2012) 用概率图模型进行因果推断。
  • Johansson et al. (2016) 用 representation learning 进行 Rubin 框架下的反事实推断。
  • Hartford et al. (2017) 用 deep learning 来寻找工具变量进行反事实推断研究。
  • Athey and Imbens (2016) 用树模型进行因果推断。

3.2 行为经济学领域

  • Singh et al. (2011) 用 hidden markov model 来研究用户的隐含状态对可观测行为的影响。

  • Jacobs et al. (2016) 用 Topic Modeling 来预测用户在线购买商品的行为。

  • Fader et al. (2005) 用统计学模型预测和估计顾客的终身价值。

  • Hoff et al. (2002) 用统计学模型估计网络结构上用户的传播信息行为。

3.3 博弈论领域

  • Igami (2020) 阐述了人工智能的某些算法与动态结构模型的计量经济学之间的联系。
  • Charpentier et al. (2021) 介绍了强化学习在经济学、博弈论、运筹学和金融学方面的应用。

3.4 挖掘新的自变量

  • Netzer et al. (2012) 用文本挖掘的方法分析企业所处的市场结构和竞争格局。
  • Zhang et al. (2021) 用 image mining 的方法,研究 Airbnb 上房间图片质量与用户需求之间的关系。
  • Liu et al. (2019) 用 video mining 的方法,研究 YouTube 视频对于患者康复的影响。

4. 反对意见

「匿名答主」认为机器学习在经济学领域的应用并不乐观。

  • 机器学习的模型缺乏解释性,SVM 以及深度学习这种模型都是难以解释的。决策树类模型虽然可以给出一个清晰的分类顺序,但是树类模型往往没找到最优解,即便找到了最优解,决策树模型给出的分类法则也会出现匪夷所思的分类方法。
  • 除此之外,经济学不仅仅是分类和推断,毕竟不能指望机器学习告诉你最佳的基准储备金率。
  • 归根结底,机器学习假设了一个很低的试错成本,然而很多经济决策只有一次,直接关系了宏观经济的走势,小公司的存亡,这样的决策必须用 prescriptive modeling 来分析,在其看来这是经济学的魅力所在,也是难以被机器学习泛化的原因。

5. 参考文献

  • Athey, Susan, and Guido Imbens. 2016. “Recursive Partitioning for Heterogeneous Causal Effects.” Proceedings of the National Academy of Sciences of the United States of America 113 (27): 7353–60.
  • Burgess, R., M. Hansen, and B. A. Olken. 2012. “The Political Economy of Deforestation in the Tropics.” Journal of Economics. https://academic.oup.com/qje/article-abstract/127/4/1707/1844248.
  • Charpentier, Arthur, Romuald Élie, and Carl Remlinger. 2021. “Reinforcement Learning in Economics and Finance.” Computational Economics, April. https://doi.org/10.1007/s10614-021-10119-4.
  • Fader, Peter S., Bruce G. S. Hardie, and Ka Lok Lee. 2005. “‘Counting Your Customers’ the Easy Way: An Alternative to the Pareto/NBD Model.” Marketing Science 24 (2): 275–84.
  • Hartford, Jason, Greg Lewis, Kevin Leyton-Brown, and Matt Taddy. 06--11 Aug 2017. “Deep IV: A Flexible Approach for Counterfactual Prediction.” In Proceedings of the 34th International Conference on Machine Learning, edited by Doina Precup and Yee Whye Teh, 70:1414–23. Proceedings of Machine Learning Research. PMLR.
  • Hoff, Peter D., Adrian E. Raftery, and Mark S. Handcock. 2002. “Latent Space Approaches to Social Network Analysis.” Journal of the American Statistical Association 97 (460): 1090–98.
  • Igami, Mitsuru. 2020. “Artificial Intelligence as Structural Estimation: Deep Blue, Bonanza, and AlphaGo.” The Econometrics Journal 23 (3): S1–24.
  • Jacobs, Bruno J. D., Bas Donkers, and Dennis Fok. 2016. “Model-Based Purchase Predictions for Large Assortments.” Marketing Science 35 (3): 389–404.
  • Johansson, F., and U. Shalit. 2016. “Learning Representations for Counterfactual Inference.” Conference on Machine …. http://proceedings.mlr.press/v48/johansson16.html.
  • Liu, Xiao, Bin Zhang, Anjana Susarla, and Rema Padman. 2019. “Go to YouTube and Call Me in the Morning: Use of Social Media for Chronic Conditions.” Forthcoming, MIS Quarterly. https://doi.org/10.2139/ssrn.3061149.
  • Nekipelov, Denis, Vasilis Syrgkanis, and Eva Tardos. 2015. “Econometrics for Learning Agents.” In Proceedings of the Sixteenth ACM Conference on Economics and Computation, 1–18. EC ’15. New York, NY, USA: Association for Computing Machinery.
  • Netzer, Oded, Ronen Feldman, Jacob Goldenberg, and Moshe Fresko. 2012. “Mine Your Own Business: Market-Structure Surveillance Through Text Mining.” Marketing Science 31 (3): 521–43.
  • Pearl, Judea. 2012. “The Do-Calculus Revisited.” arXiv [cs.AI]. arXiv. http://arxiv.org/abs/1210.4852.
  • Singh, Param Vir, Yong Tan, and Nara Youn. 2011. “A Hidden Markov Model of Developer Learning Dynamics in Open Source Software Projects.” Information Systems Research 22 (4): 790–807.
  • Varian, Hal R. 2014. “Big Data: New Tricks for Econometrics.” The Journal of Economic Perspectives: A Journal of the American Economic Association 28 (2): 3–28.
  • Zhang, Shunyuan, Dokyun Lee, Param Vir Singh, and Kannan Srinivasan. 2021. “What Makes a Good Image? Airbnb Demand Analytics Leveraging Interpretable Image Features.” Management Science, December. https://doi.org/10.1287/mnsc.2021.4175.

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 机器 学习
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh