因果推断:哪本教材适合我?

发布时间:2021-12-28 阅读 2507

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 涂冰倩 (浙江大学)
邮箱: tubingqian@zju.edu.cn


目录


注:本文主要参考博主 Brady Neal 的博文 Which causal inference book you should read

1. 因果推断书目清单

2021 年因果关系方法论获得诺贝尔经济学奖啦!茫茫书海,却不知道自己该从何入手学习因果推断?

今天,Brady Neal 博士给各位梳理一下如火如荼的「因果推断」主流教科书,以便帮你确定「意中人」!

别人眼中的「圣经」可能是你的「天书」。此话不假,有些书之所以难懂,并不是作者写的不好,很可能是我们自己的知识背景和思维模式与作者的存在较大的差异,以至于彼此「相看两厌」。

事实上,通过读书学习某些新东西,又如选择合适的道路登山。你若经验丰富,自然应该选择严峻的「捷径」,省了时间,也多了挑战的乐趣;你若追求闲庭阔步,自然应该选择滑坡而行,虽然慢,但却可以尽览沿途美景。前者对应的书籍会采用大量简洁的数学公式,而后者则更多是图文并茂,辅以浅显易懂的小例子。当然,后者有时候会略显繁琐,但却是初学者的福音。

我们先列出今天要介绍的「八大金刚」,随后逐一评价。

  • B1-Pearl2016:Causal Inference in Statistics: A Primer (Pearl et al., 2016)
  • B2-Peters2017: Elements of Causal Inference: Foundations and learning Algorithms ( Peters et al., 2017 )
  • B3-Imbens2015: Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction ( Imbens & Rubin, 2015 )
  • B4-Rosenbaum2010:Design of Observational Studies ( Rosenbaum, 2010 )
  • B5-Hernán2020:Causal Inference: What If ( Hernán & Robins, 2020 )
  • B6-Morgan2014:Counterfactuals and Causal Inference: Methods and Principles for Social Research ( Morgan & Winship, 2014 )
  • B7-Angrist2009:Mostly Harmless Econometrics ( Angrist & Pischke, 2009 )
  • B8-Pearl2009:Causality: Models, Reasoning, and Inference ( Pearl, 2009 )

2. 小测试:你需要修炼到哪个层次?

别着急,先做个小测试吧,看看自己最适合先从哪本书开始阅读 ( 以下测试根据博主 Neal 文章中的流程图改编 )。

Source: Which causal inference book you should read

Q1. 想要快速入门还是深入学习?

[ ] 快速入门 - B1-Pearl2016

[ ] 深入学习 - B2-Peters2017

Q2. 是否偏好机器学习/结构学习?

[ ] 是 - B2-Peters2017

[ ] 否 - Q3

Q3. 偏好基础理论还是应用?

[ ] 基础理论 - Q4

[ ] 应用 - Q5

[ ] 中立 - Q8

Q4. 是否喜欢图表?

[ ] 喜欢 - Q6

[ ] 不喜欢 - B3-Imbens2015 OR B4-Rosenbaum2010

[ ] 中立 - Q8

Q5. 更关注哪一方面的应用,流行病学、社会科学还是计量经济学?

[ ] 流行病学 - B5-Hernán2020

[ ] 社会科学 - B6-Morgan2014

[ ] 计量经济学 - B7-Angrist2009

Q6. 是否想快速入门?

[ ] 想 - B1-Pearl2016

[ ] 不想 - Q7

Q7. 是否熟悉 structural causal models(SCMs)并想要精通于此?

[ ] 是 - B8-Pearl2009

[ ] 否 - B2-Peters2017

Q8. 可以根据作者关注的视角来进行选择

[ ] 统计推断 ( statistics ) - B3-Imbens2015 OR B4-Rosenbaum2010

[ ] 机器学习 ( machine learning ) - B2-Peters2017

[ ] 因果图 ( causal graphs ) - B1-Pearl2016

[ ] 流行病学 ( epidemiology ) - B5-Hernán2020

[ ] 社会科学 ( social sciences ) - B6-Morgan2014

[ ] 计量经济学 ( econometrics ) - B7-Angrist2009

3. 书籍详解

⭕ B1-Pearl2016:

Causal Inference in Statistics: A Primer ( Pearl et al., 2016 )

这本书对于初学者来说再好不过,对因果推断和合成控制法有清晰明了的介绍,语言较为直白,少有公式或代码,可读性高。第一作者 Pearl 是 UCLA 计算科学的教授,曾获图灵奖,对因果推断做出了许多重要贡献,开创了基于有向图结果的因果推断。作者的另一本书《为什么:关于因果关系的新科学》 ( The Book of Why: The NewScience of Cause and Effect ) 或许更为大家所知,感兴趣的读者可以阅读。

豆瓣用户评论“全书一共四章,前两章比较基础,介绍了所有 CI 最基本的理论部分。第三章 intervention,第四章 counterfactual 是属于比较深入的话题。这本书弥补了 book of why 里的技术细节,所有的概念也经由数学语言严格化,解决了很多 book of why 里泛泛而谈造成的细节缺失……”

⭕ B2-Peters2017:

Elements of Causal Inference: Foundations and learning Algorithms ( Peters et al., 2017 )

“总结了近年来比较前沿的因果推断研究结论,大量篇幅用于证明和形式化描述定理、引理、结论等”,不太适合初学者,适合有机器学习背景的人学习,该书甚至有两章专门讨论因果推断与机器学习之间的联系。综合来说,这本书包含了其他书通常不会涉及的因果发现 ( causal discovery ) ,因而可能是学习现代因果发现 ( modern causal discovery/ structure learning ) 技术最好的书,能为后续结构因果模型 ( structural causal models ,SCMs ) 的学习打下基础。

⭕ B3-Imbens2015:

Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction ( Imbens & Rubin, 2015 )

厦门大学赵西亮老师认为“这本书应该是学习因果推断的圣经”。“如果让我为大家只推荐一本因果推断的书,那么它将是由斯坦福大学教授Imbens和哈佛大学教授Rubin合著的《Causal Inference for Statistics, Social, and Biomedical Science: An Introducation》,没有之一。两位作者分别是在计量经济学和统计学领域的大牛,相信各位对两位学者都不陌生,其中Rubin就是潜在结果框架的提出者,潜在结果框架有时也用Rubin的名字命名,称为RubinCausal Model。”

豆瓣用户 Bing 评论“全书的主要内容是 RCM ( Rubin Causality Model ) ,也就是基于 potential outcome 概念的因果模型,以 Rubin 早中期的研究成果为主,大多数内容都以随机试验为主要数据场景。每章都有大量的理论说明和推导,并配合一个(小)数据分析的实例。主要内容是因果分析的随机试验准则,倾向得分,匹配,混淆因素,工具变量等。最新的一些方法如 DID,RDD 等等,据作者所言将准备交给下册。…… 全书传统统计理论研究色彩浓厚,逻辑缜密,推导细致严谨,但可能会让社会科学等其他领域的人望而生畏。”

⭕ B4-Rosenbaum2010:

Design of Observational Studies ( Rosenbaum, 2010 )

亚马逊用户评论 “我不知道为什么没有人看过这本书,也不知道为什么它不受欢迎,但如果你对从观测数据 ( observational data ) 中收集到的信息感兴趣,那这本书是很值得推荐的。观测数据和实验数据不同,相较来说,对观测数据的研究旨在寻找非随机干预措施的效果。这一研究主题在医疗科学、教育和社会科学中很重要,因为在这些研究领域,很容易获得观测数据,并能从数据中得到某些问题的答案。”

⭕ B5-Hernán2020:

Causal Inference: What If ( Hernán & Robins, 2020 )

该书由哈佛大学公共卫生院的两位教授合写,主要针对医学领域,比较简单易懂,也可以作为因果推断的入门教材。作者之一 Jamie Robins 对流行病学和因果推论的发展做出了重要贡献,图灵奖得主Pearl认为他的调整公式在其1986年论文中就隐含出现了(第一次在文献中可以看出该调整公式)。博主 Neal 认为这是他所有读过的书中最实用的一本,举例来说,这本书是唯一涵盖了“ positivity / overlap ”概念的书,而这是估计因果效应必须满足的重要条件。此书也是提到的几本书中唯一涵盖了如何估计结果模型 ( outcome models ) 和倾向得分匹配模型 ( propensity score models ) 的书。应该指出,这本书中有很大的篇幅用于介绍可在实践中使用的估计量。第一部分主要介绍的是无模型的因果推断;第二部分则介绍有模型的因果推断;第三部分是如何在复杂的纵向数据中进行因果推断。

⭕ B6-Morgan2014:

Counterfactuals and Causal Inference: Methods and Principles for Social Research ( Morgan & Winship, 2014 )

这同样是一本非常实用的书,这本书篇幅较长,作者引用了社会科学中的许多实际例子,可以说是涵盖了经济学,计算机科学以及整个社会科学中因果推断文献的主题。作为一个喜欢抽象而不是举例的人,博主 Neal 认为此书部分章节稍显冗长,但能为我们提供丰富的参考文献,并提供这些论文的最关键细节。从内容上来看,这本书很好地结合了潜在结果 ( potential outcomes ) 和图形因果推断 ( graphical causal models ) 的观点,并进行了比较。此外,该书涵盖了基于条件的因果效应估计量 ( conditioning-based estimators of causal effect ) 的 3 种不同类别,并分别用相应章节进行讲解:匹配,回归和逆概率加权。其他章节则涉及了工具变量和前门调节变量等。

⭕ B7-Angrist2009:

Mostly Harmless Econometrics ( Angrist & Pischke, 2009 )

不必多言,这本书想必学经济的各位都很熟悉了。如果你想了解经济学家是如何看待因果推断的,那这本书非常适合你。针对一系列问题:“较小的班级规模是否会提高学生的学习成绩?最低工资会减少就业吗?虐待妻子的人应该被逮捕吗?教育能提高多少收入?民主会促进经济增长吗?”,这本书展示了如何应用计量经济学方法回答这些因果问题。

总体来说,此书不太关注基于条件的估计量 ( 想想 backdoor adjustment ) 。相反,它着墨于准自然实验方法,比如说工具变量方法、双重差分方法、断点回归设计等等。由于没有特别复杂的数理推导过程,此书对数学不那么好的同学非常友好,中文翻译版有些地方可能不太容易理解,有条件的友友可以对照英文原版阅读哦。

由于这本书是 2009 年出版的,因此未涵盖诸如合成控制法之类的最新方法。想要阅读一本涵盖合成控制法的最新教科书,博主 Neal 推荐 Scott Cunningham 的“Causal Inference: The Mixtape”。

安神还有一本《精通计量:从原因到结果的探寻之旅》 ( Mastering Metrics: The Path from Cause to Effect ) ,更适合初学者,两者搭配食用更佳哦!喜欢《功夫熊猫》的同学更不要错过哦!此外,还推荐厦门大学赵西亮老师撰写的《基本有用的计量经济学》。

⭕ B8-Pearl2009:

Causality: Models, Reasoning, and Inference ( Pearl, 2009 )

对想成为 structural causal models ( SCM ) 专家的人,强烈推荐此书!书中有丰富的理论知识,不是很容易阅读。如果你没有学习过或没有强烈的动机去了解 SCM ,那此书几乎是不可读的。博主 Neal 认为网络上对于这本书的评价过于刻薄,应该指出,这些苛刻的评论多来自对该理论不太感兴趣的人。在阅读了一些比较入门的书籍并对因果关系有了一定了解之后,再来阅读此书,想必会有更为深刻的理解。若已经提前读过这本书,日后重读一遍也是非常有意义的。

⭕ 其他书籍推荐

博主 Neal 在原博文里还推荐了几本流程图里未涉及到的书籍:

  • Explanation in Causal Inference: Methods for Mediation and Interaction ( VanderWeele, 2015 )

适合想要成为中介分析 ( mediation ) 和调节分析 ( interaction ) 领域专家的读者阅读。由于此书目标读者为普罗大众,所以正文部分不是很具有技术性。然而本书的附录几乎包含了读者所有想知道的技术细节,甚至能作为一本单独的书来阅读。此外,本书获得了美国统计协会2015年颁布的“ Causality in Statistics Education ”奖项。

  • Observation and Experiment: An Introduction to Causal Inference ( Rosenbaum, 2017 )

Rosenbaum 除了撰写前文提及的 Design of Observational Studies ( Rosenbaum, 2010 ) 一书,还于 2017 年出版了另一本有关因果推断的书。从博主 Neal 所阅读过的部分来看,这本2017年出版的书将比2010年的书更易读。下面是 Rosenbaum 对他自己这本书的评价“我在此书中的目标是以更少的技术细节呈现因果推断的相关概念,力求精准和清晰”。

  • Causation, Prediction, and Search ( Spirtes et al., 2001 )

本书的前两位作者提出了经典的 PC ( Peter and Clark ) 算法。Pearl 认为这本书的第一版 ( 1993 ) 引入了这样一个概念,即 “ an intervention corresponds to removing all incoming edges to the intervened node in the graph ”。同时,Pearl 还认为这本书的第一次出版明确了调整公式 ( 与罗宾斯1986年论文中的相反 )。

  • Actual Causality ( Halpern, 2016 )

Joseph Halpern 为了厘清 X 对 Y 的影响到底意味着什么,做了大量工作,这使得这本书成为理解某事物为何是其他事物的原因的重要书籍之一。

  • Targeted Learning ( van der Laan & Rose, 2011 )

4. 参考资料和更多书籍推荐

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 因果
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh