大侦探经济学
上QQ阅读APP看书,第一时间看更新

序言
因果推断革命:寻找另一个犯罪现场

近30年来,借助于统计学中对因果关系认识的深化,现代经济学研究爆发了一场因果推断革命。这场因果推断革命,使得经济学家的工作变得越来越有趣,经济学家也越来越像一个个的大侦探。他们从纷繁复杂的世事以及各色各样的数据中,使用因果推断的计量工具,探寻一个又一个积年的悬案和新奇疑问背后的真相,为我们解开了一个又一个历史、社会和经济的谜团。

·美国企业雇主在雇佣决策中到底有没有歧视黑人?(第一章“乔治·弗洛伊德之死”)

·黑人更容易被美国法院判处死刑吗?(第一章“乔治·弗洛伊德之死”)

·墨西哥扫毒之战有没有导致墨西哥刑事犯罪率暴增?(第二章“墨西哥毒品战争之殇”)

·黑手党的真正起源是因为意大利西西里地区更适合种植柑橘?(第三章“意大利黑手党的前世今生”)

·中国北方冬季供暖令多少人死于由此带来的心肺疾病?(第四章“看不见的雾霾杀手”)

·在美国上名校是否能让未来收入增加?(第五章“名校骗局?”)

·传统中国种植茶叶地区的女孩是不是更容易存活下来?(第六章“消失的女性之谜”)

·对非洲等发展中国家的食品援助是不是加剧了这些地区的内战?(第七章“奴隶贸易的阴影”)

·气候越热的国家经济发展是不是就越差?(第八章“白人殖民者的意外死亡”)

·白人殖民者的死亡率是不是决定了该殖民地日后的经济发展状况?(第八章“白人殖民者的意外死亡”)

·货币政策对走出大萧条到底有没有帮助?(第九章“大萧条的幕后真凶”)

·搬到更富裕的社区生活对多大孩子的成长有好处?(第十章“消逝的‘美国梦’”)

……

在这本书里,我们的经济学大侦探对这些问题一一进行了研究。这些问题是如此重要,同时又是如此有趣,经济学家们给出的因果性答案又是如此严谨,以至于19世纪英国大知识分子托马斯·卡莱尔(Thomas Carlyle)送给经济学的那顶“沉闷的科学”帽子,如今再也戴不到它的头上。

因果关系是一种迷信?

探究因果关系是科学工作的重要目的。然而,因果性面纱却又如此神秘莫测,一代又一代的学者为之心醉神迷,经历了数个世纪的探讨。

经济学奠基人、《国民财富的性质和原因的研究》(以下简称《国富论》)一书的作者亚当·斯密,有一位著名的哲学家朋友大卫·休谟(David Hume),对经济学和逻辑学均有贡献。在他的那本哲学名著《人性论》中,休谟认为,我们人类无从得知因果之间的关系,我们只能认识到或者联想到某些事物彼此之间相互关联,这是我们的经验告诉我们的。所谓的因果关系,乃是出于我们的联想,是我们所养成的心理习惯而已。参阅[英]大卫·休谟著:《人性论:在精神科学中采用实验推理方法的一个尝试》(上、下册),关文运译,商务印书馆1980年版。

19世纪英国最伟大的哲学家约翰·穆勒(John Stuart Mill)也是一位出色的经济学家和逻辑学家,在他那本逻辑学名著《逻辑体系》(严复先生翻译为《穆勒名学》)中曾经探讨过如何确定因果关系。他说,如果一个人吃了某道菜之后死了,那么,只有当他同时又没有吃这道菜之后活着,这两种状态都为我们所观察到时,我们才能说,这道菜是他死去的原因。Mill, J.S. A System of Logic, In Collected Works of John Stuart Mill. University of Toronto Press,1973.

穆勒如此定义的因果关系,与今天我们讨论的因果效应从本质上有相近之处,但在我们一般人看来,一个人如何能在吃了这道可能害死他的菜与没吃这道菜两种状态下同时存在?我们不是上帝,无法创造平行宇宙。到了20世纪,同为哲学家和逻辑学家的伯特兰·罗素(Bertrand Russell)干脆完全放弃了因果关系,他把因果关系视为一种迷信。参阅[英]伯特兰·罗素:《我的哲学的发展》,温熙增译,商务印书馆2001年版。

而同一时期得到蓬勃发展的统计学,更是认为“相关不是因果”,恪守着因果关系是无法通过统计学加以研究的戒条,不敢越雷池一步。参阅[美]朱迪金·铂尔、达纳·麦肯齐:《为什么:关于因果关系的新科学》,江生、于华译,中信出版社2019年版。

幸运的是,到了20世纪最后的四分之一时间里,人们在那些偷吃禁果的统计学先驱所做工作的基础上,开始一步步揭开因果关系的神秘面纱。Imbens, Guido. Rubin, Donald. Causal Inference for Statistics, Social, and Biomedical Sciences.Cambridge University Press,2015.

反事实框架下的因果关系:寻找另一个犯罪现场

约翰·穆勒说的一点也不错,要想真正地揭示因果关系,你必须保证因果关系的主体相同,同时所有的其他环境与条件也都一样,最好是同一个人,同时出现在不同的状态下,经过对比,你才能说明某种状态的因果效应是怎么样的。

我们就拿美国黑人乔治·弗洛伊德(George Floyd)之死来说吧。

2020年5月25日,在美国明尼苏达州明尼阿波利斯市非裔美国人乔治·弗洛伊德被白人警察德里克·肖万(Derek Chauvin)逮捕,肖万单膝跪在弗洛伊德脖颈处超过8分钟,最终导致弗洛伊德死亡。之后,美国各地爆发了一系列抗议示威活动,引起了巨大的社会震荡。

人们纷纷把警察暴力执法的原因归结为种族歧视。

如果我们只是看到这样的结果,就一致认定原因是种族歧视,那么,这的确像大卫·休谟所说,所谓的因果关系,真就变成了一种心理习惯了。我们看到了白人警察和黑人罪犯,最后又看到了黑人罪犯身死,于是经过联想后认定,这都是种族歧视惹的祸。

事实上,要想断定弗洛伊德之死到底是不是能归因于种族歧视,我们只能使用穆勒说的那种办法——寻找另外一个犯罪现场。在另外那个犯罪现场,就像是我们今天这个世界的平行宇宙,里面也有一个白人警察肖万,一个叫作乔治·弗洛伊德的黑人。不过,在这另外一个犯罪现场里,乔治·弗洛伊德拥有一粒神奇的药丸,他在这一切开始之前的一分钟,吃下了这个药丸。这个药丸的神奇作用是它可以立即改变服用人的肤色。于是,同样的场景下,在这另外一个犯罪现场里,乔治·弗洛伊德变成了一个白人。

然后,我们再来观察这另外一个犯罪现场的结果:白人警察肖万又将如何来对待现在吃了药丸变成白人的乔治·弗洛伊德?

这另外一个犯罪现场,就是今天我们从电视上和网络上看到的乔治·弗洛伊德之死案的反事实情况。它没有发生,但我们可以想象这样的反事实。

那粒药丸,可以改变弗洛伊德的肤色,在实验设计里,这被叫作一项处理(treatment)或一项干预,它可以操控弗洛伊德处在黑人或白人的不同状态下,这样,我们就可以比较两种状态下他的最终命运。

我们可以观察到四种潜在结果:

第一种:无论是否吃下药丸变成白人,乔治·弗洛伊德都死了;

第二种:无论是否吃下药丸变成白人,乔治·弗洛伊德都没死;

第三种:吃下药丸变成白人,乔治·弗洛伊德没死;没吃药丸仍是黑人,乔治·弗洛伊德死了;

第四种:吃下药丸变成白人,乔治·弗洛伊德死了;没吃药丸仍是黑人,乔治·弗洛伊德没死。

如果是第一种和第二种,说明无论弗洛伊德变不变成白人,结果都一样,警察肖万不存在种族歧视;如果是第三种,我们可以说,警察肖万歧视黑人;如果是第四种,我们得说,警察肖万此时歧视白人。

这样,我们站在上帝视角上,使用反事实框架,就可以完美地定义种族歧视的因果含义。

遗憾的是,我们不是上帝,我们只能观察到一种状态下的一种潜在结果变成现实。那就是,白人警察肖万在逮捕黑人弗洛伊德时,杀死了对方。

拟合出平均意义上的“另一个犯罪现场”:随机实验与潜在结果模型

如果单纯地从乔治·弗洛伊德之死这一件事情出发,我们要想断定种族歧视是否是他致死的真正原因,从前面所定义的反事实框架下的因果关系看,我们确实没有办法做到。但好在无论是大自然还是人类那神鬼莫测的历史命运,都不是“惊鸿一瞥”,它们常常反复出现,并最终为我们所认识。

其实,自然科学家早就使用了这种办法来制造反事实的情况,只不过他们的办法不是利用自然发生的事件进行干预,而是通过随机实验的方法主动创造出“另一个犯罪现场”来。

在1946年之前,肺结核曾经是不治之症。医生们尝试过各种各样的方法,都没有找到真正有效的治疗方法,直到1946年美国罗格斯大学的研究团队发现了第二种应用于临床的抗生素——链霉素,开创了治疗结核病的新纪元。

1948年,杰弗里·马歇尔(Geoffrey Marshall)等人做了人类历史上的第一个随机对照试验,目的就是来评价链霉素在治疗肺结核上的有效性和安全性。通过随机选取15~30岁的双侧急性进展性原发型肺结核患者,随机地把患者分为两组:一组接受链霉素治疗并卧床休息,这一组就是实验组,也叫作处理组或干预组;一组仅仅卧床休息,这一组就是对照组,也叫作控制组。这里的实验组和对照组,对应的就是前面乔治·弗洛伊德是否吃下那个可以改变其肤色的药丸,吃下药丸,变成了白人,这就是进行一项干预。而没吃下药丸仍然是黑人的状态,就是反事实情况的对照组,这个实验的评价指标是乔治·弗洛伊德有没有死。而马歇尔的这个实验,其评价的主要指标是6个月内的生存率,以及6个月时根据胸部X光片评价的明显改善率。研究结果显示,6个月的生存率实验组和对照组分别为93%和73%,而明显改善率为51%和8%,这些结果在统计上都非常显著(p<0.01——我们一会儿来解释它的意思)。由此可见,链霉素可改善肺结核患者的症状,并减少死亡率。

这个实验的成功,标志着随机实验的思想正式得到了科学界的认同。

随机实验的思想最早是由统计学家杰西·内曼(Jerzy Neyman)于1923年提出来的,而且他还根据潜在结果的框架给出了因果效应的正式定义。Neyman, J.(1923, 1990).“On the Application of Probability Theory to Agricultural Experiments.Essay on Principles. Section 9.”translated in Statistical Science,(with discussion), Vol. 5(4):465-480.此文一直到1990年才被翻译成英文。但内曼教授不像他的统计学对手罗纳德·费希尔(Ronald Fisher)那样会讲故事,我们接下来从费希尔这位几乎单人独骑就奠定了现代统计学基础的伟大统计学家提到的一个关于“女士品茶”的故事说起。参阅[美]戴维·萨尔斯伯格:《女士品茶》,邱东等译,中国统计出版社2004年版。这个故事曾为费希尔所提及,后来被萨尔斯伯格写成这本科普书,从此广为人知。

故事发生在20世纪20年代末的一个夏日的午后,地点是英国剑桥大学。当时,一群大学教授和他们的妻子还有客人围坐在院子里的一张桌子边喝下午茶。其中有一位女士坚持认为,把牛奶倒入茶中,与把茶倒入牛奶中,奶茶的味道会有所不同。在座的很多人都认为这不可思议,因为奶与茶倒入杯子的顺序并没有改变奶茶的化学成分,能有什么味道上的差别呢?只有一位又瘦又矮、戴着厚厚眼镜的男子表情严肃,陷入了沉思,他就是费希尔。

费希尔为此设计了一个巧妙的随机实验,来试验这位女士是不是真能品出奶和茶倒入顺序的不同。他准备了8杯一样的奶茶,其中4杯是先奶后茶,4杯是先茶后奶,并将它们随机打乱顺序,请这位女士品尝。如果这位女士全部答对,那么,我们可以说这位女士具有分辨奶茶味道的能力吗?

如果这位女士全部答对了,但全都是蒙对的,这种情况出现的概率,费希尔把它定义为p值。也就是说,在假设这位女士没有办法分辨奶茶的条件下,她却全部答对了的概率。这个概率越小,说明我们做出的这位女士无法分辨奶茶的假设,就越可能是错的。按照这8杯奶茶的任意置换顺序,一共有种置换顺序,这位女士如果猜对了实际的顺序,就相当于从70种顺序中猜对了其中的那一种,这个p值就是1/70≈0.014。一般来说,我们设定的p值大多在0.05左右,也就是1/20,只要p值小于这个水平,我们一般就认为,这位女士如能全部答对奶与茶的倒入顺序,她只是出于运气而做到的可能性就很小。现在这个值只有0.014,所以,我们有理由相信,这位女士具有对奶茶的分辨能力。

随机实验的方法在1948年的肺结核治疗实验中获得了成功,即便以今天的标准来衡量,历史上的这第一场随机实验,其设计也称得上非常严谨。我们在本书终章“因果推断的五种武器——《西游记》番外篇之‘仙丹、蟠桃和唐僧肉——随机实验辨长生’”一节中对随机实验的逻辑与历史发展有进一步的介绍和举例,采取的叙述方式是笔者杜撰出来的《西游记》中的故事场景,读者也可以翻到那里先睹为快。

好,现在回到我们对“另一个犯罪现场”的讨论。

的确,我们没有办法发明那种神奇的药丸,让人们瞬间改变自己的肤色,但是我们可能拥有大量类似于弗洛伊德之死案中的案件场景。如果我们搜集到了足够多的这类案件场景,并且把所有相关的因素都转换为可以度量的变量,我们就可以把那些与弗洛伊德之死场景最接近的案件找出来。这些案子在其他条件都相同的情况下,只有被害人的肤色不同这一点差别。这就好像是我们找到了与弗洛伊德很相似的许多个体,他们也有着与弗洛伊德相似的处境,但他们中有些是黑人,有些是白人。然后,我们来观察他们最终的结果如何。我们的确不可能再造一个白种人的弗洛伊德,但我们可以通过控制其他条件,尽可能地拟合出“另外一个犯罪现场”。在那些现场中,犯罪嫌疑人可能是黑人,也可能是白人,这就仿佛是历史数据自然提供了一个实验,把其中一些场景划归处理组,另一些场景划归对照组。然后,我们可以计算他们在不同场景下最后的平均结果是怎么样的。而这种平均结果上的比较,就是有无种族歧视的因果性答案。

这就是因果推断的潜在结果模型(Potential Outcomes Model),是哈佛大学统计学系的唐纳德·鲁宾(Donald Rubin)教授在20世纪70年代中期的一系列文章中明确提出来的理论模型。潜在结果模型的核心是比较同一个研究对象在接受处理和不接受处理两种状态下的结果差异,并把这一结果差异视为接受处理的因果效应。虽然我们无法同时观察到同一研究对象的这两种状态,但我们可以使用随机实验的思想和回归估计的方法,把这种平均的因果效应估计出来。除了鲁宾提出的这种因果关系推断的模型之外,著名的计算机学家、图灵奖得主朱迪亚·铂尔(Judea Pearl)教授也在差不多的时间里提出了一种叫作因果图的概念,也可以用来阐述这种因果关系的推断,虽然鲁宾教授似乎一直不肯接受这一点。在铂尔所著的《为什么》一书中,铂尔特别辟出一章来讲述鲁宾的反事实框架,但在鲁宾2015年出版的《因果推断》一书中,正文却基本未提到铂尔的因果图思想,这很能反映出鲁宾的态度。另外,铂尔也明确讲到,鲁宾认为因果图一点用处也没有。这场学术公案,本书不去过多涉及,本书介绍的框架基本上是因循鲁宾的,因为因果图的思想在经济学界似乎并不流行。

《大侦探经济学》的由来

自20世纪90年代以来,经济学家开始越来越多地使用因果推断的基本框架,进一步发展了工具变量方法、断点回归设计、双重差分方法等识别手段,在经济学的经验研究领域掀起了一场空前的研究高潮。同时,自人类社会进入21世纪以来,在计算机网络的不断发展之下,数据大量涌现,普通的研究者也可以获取到,这对于各种经济事件背后的因果效应研究,起到了如虎添翼的作用。

笔者在2009年第一次接触到有关因果推断的计量经济学,那一年我和合作者一起翻译了麻省理工学院的著名计量经济学家乔舒亚·安格里斯特教授与约恩-斯特芬·皮施克(Jörn-Stefen Pischke)教授合著的《基本无害的计量经济学》一书,这本书如今已经成为最受国内经济学者推崇的关于因果推断研究的经济学宝典。参阅[美]乔舒亚·安格里斯特、约恩-斯特芬·皮施克:《基本无害的计量经济学》,郎金焕、李井奎译,格致出版社2012年版。2019年,格致出版社还出版了另外一本由此二人所著的《精通计量》一书,此书是《基本无害的计量经济学》的低配版,更为通俗易懂,但仍然需要一些统计学和计量经济学的基础方能充分理解。不过,阅读我们的这本《大侦探经济学》却不需要读者预备任何的统计学和计量经济学基础知识,我预设的读者对象是具有高中及以上知识水平的人,希望尽可能多地让更多人了解这方面的研究和思想,体验思维的乐趣。2019年,我有幸赴哈佛大学访问一年。在这一年时间里,我得以亲身体验乔舒亚·安格里斯特、今井耕介(Kosuke Imai)、拉贾·切蒂(Raj Chetty)、詹姆斯·斯托克(James Stock)以及理查德·弗里曼(Richard Freeman)这些学术名家的课堂,对这一领域有了更进一步的理解和认识。

这本《大侦探经济学》就是我在哈佛大学这一年学习因果推断方法、阅读前沿文献后的副产品。我热切期盼着能够把这一领域的最新进展和经济学大侦探们神乎其技的研究设计介绍给读者,让大家一睹当今世界一流学者的工作,并认识到经济学科学性的一面。

我在这本书中,挑选了10个主题,内容涉及劳动经济学、法律经济学、政治经济学、犯罪经济学、歧视经济学、环境经济学、发展经济学、经济史、货币经济学、宏观经济学以及大数据下的社会与经济问题研究。这些经济学大侦探故事综合而全面地介绍了经济学大侦探们在各个领域的杰出工作,并通过这种展现,向读者介绍因果推断革命的基本精神和重要工具。最后,我又通过自己编撰的五个《西游记》故事,详细地向读者介绍了经济学大侦探们使用的因果识别武器,并以此结束全书。

好了,接下来,请您随我一起领略一下那些像大侦探一样的经济学家们令人屏住呼吸的鬼斧神工般的破案过程吧!