第3章 受伤士兵与辛普森悖论
纳哈里亚(Nahariya)的加利利医学中心(Galilee Medical Center, GMC)和海法(Haifa)的瑞本医院(Rambam Hospital),哪家医院更好?如果我们查询这两家医院的受伤士兵康复率,我们会发现加利利医学中心的康复率高于瑞本医院。但如果我们查询轻伤士兵的康复率,我们会发现瑞本医院的数据更高,而重伤士兵的康复率也是如此。出现这一情况的原因就藏在辛普森悖论(Simpson's paradox)中——这是一种统计上的悖论,即当若干个子群体合并为一个群体后,会发生一种反转的趋势。加利利医学中心总体康复率比瑞本医院高的原因是大多数重伤士兵是被送到瑞本医院治疗,而轻伤士兵则被送往其他医院,这使得加利利医学中心的康复率更高。
让我们来看看另一个例子:表3展示了黑人和白人杀人犯之间的种族歧视,和发生在20世纪70年代末佛罗里达的谋杀案。
表中共有637起谋杀案,每起案件中都只有一个谋杀者和一个被谋杀者。共计有335个黑人杀人犯杀了269个黑人和66个白人,有302个白人杀人犯杀了17个黑人和285个白人。其中5%的黑人杀人犯和7%的白人杀人犯被判处死刑。
表3 黑人、白人杀人犯的数据
佛罗里达的白人对此表示强烈不满,他们认为自己受到了不公正的待遇,要求对执法部门进行调查。而调查的结果不仅否认了白人的言论,还证明了执法部门对黑人存在着双重歧视:相比一个白人被谋杀,当一个黑人被谋杀时,法院对案件的审判会更宽松。而当一个黑人是杀人犯时,法院对待案件的严厉程度要比白人是杀人犯的情况更高。
当一个白人被一个白人或者黑人谋杀时,所对应的死刑率分别是白人8%,黑人17%。然而,当一个黑人被一个白人或者黑人谋杀时,死刑率分别是白人0,黑人2%。这意味着谋杀一个白人被认为比谋杀一个黑人要糟糕得多,这与凶手的肤色无关。
当一个黑人杀了白人或者黑人时,对应的死刑率分别是17%和2%。但是当一个白人杀了白人或者黑人时,对应的死刑率分别是8%和0。意味着执法部门对黑人杀人犯存在着歧视。
这就是辛普森悖论:如果黑人杀人犯被判死刑的次数比白人杀人犯多(17%对8%),黑人被谋杀的案件中黑人杀人犯被判死刑的比例也更高(2%对0),那为什么总体来看,有更多的白人被判处死刑?
对此的解释和前面医院的康复率问题类似:由于白人谋杀犯杀害的大部分是白人(285/302),而且杀害白人的惩罚更为严厉,因此总体而言,尽管存在着对黑人的明显歧视,白人谋杀犯被判处死刑的人数多于黑人。
另一个比较容易理解的例子是在接受学生进入高等教育机构方面存在明显的歧视。详见表4。
表4 基于性别的大学录取率
此处对男、女生的录取是否存在着歧视?你怎么看待心理学和商学这两个专业?它们是否对某一性别存在歧视?
这张表分析了申请大学的1000个男生和1000个女生。在男生中有366人被录取,而女生只有188人被录取。看起来对女生好像存在着性别歧视,但是仔细观察这两个专业,你会发现女生们实际上受到了优待:据估计,女生的录取率是男生的两倍(心理学12%对6%,商学80%对40%)
女生总录取率较低的原因是,大部分女生(90%)选择了心理学,而大部分男生选择了商学,而商学的录取率要高得多(44%)。
辛普森悖论的最后一个例子:表5显示了1991年6月来自美国五个不同机场的两家航空公司关于航班准点起飞和航班延误的数据。
数据显示,阿拉斯加航空公司有3274架次航班准时起飞,501架次航班在起飞时延误。因此,阿拉斯加航空公司有13.3%的航班延误,而美国西部航空公司只有10.9%的航班延误。
看起来美国西部航空公司更可靠一些,但是如果我们在每个机场比较这两家公司,我们会发现阿拉斯加航空公司在每个机场的准点起飞数据都比美国西部航空公司好。举个例子,在洛杉矶国际机场,阿拉斯加航空公司的航班延误率是11.1%;而在同一个机场,美国西部航空公司的延误率是14.4%。在旧金山国际机场,阿拉斯加航空公司的航班延误率是16.9%,而美国西部航空公司是28.7%。
表5 来自美国五个机场的两家航空公司的飞行数据
所以,如果阿拉斯加航空公司在每个机场都比美国西部航空公司运作得好,为什么总体数据更差呢?
答案很简单:美国西部航空公司的航班大多从天气宜人的机场起飞,而阿拉斯加航空公司的航班大多从天气恶劣的机场起飞。
总结来说,当我们根据统计数据的总和做出决定时,比如手术的总成功率、标准化考试、法庭案例或大学录取率,我们很可能会错误地评估它们。检查这些数据的正确方法是分别考虑每一个相关的子项目。例如,在讨论医生和律师的专业知识时,应该区分比较难的案件和容易的案件;当讨论大学录取率时,应该单独考察各个学院的录取率,而不是一下子分析所有的数据。
总结
1.我们应该避免比较包含不同子群体的两个大群体。
2.学校、医院、航空公司或一般群体之间的比较应在子群体层面上进行,而不是将群体作为一个整体进行分析:首先,我们必须确认相关对象是受重伤还是轻微受伤,其次我们将医院的诊疗水平与适当的子群体进行比较,只有这样我们才能更好地决定把伤者送去哪家医院。这是因为整体进行比较并不能反映出每个子群体的相对部分,因此,得到的整体情况往往会扭曲现实。
3.有时基于整体信息,我们会认为某一特定群体受到歧视,但实际上,这一群体可能更受青睐。阿拉伯学生被以色列大学录取的概率可能低于犹太学生。这是否意味着歧视?这可能存在歧视,但也可能是大多数阿拉伯学生申请的是难以被录取的专业,比如医学、法律和会计,而大多数犹太学生申请的是容易被录取的专业,比如文学和社会学。录取率应在其所报考的专业维度上进行比较。尽管人们最初认为阿拉伯学生可能受到歧视,但后来可能会发现,阿拉伯学生在某些专业的录取率高于犹太学生。