10堂极简概率课
上QQ阅读APP看书,第一时间看更新

第1课
概率是可以测度的

吉罗拉莫·卡尔达诺(Gerolamo Cardano)

要搞清楚一门学科的本质,认真研究该学科的开创者的想法是一条可行的路径。事实上,某些基础性哲学问题从一开始就是显而易见的。关于概率,我们的第1堂课要介绍的第一个伟大思想是:概率是可以测度的。这个观点的形成时间是16—17世纪,过程为何如此漫长,这个问题至今仍然是一个谜。希腊神话中有命运女神堤喀(Tyche);德谟克利特(Democritus)及其追随者假设,构建宇宙的所有原子都会受到某种物质偶然性的影响;卢克莱修(Lucretius)在《物性论》(De Rerum Natura)中指出,这种偶然性就是原子的偏离;古埃及人和古巴比伦人学会了用指关节骨或骰子玩概率游戏,到了罗马时期,这种游戏流行开来,士兵们通过抽签决定基督斗篷的归属。后来,古希腊学园派怀疑论者将概率视为人生的指南。echoed by Cicero in De Natura.不过,这些时期似乎都没有出现有关概率的定量理论。A superb history of early probability is in James Franklin’s The Science of Conjecture: Ev-idence and Probability before Pascal (Baltimore: Johns Hopkins University Press, 2002). Franklin examines every scrap of evidence we have, from the Talmud, early Roman law, and insurance over many ethnicities. He makes it clear that people had all sorts of thoughts about chance, but not a single quantitative aspect surfaces.

想一想,我们是怎么测量东西的?The same issues come up in measuring any basic quantity, for example, the weight of the standard kilogram or the frequency of light. Careful discussion is the domain of measurement theory. For an extensive discussion, see D. H. Krantz, R. D. Luce, P. Suppes, and A. Tversky, Foundations of Measurement, Vol. I (1971), Vol II (1989), Vol III (1990), (New York: Academic Press). For an illuminating discussion of how the Bureau of Standards actu-ally measures the standard kilogram, see D. Freedman, R. Pisani, and R. Purves, Statistics, 4th ed. (New York: W. W. Norton, 2007).以长度为例,我们会先找到一个长度标准,然后计数某个东西包含多少个这样的标准长度。比如,在我们用脚步测量距离时,这个长度标准就是我们的脚。但是,不同的脚有可能得出不同的测量结果,因此,1522年,有人提议改进法定路德(杆)的确定方法。如图1–1所示,当人们从教堂鱼贯而出时,将排成一列的16个人的脚的总长度设定为法定路德。For discussion, see S. Stigler, Seven Pillars of Statistical Wisdom (Cambridge, MA: Har-vard University Press, 2016).从图1–1可以看出,这些人的脚长度不一,但通过一群人来设定这个长度单位具有明显的平均效应,因此很多人接受了这个方法。不过,当时似乎还没有人明确提出平均数这个概念。

图1-1 法定路德的确定

我们有必要指出,这个方法存在哲学上的异议。我们的目的是定义长度,但在用脚长测量距离时,我们已经假定我们采用的长度标准等长。This kind of virtuous circularity appears throughout science. For an illustration in a much richer setting, see George e. Smith, “Closing the Loop: Testing Newtonian Gravity, Then and Now,” in Newton and Empiricism, ed. Zvi Beiner and eric Schliesser (Oxford: Ox-ford University Press, 2014): 262–351.因此,这是一个循环论证的过程。

任何有头脑的人都不会因为这个异议而放弃用脚长测量距离的方法。我们的测量活动就始于此,最终建立并完善了长度的概念。脚的长度因人而异,路德会长短不一,标准米尺的长度在足够高的精度条件下也会各不相同。借助物理学知识,我们可以不断改进长度测量方法。因此,这确实是一个循环论证的过程,但它并不是一个致命的缺陷,反而为我们指明了一条趋于完善的道路。促使等概率这个概念逐步完善的道路是什么?继续阅读这本书,你就会找到答案。

概率的测度同样如此。在测度之前,我们先要找到(或者制造)同等可能性的情况,然后计数这些情况发生的次数。于是,事件A的概率,记作P(A),为

P(A)=

注意,从上式可知:

1. 概率永远不会是负值;

2. 如果所有可能发生的情况中均包含事件A,则P(A)=1;

3. 如果事件A和事件B不会同时发生,则P(AB)=P(A)+P(B)。

此外,某个事件不会发生的概率等于1与该事件发生概率的差:

P(非A)=1–P(A)。

这个概念虽然十分简单,但如果运用得巧妙得当,就会产生令人惊讶的效果。我们以生日问题为例。如果不考虑闰年,并且假设出生日期的概率均相等,每个人的生日相互独立(即没有双胞胎),那么房间内的所有人中至少有两个人的生日在同一天的概率是多少?如果你以前没有见过这个问题,它的答案肯定会让你大吃一惊。

一群人中有人生日在同一天的概率等于1减去所有人生日均不相同的概率。第二个人与第一个人的生日不同的概率为(364/365)。如果前两个人的生日不同,那么第三个人的生日与他们俩都不相同的概率为(363/365),以此类推。因此,N个人中有人生日相同的概率为

1–

如果你对同额赌注感兴趣,就可以利用上述公式,找到使输赢概率趋近1/2的N的值。当房间里一共有23个人时,生日相同的概率会略高于1/2。如果房间里有50个人,这个概率就会接近97%。

人们经常利用生日问题来考虑一些令人吃惊的巧合情况,因此生日问题出现了很多变种。比如,两个美国人的生日相同,而且他们的父亲、祖父和曾祖父生日相同的可能性大到令人吃惊的程度。为帮助大家应对这些问题,本堂课内容的附录部分给出了一些有用的近似值。最后,本书在结尾部分又利用这些近似值,证明了菲尼蒂定理。现在,大家只要知道“等可能情况”这个基本结构应用广泛和深入就可以了。