第1课
概率是可以测度的
吉罗拉莫·卡尔达诺(Gerolamo Cardano)
要搞清楚一门学科的本质,认真研究该学科的开创者的想法是一条可行的路径。事实上,某些基础性哲学问题从一开始就是显而易见的。关于概率,我们的第1堂课要介绍的第一个伟大思想是:概率是可以测度的。这个观点的形成时间是16—17世纪,过程为何如此漫长,这个问题至今仍然是一个谜。希腊神话中有命运女神堤喀(Tyche);德谟克利特(Democritus)及其追随者假设,构建宇宙的所有原子都会受到某种物质偶然性的影响;卢克莱修(Lucretius)在《物性论》(De Rerum Natura)中指出,这种偶然性就是原子的偏离;古埃及人和古巴比伦人学会了用指关节骨或骰子玩概率游戏,到了罗马时期,这种游戏流行开来,士兵们通过抽签决定基督斗篷的归属。后来,古希腊学园派怀疑论者将概率视为人生的指南。不过,这些时期似乎都没有出现有关概率的定量理论。
想一想,我们是怎么测量东西的?以长度为例,我们会先找到一个长度标准,然后计数某个东西包含多少个这样的标准长度。比如,在我们用脚步测量距离时,这个长度标准就是我们的脚。但是,不同的脚有可能得出不同的测量结果,因此,1522年,有人提议改进法定路德(杆)的确定方法。如图1–1所示,当人们从教堂鱼贯而出时,将排成一列的16个人的脚的总长度设定为法定路德。从图1–1可以看出,这些人的脚长度不一,但通过一群人来设定这个长度单位具有明显的平均效应,因此很多人接受了这个方法。不过,当时似乎还没有人明确提出平均数这个概念。
图1-1 法定路德的确定
我们有必要指出,这个方法存在哲学上的异议。我们的目的是定义长度,但在用脚长测量距离时,我们已经假定我们采用的长度标准等长。因此,这是一个循环论证的过程。
任何有头脑的人都不会因为这个异议而放弃用脚长测量距离的方法。我们的测量活动就始于此,最终建立并完善了长度的概念。脚的长度因人而异,路德会长短不一,标准米尺的长度在足够高的精度条件下也会各不相同。借助物理学知识,我们可以不断改进长度测量方法。因此,这确实是一个循环论证的过程,但它并不是一个致命的缺陷,反而为我们指明了一条趋于完善的道路。
概率的测度同样如此。在测度之前,我们先要找到(或者制造)同等可能性的情况,然后计数这些情况发生的次数。于是,事件A的概率,记作P(A),为
P(A)=
注意,从上式可知:
1. 概率永远不会是负值;
2. 如果所有可能发生的情况中均包含事件A,则P(A)=1;
3. 如果事件A和事件B不会同时发生,则P(A或B)=P(A)+P(B)。
此外,某个事件不会发生的概率等于1与该事件发生概率的差:
P(非A)=1–P(A)。
这个概念虽然十分简单,但如果运用得巧妙得当,就会产生令人惊讶的效果。我们以生日问题为例。如果不考虑闰年,并且假设出生日期的概率均相等,每个人的生日相互独立(即没有双胞胎),那么房间内的所有人中至少有两个人的生日在同一天的概率是多少?如果你以前没有见过这个问题,它的答案肯定会让你大吃一惊。
一群人中有人生日在同一天的概率等于1减去所有人生日均不相同的概率。第二个人与第一个人的生日不同的概率为(364/365)。如果前两个人的生日不同,那么第三个人的生日与他们俩都不相同的概率为(363/365),以此类推。因此,N个人中有人生日相同的概率为
1–。
如果你对同额赌注感兴趣,就可以利用上述公式,找到使输赢概率趋近1/2的N的值。当房间里一共有23个人时,生日相同的概率会略高于1/2。如果房间里有50个人,这个概率就会接近97%。
人们经常利用生日问题来考虑一些令人吃惊的巧合情况,因此生日问题出现了很多变种。比如,两个美国人的生日相同,而且他们的父亲、祖父和曾祖父生日相同的可能性大到令人吃惊的程度。为帮助大家应对这些问题,本堂课内容的附录部分给出了一些有用的近似值。最后,本书在结尾部分又利用这些近似值,证明了菲尼蒂定理。现在,大家只要知道“等可能情况”这个基本结构应用广泛和深入就可以了。