§3 条件概率与贝努利概型
一、条件概率
在实际问题中,有时除了要考虑事件A发生的概率外,还需要考虑在某事件B发生的条件下,事件A发生的概率,将这种概率记为P(A|B)。
例如,某工厂生产100个产品,其中50个一等品,40个二等品,10个废品。规定一、二等品都为合格品。从产品中任取一件,设事件A、B分别表示取出的产品为一等品、合格品。则
若任取一件为合格品,求该件为一等品的概率;这实际上是求P(A|B),由题意知。
因为A⊂B,故AB=A,则。
从此例看出,一般情况P(A)≠P(A|B),而
这是在古典概型中用普通概率(即无条件概率)来表示条件概率P(A|B)的公式。在概率的公理化定义中,也自然将这个公式作为条件概率的定义。
定义3.1 设A,B为两个事件,若P(B)>0,则称
为在事件B发生的条件下事件A发生的条件概率。
条件概率P(·|B)之所以可称为概率,不难验证,它满足概率公理化定义中的三个条件,即
(1)当P(B)>0时,对任一事件A,有P(A|B)≥0;
(2)当P(B)>0时,P(Ω|B)=1;
(3)当P(B)>0时,若A1,A2,…是两两互斥的事件,则有
既然条件概率满足上述三个条件,那么概率具有的一些重要性质(§2中所列出的性质)都适用于条件概率。例如,对于任意事件A1和A2,当P(B)>0时,成立等式
P(A1∪A2|B)=P(A1|B)+P(A2|B)-P(A1A2|B)
【例1】 当掷五枚相同硬币时,已知至少出现两个正面的情况下,问正面数刚好是三个的条件概率?
解 设至少出现两个正面的事件为A,刚好三个正面的事件为B。此时AB=B,则
此时表示掷五枚相同硬币至多有一个正面的事件,即一个正面或无一个正面。则
【例2】 设A、B为两个事件,且0<P(A)<1,P(B)>0,P(B|A)=P(B|),证明P(AB)=P(A)P(B)。
证 由条件知:
则 P(AB)[1-P(A)]=P(A)[P(B)-P(AB)]
故 P(AB)=P(A)P(B)
前面介绍了计算随机事件和的概率的公式(见概率公理化定义性质5),对于随机事件积的概率,也有相应的公式:乘法法则。
乘法法则 设A,B为两事件
(1)若P(A)>0,则有P(AB)=P(B|A)P(A);
(2)若P(B)>0,则有P(AB)=P(A|B)P(B)。
此法则容易推广到多个事件的积事件的情况。例如,设A,B,C为事件,且P(AB)>0,则
P(ABC)=P(C|AB)P(B|A)P(A)
一般,设A1,A2,…,An为n个事件,n≥2,且
P(A1A2…An-1)>0
则 P(A1A2…An)
=P(An|A1A2…An-1)P(An-1|A1A2…An-2)…P(A2|A1)P(A1)
【例3】 市场上供应的灯泡中,甲厂产品占60%,乙厂占40%,甲厂产品的合格率是90%,乙厂的合格率是80%。若用A表示甲厂的产品,B表示产品为合格品,求
(1)已知买到的是甲厂的一个产品,合格率是多少?
(2)买到一个产品是甲厂生产的合格灯泡的概率?
解 (1)这是求条件概率,即P(B|A)=90%。
(2)这实际是要求出既是甲厂的产品,且又是合格品,即
【例4】 对含有5%废品的100件产品进行抽样检查,整批产品被拒绝接收的条件是在被抽查的5件产品(不放回抽样)中至少有一件是废品,试问该批产品被拒收的概率是多少?
解 设Ai表示事件“第i(i=1,2,3,4,5)次被抽查的产品为合格品”,令A=A1A2A3A4A5,则被拒收的概率为,而
P(A)=P(A1A2A3A4A5)
=P(A1)P(A2|A1)P(A3|A1A2)P(A4|A1A2A3)P(A5|A1A2A3A4)
P(A1)=95%,P(A2|A1)=94/99,P(A3|A1A2)=93/98
P(A4|A1A2A3)=92/97,P(A5|A1A2A3A4)=91/96
所以P(A)≈0.77,
二、全概率公式
全概率公式的基本思想是,将一个随机事件A分成若干个互不相容事件,使每一个事件的概率可以比较容易地用条件概率求得。为此,需要建立样本空间划分的概念。
定义3.2 设Ω是随机试验E的样本空间,B1,B2,…,Bn为E的一组事件,若
(1)BiBj=ф(i≠j;i,j=1,2,…,n);
(2)P(Bi)>0,i=1,2,…,n;
(3)B1∪B2∪…∪Bn=Ω。
则称B1,B2,…,Bn是样本空间Ω的一个划分。
若B1,B2,…,Bn是样本空间的一个划分,那么,对每次试验,事件B1,B2,…,Bn中必有一个且仅有一个发生。
定理3.1(全概率公式) 设随机试验E的样本空间为Ω,A为E的事件,B1,B2,…,Bn为Ω的一个划分,且P(Bi)>0(i=1,2,…,n),则
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+…+P(A|Bn)P(Bn)
证 因为B1∪B2∪…∪Bn=Ω,所以
A=AU=A(B1∪B2∪…∪Bn)=AB1∪AB2∪…∪ABn
又因为BiBj=ф,所以
(ABi)(ABj)=ф (i≠j;i,j=1,2,…,n)
则 P(A)=P(AB1)+P(AB2)+…+P(ABn)
=P(A|B1)P(B1)+P(A|B2)P(B2)+…+P(A|Bn)P(Bn)
或写成形式
使用全概率公式计算事件A的概率,必须对试验的样本空间作出划分。划分Bi(i=1,2,…,n)可以看成是导致事件A发生的所有不同的可能原因或情况。因此,全概率公式说明,事件A发生的概率是事件A在每一种原因或情况下发生的条件概率的加权平均,而权重恰好是P(Bi)(i=1,2,…,n)。
【例5】 某工厂有甲、乙、丙三个车间生产同一种产品,其产量分别占全厂产量的25%,35%,40%,其次品率分别为5%,4%,2%。从全厂产品中任取一件产品,求取得次品的概率。
解 以A表示事件“取一件产品为次品”,以B1,B2,B3分别表示事件“取得甲、乙、丙车间生产的产品”,很明显,B1,B2,B3是事件A发生的三种不同情况,故构成该种试验的样本空间Ω的一个划分。于是
全概率公式的一种典型应用是,若前后试验的结果密切相关,那么前面试验的全部可能结果就构成了后面试验的样本空间的一个划分。
【例6】 (无放回抽样,drawing without replacement)
设袋中有r个红球,s个白球,现有n(n≤r+s)个人,依次随机地从袋中抽取一个球,每次取出后不放回,令随机事件
An:第n次取到白球,n≤r+s
显然,由古典概型可得:。为了求P(A2),需要考虑第一次取球的结果,因此,A1和构成了第二次取球试验的样本空间的划分,由全概率公式有
为了求P(A3),需要考虑前两次试验的结果,因此,A1A2,,和就构成了第三次取球试验的样本空间的划分,由乘法法则,得
所以
值得注意的是,依此类推,对于任意的n(n≤r+s),均有,这一结果的内涵表明了抽签的公平性。显然,如果作有放回的抽样,无论抽样的先后次序,任何时候抽得白球的概率都为。然而本例的结果说明,作无放回抽样时,抽得白球的概率始终为,与抽样的先后次序无关。
三、贝叶斯公式
贝叶斯(Bayes)公式也称为逆概率(inverse probability)公式,它用于根据随机试验已经出现的某种结果,反过来推算造成这种结果的各种原因的可能性大小。
定理3.2 设B1,B2,…,Bn为随机试验E的样本空间Ω的一个划分,A为E的事件,且P(A)>0,P(Bi)>0(i=1,2,…,n),则
证 由条件概率定义及全概率公式推得
【例7】 设某工厂甲、乙、丙三个车间生产同一种仪表,产量依次占全厂的40%,50%,10%。如果各车间的一级品率依次为90%,80%,98%。现在从待出厂产品中抽查出一个结果为一级品,试判断它是丙车间生产的概率。
解 设A表示事件“抽查一个产品为一级品”,B1,B2,B3分别表示事件“产品为甲、乙、丙车间生产的”。很明显,B1,B2,B3构成一个划分。利用贝叶斯公式
P(Bj)和P(Bj|A)(j=1,2,…,n)的含意是不同的,前者是在做试验之前,对样本空间划分的每一个事件的概率的估算,故将P(Bj)称为先验概率;而后者是在试验之后,已经有了明确的结果,即事件A发生了,再来推算引起事件A发生的每一种原因,即样本空间划分的每一个事件的概率,故将P(Bj|A)称为后验概率。实际上,后验概率是对先验概率的一种修正,在应用中,人们往往更加注重后验概率。
四、随机事件的独立性
随机事件的独立性是概率论中最重要的概念之一。
在P(B)>0时,条件概率P(A|B)和概率P(A)一般情况下是不等的,这说明事件B的发生对事件A发生的概率是有影响的。若P(A|B)>P(A),则表明事件B的发生使事件A发生的可能性增大;反之,若P(A|B)<P(A),则表明事件B的发生使事件A发生的可能性减小了。
如果P(A|B)=P(A),那么事件B的发生并不影响事件A发生的概率,此时乘法公式变为
P(AB)=P(A|B)P(B)=P(A)P(B)
而且
这说明,事件B发生与否对事件A发生的概率都没有影响。
定义3.3 如果事件A与B满足关系式
P(AB)=P(A)P(B)
则称A与B相互独立(independence),简称A与B独立。
这里并没有对P(A),P(B)作任何限制。虽然,当P(A)或P(B)等于0时,条件概率没有定义,而独立性仍有意义。容易验证,任何事件A与不可能事件ф或必然事件U都是独立的。
显然,若事件A与B相互独立,且P(A)P(B)>0,则有
P(A|B)=P(A),P(B|A)=P(B)
定理3.3 若四对事件A,B;;;中有一对是相互独立的事件,则另外三对也是相互独立的事件。
证 不妨设A与B相互独立,只证与相互独立:
类似地,可以证明其余结论。
当条件概率有意义时,显然有下面的结论。
定理3.4 设A,B为两个事件,且P(B)>0,若A与B相互独立,则P(A|B)=P(A),反之亦然。
两个事件的相互独立与两个事件的互不相容,是从两个不同的角度来刻划两个事件之间的关系,因此是完全不同的两个概念,但是,两者之间有一定的联系。当P(A)>0,P(B)>0时,若事件A与事件B相互独立,那么事件A与B不可能互不相容。其等价论述为:如果两个具有正概率的事件A与B互不相容,则A与B一定不是独立的。因为如果事件A与B互不相容而且相互独立,那么就有0=P(AB)=P(A)P(B),从而P(A),P(B)之一必为0。
下面将独立性的概念推广到三个事件的情况。
定义3.4 设A,B,C是三事件,如果成立等式
则称三事件A,B,C两两独立。
一般,当事件A,B,C两两独立时,不一定成立等式
P(ABC)=P(A)P(B)P(C)
【例8】 设袋中有4个球,一个涂白色,一个涂红色,一个涂蓝色,另一个涂白、红、蓝三种颜色。今从袋中任取一球,设事件A,B,C分别表示“取出的是涂有白色的球”、“取出的是涂有红色的球”、“取出的是涂有蓝色的球”。试证A,B,C两两独立,但P(ABC)≠P(A)P(B)P(C)。
证
所以 P(AB)=P(A)P(B),P(BC)=P(B)P(C)
P(AC)=P(A)P(C)
而
定义3.5 设A,B,C是三事件,如果同时成立等式
则称A,B,C为相互独立的事件。
一般,设A1,A2,…,An是n个事件,如果对于任意k(1<k≤n),任意1≤i1<i2<…<ik≤n,成立等式
则称A1,A2,…,An为相互独立的事件。
n个事件的相互独立是一种总体上成立的关系,因此要求任取其中的任意大小部分都是独立的。而n个事件两两独立是一种局部关系,它仅要求任意的两个事件独立即可。显然,n个事件相互独立可以保证它们是两两独立的,而n个两两独立的事件,并不能保证它们是相互独立的。
在实际问题中,往往不是根据定义来判断事件的独立性,而是根据实际意义给予判断。
【例9】 设有电路如图1-4,其中1,2,3,4为继电器接点。设各继电器独立工作,其接点闭合的概率均为p,求L至R为通路的概率。
图1-4
解 设事件Ai(i=1,2,3,4)为“第i个继电器接点闭合”。于是“L至R为通路”的事件A的概率为
P(A)=P(A1A2∪A3A4)=P(A1A2)+P(A3A4)-P(A1A2A3A4)
从实际问题可知,A1,A2,A3,A4是相互独立的,于是
【例10】 一工人照看三台相互独立工作的机床,在一小时内甲、乙、丙三台机床需工人照看的概率分别是0.9,0.8和0.7,求在一小时中
(1)没有机床需要照看的概率?
(2)至少有一台机床不要照看的概率?
(3)至多只有一台机床需要照看的概率?
解 设Ai分别表示事件“甲、乙、丙机床需要照看”(i=1,2,3)。
(1)甲、乙、丙三台机床是否要工人照看是相互独立的。所以,事件A1,A2,A3是相互独立的,则
(2)设B为事件“至少有一台机床不需要照看”,那么为事件“每一台都需要照看”。则
(3)设C为“至多只有一台机床需要照看”事件,则
将定理3.3的结果推广到n个相互独立事件的情况,可以得到下列结果:若随机事件A1,A2,…,An相互独立,则其逆事件,,…,也相互独立。由此可以得到相互独立事件和的概率的计算公式:
五、贝努利概型
定义3.6 假定随机试验只有两个不同的结果,记作A与,它们出现的概率分别是P(A)=p,,0<p<1,则这样的随机试验称为参数为p的贝努利(Bernoulli)试验。独立重复地做n次参数为p的贝努利试验,这样的随机试验序列称为n次贝努利随机试验序列,简称贝努利试验序列(或二项随机试验序列)。
贝努利随机试验序列是在讨论频率与概率的关系时提出来的,人们关注的是,在n次贝努利随机试验序列中事件A所发生的累计次数,这就是贝努利概型。贝努利概型是一种重要而常见的概型,在实际问题中有着广泛的应用。
定理3.5(二项概率公式) 设事件A在一次试验中发生的概率为p,则在n次贝努利试验序列中事件A恰好发生k次的概率为
证 首先,事件A在指定的某k次试验中发生,而在其余的(n-k)次试验中不发生的概率等于pk(1-p)n-k。另外,在n次试验中,事件A被指定某k次发生的方法为种。显然,所指定的某k次事件A发生与另一种某k次事件A发生是互斥的,由概率的可加性推得
由于恰好是二项式(p+q)n=[p+(1-p)]n展开式中出现pk的一项(k=0,1,2,…,n),所以上述公式称为二项概率公式。
【例11】 一批产品的废品率为0.2,每次抽取1个,观察后放回去,下次再任取1个,共重复3次,求3次中恰有两次取到废品的概率。
解 这可看成3重贝努利试验,废品发生记为事件A,即P(A)=0.2。则
【例12】 一大批电器元件的一级品率为0.8,现任取8件检验,求至少有两件一级品的概率。
解 由于这批元件的总数很大,且抽取的元件的数量相对于元件的总数较少,这种不放回抽样可作为放回抽样处理,造成的误差不大。所以,此题可看成8重贝努利试验。
设“至少有两件一级品”为事件A,那么表示事件“无一件一级品”或“恰有一件一级品”,则