第二章 随机变量及其分布
一、知识要点
(一)随机变量
1.随机变量的定义
设Ω={ω}为随机试验E的样本空间,X=X(ω)是定义在样本空间Ω上的实值单值函数,称X=X(ω)为随机变量.
2.随机变量的分类
随机变量按其取值情况分为两大类:离散型和非离散型.离散型随机变量的所有可能取值为有限个或无限可列个;非离散型随机变量的情况比较复杂,它的所有可能取值不能够一一列举出来.其中的一种对于实际应用最重要,称为连续型随机变量,其值域为一个或若干个有限或无限区间.
(二)离散型随机变量
1.离散型随机变量的概率分布
如果随机变量X的可能取值是有限多个或是无限可列个,且以确定的概率取这些不同的值,则称X为离散型随机变量.
设X为离散型随机变量,它的所有可能取值为xk(k=1,2, …, n, …), X取各可能值的概率为
P{X=xk}=pk, k=1,2, …,
我们称上式为X的概率分布或分布律.显然,pk满足条件
(1)pk≥0, k=1,2, …;
概率分布也可用表格的形式来表示,称为概率分布表.
对于集合{xk, k=1,2, …, n, …}中的任何一个子集A,事件“X在A中取值”(即“X∈A”)的概率为
2.几种重要的离散型随机变量
(1)0-1分布
设随机变量X可能取0和1两个值,并且
P{X=k}=p kq1-k,k=0,10<p<1 q=1-p,
即X的概率分布如下表所示:
则称X服从参数为p的0-1分布,或称X具有参数为p的0-1分布.
(2)超几何分布
若随机变量X的概率分布为
这里M≤N, n≤N,则称X服从(或具有)参数为N, M, n的超几何分布.
(3)二项分布
若随机变量X的概率分布为
则称X服从(或具有)参数为n, p的二项分布,记作X~B(n, p).
服从二项分布的随机变量X可以取值0,1,2, …, n,当
(其中[(n+1)p]为取整,即不超过(n+1)p的最大整数,由于(n+1)p>0,它就是(n+1)p的整数部分)时,概率
达到最大,此时的k0称为二项分布的最可能值.
(4)泊松分布
若随机变量X的概率分布为
则称X服从(或具有)参数为λ的泊松分布,记作X~P(λ).
3.几种分布的关系
(1)二项分布B(n, p)与0-1分布的关系
0-1分布可看成是二项分布B(1, p),即0-1分布是二项分布当n=1时的特例.
(2)超几何分布与二项分布B(n, p)的关系
当n相对于N来说很小(N相对于n很大)时,二项分布 为超几何分布的近似(极限)分布.即若当N→∞时, ,则有
(3)泊松分布与二项分布的关系
泊松定理 在n重伯努利试验中,成功次数X服从二项分布,假设每次试验成功的概率为pn(0<pn<1),并且,则
(三)随机变量的分布函数
1.分布函数的定义
设X是一个随机变量,x是任意实数,则称函数
F(x)=P{X≤x}
为随机变量X的分布函数.
设X为离散型随机变量,P{X=xn}=pn, n=1,2, …,则有X的分布函数
2.分布函数的性质
(1)F(x)单调不减,即若x1<x2,则F(x1)≤F(x2);
(2)0≤F(x)≤1, x∈(-∞, +∞);
(4)F(x)最多有可列个间断点,并且在其间断点处是右连续的.即对任何实数x0, F(x0+0)=F(x0).
(四)连续型随机变量
1.连续型随机变量的概率密度
如果对于随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数x,均有
则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数(简称概率密度或分布密度).若X具有概率密度f(x),则可简记作X~f(x).
概率密度函数具有如下性质:
(1)f(x)≥0;
(3)对于任意实数x1<x2,有
(4)若f(x)在x处连续,则f(x)=F'(x).
2.几种重要的连续型随机变量
(1)均匀分布
如果随机变量X的概率密度为
则称X服从区间[a, b]上的均匀分布,记作X~U[a, b].X的分布函数为
(2)指数分布
如果随机变量X的概率密度为
其中λ>0为常数,则称X服从参数为λ的指数分布.X的分布函数为
(3)正态分布
如果随机变量X的概率密度为
其中μ, σ是常数,且σ>0,则称X服从参数为μ, σ的正态分布,记为X~N(μ, σ2).
函数f(x)的图形以直线x=μ为其对称轴,在x=μ处,f(x)取到最大值f(μ)=,在x=μ±σ处有拐点,且y=0是f(x)的水平渐近线.
当μ=0, σ=1时,正态分布N(0,1)称为标准正态分布,相应的概率密度和分布函数通常分别记为φ(x)与Φ(x),则
对于标准正态分布,在x=0处,φ(x)有最大值;φ(x)的图形关于x=0对称,若x0>0,则P{X>x0}=P{X<-x0},用分布函数Φ(x)表示就是
Φ(-x0)=1-Φ(x0).
设随机变量X~N(μ, σ2),则有其分布函数
可以得到
(五)随机变量函数的分布
1.离散型随机变量函数的分布
对于离散型随机变量X,设其概率分布为
P{X=xi}=pi, i=1,2, ….
当X=xi时,Y=g(X)=g(xi),且也以概率pi取g(xi)值.因此,由P{X=xi}=pi求出Y=g(X)的概率分布,有以下两种情况:
(1)若当xi≠xj时,g(xi)≠g(xj),则Y的概率分布为
P{Y=g(xi)}=pi, i=1,2, …;
(2)若当xi≠xj时,有g(xi)=g(xj),则必须将X取xi和xj的概率作相应的合并,即
2.连续型随机变量函数的分布
(1)分布函数法
根据已知的X的分布计算出Y的分布函数FY(y),然后利用概率密度与分布函数之间的关系再求Y的概率密度fY(y),此法称为分布函数法,它是求连续型随机变量函数分布的基本方法.
若y=g(x)是严格单调可导函数,必存在反函数x=g-1(y),这样FY(y)就可利用X的分布函数表示出来.求出FY(y)后,对y求导便可完成.
(2)公式法
设X~fX(x)(-∞<x<+∞),若y=g(x)严格单调,其反函数x=h(y)有连续导函数,则Y=g(X)是连续型随机变量,其概率密度为
其中
α=min{g(-∞), g(+∞)},β=m ax{g(-∞), g(+∞)}.