2015年中山大学432统计学[专业硕士]考研真题及详解
一、(每小题3分,共60分)单项选择题
1.在6对夫妻中任选4人,则至少有一对夫妻被选中的概率为( )。
A.
B.
C.
D.
【解析】从6对夫妻里任选出4人”,总共有种选法;对于事件“没有一对夫妇被选中”,根据乘法原理,先从6对夫妻中选出4对,有种选法,再从选中的4对中的每一对选出1人,有24种选法,因此事件“没有一对夫妇被选中”的概率为。则根据互斥关系,事件“至少有一对夫妻被选中”的概率为。(本题选项设置有误,无正确答案)
2.设A,B,C都是事件。又A和B独立,B和C独立,A和C互不相容。P(A)=1/2,P(B)=1/4,P(C)=1/8,则概率P(A∪B∪C)为( )。
A.23/33
B.23/32
C.11/16
D.2/3
【答案】B
【解析】由题意,P(AB)=P(A)P(B),P(BC)=P(B)P(C),P(AC)=0,所以,P(A∪B∪C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)=P(A)+P(B)+P(C)-P(A)P(B)-P(B)P(C)=23/32,所以选择B项。
3.将一枚硬币独立地掷两次,引进事件:A1={掷第一次出现正面},A2={掷第二次出现正面},A3={正、反面各出现一次},A4={正面出现两次},则( )。
A.A1,A2,A3两两独立
B.A1,A2,A3相互独立
C.A2,A3,A4两两独立
D.A2,A3,A4相互独立
【答案】A
【解析】由题意,P(A1)=1/2,P(A2)=1/2,P(A3)=1/2,P(A4)=1/4,所以
P(A1A2)=1/4=P(A1)P(A2)=1/2×1/2
P(A2A3)=1/4=P(A2)P(A3)=1/2×1/2
P(A1A3)=1/4=P(A1)P(A3)=1/2×1/2
所以,A1,A2,A3两两独立。而P(A1A2A3)=0≠P(A1)P(A2)P(A3)=1/8,P(A2A3A4)=0≠P(A2)P(A3)P(A4)=1/16都不满足事件相互独立的条件,故选择A项。
4.随机变量X有密度
则常数c的取值为( )。
A.2
B.π
C.π/2
D.1/π
【答案】D
【解析】密度函数需满足:
由题意得,
解得,c=1/π。
5.设z在[0,1]上服从均匀分布,随机变量X,Y,满足方程组
则X和Y各自落在[0,1]中的概率为( )。
A.1/3和1/2
B.1/2和1/2
C.1/3和0
D.1/3和2/3
【答案】C
【解析】由题意,解出X,Y的表示式为:
由于Z在[0,1]上服从均匀分布,所以X服从[0,3]上的均匀分布,Y服从[1,2]上的均匀分布,所以X,Y各自落在[0,1]中的概率分别为1/3,0。
6.设X和Y都服从标准正态分布,则( )。
A.X+Y服从正态分布
B.X2+Y2服从卡方分布
C.X2和Y2都服从卡方分布
D.X2/Y2服从F分布
【答案】C
【解析】A项,正态分布具有可加性的前提是随机变量X,Y相互独立,题目中未说明X,Y相互独立,所以X+Y不一定服从正态分布;B项,卡方分布要求X,Y相互独立且同分布于标准正态分布,题目中未说明X,Y相互独立;D项,F分布要求X2,Y2是相互独立的卡方分布,题目中未说明X,Y相互独立。
7.当随机向量(X,Y)服从单位圆面D={(x,y):x2+y2≤1}上的均匀分布,则:Y的边际分布F(y)与y关于x的条件分布G(y|x),则( )。
A.F(y)不服从均匀分布,G(y|x)服从均匀分布
B.F(y)服从均匀分布,G(y|x)不服从均匀分布
C.二者均服从均匀分布
D.二者均不服从均匀分布
【答案】A
【解析】区域D是圆面,面积为π,所以此随机向量的密度函数为f(x,y)=1/π,x,y∈D。所以Y的边际密度为:
Y关于X的条件密度为:
因此Y的边际分布不是均匀分布,而Y关于X的条件分布是的均匀分布,故选A。
8.设随机变量X~t(n),n>1,Y=1/X2,则( )。
A.Y~χ2(n)
B.Y~χ2(n-1)
C.Y~F(1,n)
D.Y~F(n,1)
【答案】D
【解析】由于随机变量X服从自由度为n的t分布,设
其中,随机变量X1服从N(0,1),X2服从χ2(n),则,
Y服从F(n,1)。
9.设X1,X2,…,Xn(n>1)为来自总体期望为μ,总体方差为σ2的样本,`X为样本均值,则( )。
A.
B.
C.
D.
【答案】C
【解析】由题意,E(`X)=μ,D(`X)=σ2/n。由于样本X1,X2,…,Xn独立同分布,所以有:
10.设X~N(μ1,σ12),Y~N(μ2,σ22),若P{|X-μ1|<c}<P{|Y-μ2|<c},其中c为某一正数,则( )。
A.σ12<σ22
B.σ12>σ22
C.μ1<μ2
D.μ1>μ2
【答案】B
【解析】由题意,得
所以得到Φ(c/σ1)<Φ(c/σ2),即c/σ1<c/σ2,所以σ1>σ2>0,即σ12>σ22。
11.设EX=0,Var(X)=1,EY=1,Var(Y)=4,且相关系数ρXY=1,则( )。
A.P(2X-Y+1=0)=1
B.P(2X-Y-1=0)=1
C.P(2X+Y+1=0)=1
D.P(2X+Y-1=0)=1
【答案】A
【解析】由ρXY=1得知,X和Y有严格的线性函数关系,且为正相关关系。设Y=aX+b,a>0,则:
整理得,所以P(2X-Y+1=0)=1。
12.在假设检验中,第一类错误是指( )。
A.当原假设为真时,接受原假设
B.当原假设为真时,拒绝原假设
C.当备选假设为真时,接受原假设
D.当备选假设为真时,拒绝原假设
【答案】B
【解析】假设检验中所犯的错误有两种类型,第一类错误是原假设为真而拒绝原假设,犯这种错误的概率用α表示,所以也称α错误或弃真错误;第二类错误是原假设为伪而不拒绝原假设,犯这种错误的概率用β表示,所以也称β错误或取伪错误。
13.设X1,X2,…,Xn为来自二项分布B(m,p)的样本,X(_)和分别为样本均值和样本方差,若X(_)+cS2为mp2的无偏估计量,则( )。
A.c=-2
B.c=-1
C.c=1
D.c=2
【答案】B
【解析】由无偏估计的概念可得,E(X(_)+cS2)=mp2,而X(_),S2分别是总体均值和方差的无偏估计,所以,E(X(_)+cS2)=E(X(_))+cE(S2)=mp=cmp(1-p)=mp2,所以,c=-1。
14.设X1,X2,…,Xn为来自正态分布N(μ,σ2)的样本,其中μ为己知,X(_)为样本均值,则σ2的最大似然估计为( )。
A.
B.
C.
D.
【答案】C
【解析】似然函数为:
对数似然函数为:
对对数似然函数求导并令其为0得:
解得σ2的极大似然估计为:
15.设总体X的概率密度函数为
X1,X2,…,Xn为来自总体X的样本,则θ的矩估计量为( )。
A.X(_)
B.X(_)-1
C.X(_)+1
D.1/X(_)
【答案】B
【解析】由题意得:
令
得到θ的矩估计量为:θ(∧)=X(_)-1。
16.设X1,X2,…,Xn为来自正态分布N(μ,σ2)的样本,其中σ2为己知,X(_)为样本均值。考虑如下假设检验:H0:μ≤μ0 v.s. H1:μ>μ0,标准正态分布的95%分位数为1.645,在显著性水平为0.05下,拒绝H0等价于( )。
A.单侧区间不包含μ0
B.单侧区间包含μ0
C.单侧区间不包含μ0
D.单侧区间包含μ0
【答案】D
【解析】由题意,这是一个正态总体均值的右单侧检验,采用Z统计量,拒绝域的形式为:Z>Z0.95,即
所以当
拒绝H0,选择D项。
17.设X1,X2,…,Xn独立同分布,具有期望μ,则( )。
A.exp(X(_))是eμ的相合估计量
B.exp(X(_))是eμ的最大似然估计量
C.exp(X(_))是eμ的无偏估计量
D.exp(X(_))是eμ的充分统计量
【答案】A
【解析】相合估计量是指当样本数n趋于无穷大时,估计量的值趋于待估计的参数。由大数定律,
所以exp(X(_))是eμ的相合估计量。
18.设X1,X2都服从参数为1的指数分布,Y服从参数为2的指数分布,f(y)=2e-2y,0<y<∞,且X1,X2,Y相互独立,则( )。
A.
B.
C.
D.
【答案】A
【解析】独立同分布的指数分布的和服从伽玛分布,因此X1+X2~Ga(2,1),Y~Ga(1,2),根据伽马分布的性质有
于是
再根据伽玛分布和卡方分布的关系可知,2(X1+X2)~χ2(4),4Y~χ2(2)。由于X1,X2,Y相互独立,因此有
19.设θ(∧)为参数θ的估计量,且θ(∧)的期望与方差σ2均存在,则必有( )。
A.
B.
C.
D.
【答案】D
【解析】由于Var(θ(∧))=E(θ(∧)-θ)2,根据切比雪夫不等式可知D项正确。
20.设θ(∧)n为参数θ的估计量,且θ(∧)n的期望与方差均存在,当样本量n→∞时,E(θ(∧)n)→θ,var(θ(∧)n)→0,则以下说法错误的是( )。
A.θ(∧)n是θ的相合估计量
B.θ(∧)n依分布收敛到θ
C.
D.
【答案】C
【解析】根据相合估计的判定方法可知A正确;根据相合估计的定义可知D正确;由于θ(∧)n是θ的相合估计,因此θ(∧)n依概率收敛于θ,而依概率收敛强于依分布收敛,因此B正确;而C项是殆必收敛,强于依概率收敛,不能由依概率收敛推出,因此C项错误。
二、(共30分)设一个系统由甲乙两种类型的元件串联而成,两个元件的使用寿命记为X与Y,分别服从参数为λ与μ的指数分布,且相互独立。通常X与Y,不能完全观测到,仅仅可以观测到系统的使用寿命Z与导致系统失效的元件类型W。
Z=min(X,Y)
(1)(6分)求Z的分布。
(2)(8分)证明:Z与W相互独立。
(3)(8分)若(Z1,W1),(Z2,W2),…,(Zn,Wn)为(Z,W)的随机样本,求参数λ与μ的最大似然估计λ(∧),μ(∧)。
(4)(8分)计算E(λ(∧)),并以此说明λ(∧)是否为参数λ的无偏估计。
注:参数为λ的指数分布的密度函数:f(x|λ)=λe-λx,0<x<∞
参数为α,β的Gamma分布Ga(α,β)的密度函数:
解:(1)设Z的分布函数为F(z),则,F(z)=P(Z≤z)=1-P(Z>z)=1-P(X>z,Y>z),由于X,Y相互独立,所以P(X>z,Y>z)=P(X>z)P(Y>z),所以
即Z服从参数为λ+μ的指数分布。
(2)随机变量X与Y相互独立,故(X,Y)的联合分布密度为:
f(x,y)=fX(x)fY(y)=λμe-λx-μy,x>0,y>0
同理P(W=0)=μ/(λ+μ),
因此,Z与W相互独立。
(3)W服从参数为的0-1分布,即,W的分布函数为
由于Z与W相互独立,所以Z与W的联合密度函数为:
求λ,μ的极大似然估计如下:
①建立似然函数:
②求出对数似然函数:
③对数似然函数分别关于λ,μ求偏导:
④令偏导等于0,得到极大似然估计量:
(4)
随机变量Zi,i=1,2,…,n服从参数为λ+μ的指数分布,即参数为的伽马分布。由伽马分布的可加性,
令,则其密度函数为
的期望:
因此,λ(∧)是λ的无偏估计。
三、(共20分)令X1,X2,…,Xn,Xn+1为总体伯努利分布B(1,p)的样本,统计量为
前n个样本之和大于第n+1个样本的概率为
从而h(p)为p的函数。
(1)(6分)证明:是参数p的充分统计量。
(2)(6分)证明
是h(p)的无偏估计量。
(3)(8分)寻找h(p)的最小方差无偏估计(需要写出具体形式)。
解:(1)依题意有,随机变量Xi(i=1,2,…,n+1)的分布为
样本(X1,X2,…,Xn+1)的联合分布为
其中xi=0,1。将统计量代入得
P(X1=x1,X2=x2,…,Xn+1=xn+1)=pT(1-p)n+1-T
根据因子分解定理,是参数p的充分统计量。
(2)证明:统计量M(X1,X2,…,Xn+1)的期望
即E(M)=h(p)。因此,M(X1,X2,…,Xn+1)是h(p)的无偏估计量。
(3)由题意Xi~B(1,p),(i=1,2,…,n,n+1),由伯努利分布的性质
因此
是p的完备充分统计量,M(X1,X2,…,Xn+1)是h(p)的一个无偏估计,由定理知,将M(X1,X2,…,Xn+1)对求条件期望,则S(T)=E(M(X)|T(X))是h(p)的最小方差无偏估计。
在T(X)=t,(t=0,1,2,…,n+1)的条件下求条件期望:
其中,T(X)~B(n+1,p),
当T(X)=t=0时
当T(X)=t=1时
当T(X)=t=2时
当T(X)=t≥3时
故h(p)的最小方差无偏估计为
四、(共16分)令X1,X2,X3,X4,X5为总体伯努利分布B(1,p)的样本。考虑如下假设检验:
H0:p=1/2 v.s. H1:p=1/4
(1)(10分)寻找此假设检验的最优检验(显著水平为0.05)。
(2)(6分)计算上述检验的第一类与第二类错误概率大小。
解:(1)根据Neyman-Pearson定理,应通过似然比检验得到最优检验。似然函数为
当p=1/2和p=1/4时,对应的似然函数分别为
L(0.5,x)=0.55=1/32
因此,似然比为
当λ≥k时,拒绝H0,等价于时,拒绝H0。给定显著性水平α=0.05,使
当H0为真时,服从二项分布B(5,0.5),由于是离散分布,所以不能求出一个c值满足上式,此时应选择满足的最大c作为临界点。
当c≥2时
故最优检验的拒绝域为
即只有当X1,…,X5全为0时才拒绝原假设。
(2)犯第一类错误的概率,即原假设为真拒绝原假设的概率:
犯第二类错误的概率,即原假设为假但接受原假设的概率:
五、(共24分)假定A,B,C三种不同工艺铸造的零件强度X,Y,Z分别服从正态分布N(μi,σ2),i=1,2,3且X,Y,Z相互独立。为了解三种工艺铸造强度的差异,随机选取7,7,6个(共20个)分别用A,B,C三种工艺铸造的零件,测得其强度X1,X2,…,X7,Y1,Y2,…,Y7,Z1,Z2,…,Z6,令
(1)(8分)证明服从t分布。
(2)(6分)利用上述t分布求μ3的95%置信区间。
(3)(10分)若观测数据如下表所示,并分别计算得到三组样本均数与样本方差,sy2,sz2(见下表)。在α=0.05的显著性水平下,检验A,B,C三种工艺铸造的零件强度有无差异。
A,B,C三种工艺铸造的零件强度
解:(1)证明:
由正态分布的性质知
由于X,Y,Z相互独立,根据卡方分布的可加性,有
由t分布的定义知
整理得
(2)由t分布的性质
整理得
即μ3的95%置信区间为
其中t0.025(17)=2.11。
(3)构造假设检验:
H0:μ1=μ2=μ3;H1:μ1,μ2,μ3不全相等
全部观测值的总均值:
组间平方和:
组内平方和:
SSA的自由度为3-1=2;SSE的自由度为20-3=17。
当H0为真时,检验统计量
本题中F~F(2,17)。
代入数据计算得:
因此,拒绝原假设,即认为A、B、C三种零件的强度有显著差异。
附:
t分布的95%与97.5%分位数
F分布95%与97.5%分位数: