二项分布与其他分布的关系
二项分布与其他分布的关系
摘 要:
二项分布是一种常见的离散型随机变量的概率模型,在概率教学中占有重要地位。本文从二项分布的定义入手,重点分析和阐述了二项分布和“0-1”分布、超几何分布、泊松分布、正态分布的近似关系及基于这些关系所带来的计算上的便利。以期在教学中能使学生更全面深入的理解和认识二项分布。
关键词:
二项分布 “0-1”分布 超几何分布 泊松分布 正态分布 近似
1.二项分布的定义
设随机变量X示n重伯努利试验中事件A发生的次数,其概率函数为:
p(x)=P(X=x)=Cxnpxqn-x x=0,1,…,n
则称设随机变量X服从参数为n和p的二项分布,记为X~B(n,p),也称广义贝努里试验。
2.二项分布与其它分布的关系
2.1二项分布与“0-1”分布间的关系
进行一次试验,其结果要么“成功”,要么“失败”,记X=1成功0失败,即随机变量X表示一次试验中成功的次数,且p(x)=P(X=x)=pxq1-x(x=0,1)则称随机变量X~“0-1”分布,p为试验结果“成功”发生的概率。该试验也称为贝努里试验。
X~“0-1”分布,其期望、平方的期望、方差及特征函数容易得到:
E(X)=0×(1-p)+1×p=p
E(X2)=02×(1-p)+12×p=p
D(X)=E(X2)-E2(X)=p-p2=p(1-p)
φ(t)=E(eitX)=eit?o×(1-p)+eit?1×p=1-p+peit
将贝努里试验在相同条件下独立进行n次,并以随机变量Y表示n次试验中“成功”的次数,则Y~B(n,p)。若以Xi表示第i次试验中成功的次数,则X1,X2…Xn,独立同“0-1”分布(i=1,2…n)且Y=∑ni=1Xi。则二项分布的期望、方差及特征函数可由二项分布和“0-1”分布间的函数关系得到:
E(Y)=E(∑ni=1Xi)=∑ni=1E(Xi)=np
D(Y)=D(∑ni=1Xi)=∑ni=1D(Xi)=np(1-p)
φY(t)=E(eitY)=E(eit∑ni=1Xi)=∏ni=1E(eitXk)=∏ni=1(1-p+peit)=(1-p+peit)n
易见,在教学中利用二项分布和“0-1”分布的关系,使二项分布的上述特征数更容易计算和理解。
2.2二项分布与超几何分布的关系
从含有M件次品的N件产品中任取n件(每次任意取出一个,取后不放回,连续取n次),设随机变量X表示n件产品中出现的次品数,则X~H(n,M,N),概率函数为:
p(x)=P(X=x)=CxMCn-xN-MCnN=p(x,n,M,N)x=0,1,…,n
若将上述取件方式变为每次任意取出一个,取后放回,连续取n次,则易知其中所含的次品数X~B(n,p),其中p=MN。这里有放回的抽样使得每次抽取时的次品率保持不变,
且各次抽取结果相互独立。
而当产品总数N很大时,抽取样品的个数n相对于N较小时(一般来说nN≤0.1),不放回抽样可近似看成每次抽样结果是相互独立的有放回抽样。据此现实意义,可帮助我们理解二项分布与超几何分布的近似关系:
limN→∞CxMCn-xN-MCMN=Cxnpxqn-x x=0,1,…,n
其中,p=MN,q=1-MN=MN-M,一般要求nN≤0.1。证明见文献[1]。
超几何分布是一种重要的、应用广泛的概率模型。据此关系在合适的条件下可将服从超几何分布的随机变量的概率值的计算近似为服从二项分布的随机变量的概率值进行计算。
2.3二项分布和泊松分布间的关系
若随机变量X表示某个交通路口单位时间内发生交通事故的次数,设所观察的这段时间为[0,1],取一个很大的自然数n,把这段时间分为等长的n段
l1=0,1n,l2=1n,2n,…li=in,i+1n,…ln=n-1n,1
假定:(1)在每段li内,恰好发生一次交通事故的概率与时段长度成正比,可取为λn;
(2)由于n很大,故每段时间间隔很小,认为在这么小的时段内发生两次或更多次的交通事故是不可能的。故在每个时段内不发生交通事故的概率为1-λn;
(3)li各时间段内是否发生交通事故是独立的`。
因此,在[0,1]时段内要么发生一次交通事故,其概率为λn,要么不发生交通事故,其概率为1-λn,而各时间段内是否发生交通事故是独立的。故[0,1]时段内发生交
通事故的次数X服从二项分布B(n,λn),其概率函数为:
P(X=x)=Cxn(λn)x(1-λn)n-x x=0,1,…,n
严格的说,上式只是近似成立,当n→∞时,limn→∞Cxnpxqn-x=λxx!e-λ其中λ=np。一般要求p≤0.1。证明见文献[1]。在教学中可利用此关系使学生自然的理解泊松分布的特性,它常用来描述大量随机试验中稀有事件出现的次数。
2.4二项分布和正态分布的关系
据棣莫弗――拉普拉斯定理[2]:设Yn~B(n,p)n=1,2,…则对z有:
limn→∞P(Yn-npnpq≤z)=12π∫z-∞e-t22dt
由此可知,当n充分大时,服从二项分布的随机变量Yn近似的服从正态分布N(np,npq).这里是用一个连续型的正态分布来近似离散型的二项分布,应用时p应满足0.1 在教学中可利用此关系说明二项分布以正态分布为极限分布,并且,当n充分大时
P(m1≤Yn≤m2)≈Φ(m2-npnpq)-Φ(m1-npnpq)
也就是说可利用标准正态分布表来解决较难计算的二项分布的概率计算问题。
3.结束语
综上所述,二项分布B(n,p)可看成n个独立同“0-1”分布的随机变量的和,从而利用和函数的关系易于计算二项分布的某些特征值;在产品抽样中,若产品总数N很大,抽取的样品个数n相对于N较小时(nN≤0.1),所抽取的次品数所服从的超几何分布可用二项分布近似;当n很大,p较小,一般要求p≤0.1,λ=np适中时可用泊松分布近似二项分布;当n充分大。
参考文献:
[1]沈恒范.概率论与数理统计教程第5版[M].北京:高等教育出版社,2011.6:55-63.
[2]李裕奇.概率论与数理统计[M].北京:国防工业出版社,2001.8:193-195.
[3]魏振军.概率论与数理统计三十三讲[M].北京:中国统计出版社,2005.
因篇幅问题不能全部显示,请点此查看更多更全内容