第一节 随机变量及其分布函数
上一章中我们讨论的随机事件中有些是直接用数量来标识的,例如,抽样检验灯泡质量试验中灯泡的寿命;而有些则不是直接用数量来标识的,如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题,我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e都用一个实数X来表示.例如,在性别抽查试验中用实数“1”表示“出现男性”,用“0”表示“出现女性”.显然,一般来讲此处的实数X值将随e的不同而变化,它的值因e的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量.
定义2.1 设随机试验的样本空间为Ω,如果对Ω中每一个元素e,有一个实数X(e)与之对应,这样就得到一个定义在Ω上的实值单值函数X=X(e),称之为随机变量(Random variable).
随机变量的取值随试验结果而定,在试验之前不能预知它取什么值,只有在试验之后才知道它的确切值;而试验的各个结果出现有一定的概率,故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者,普通函数是定义在实数集或实数集的一个子集上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数),这也是二者的差别.
本书中,我们一般以大写字母如X,Y,Z,W,„表示随机变量,而以小写字母如x,y,z,w,„表示实数.
为了研究随机变量的概率规律,并由于随机变量X的可能取值不一定能逐个列出,因此我们在一般情况下需研究随机变量落在某区间(x1,x2]中的概率,即求P{x1<X≤x2},但由于P{x1<X≤x2}=P{X≤x2}-P{X≤x1},由此可见要研究P{x1<X≤x2}就归结为研究形如P{X≤x}的概率问题了.不难看出,P{X≤x}的值常随不同的x而变化,它是x的函数,我们称这函数为分布函数.
定义2.2 设X是随机变量,x为任意实数,函数
F(x)=P{X≤x}
称为X的分布函数(Distribution function).
对于任意实数x1,x2(x1 因此,若已知X的分布函数,我们就能知道X落在任一区间(x1,x2]上的概率.在这个意义上说,分布函数完整地描述了随机变量的统计规律性. 如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率. 分布函数具有如下基本性质: 1°F(x)为单调不减的函数. 事实上,由(2.1)式,对于任意实数x1,x2(x1 2°0≤F(x)≤1,且 limF(x)=1,常记为F(+∞)=1. xlimF(x)=0,常记为F(-∞)=0. x我们从几何上说明这两个式子.当区间端点x沿数轴无限向左移动(x→-∞)时,则“X落在x左边”这一事件趋于不可能事件,故其概率P{X≤x}=F(x)趋于0;又若x无限向右移动(x→+∞)时,事件“X落在x左边”趋于必然事件,从而其概率P{X≤x}=F(x)趋于1. 3°F(x+0)=F(x),即F(x)为右连续. 证略. 反过来可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象,而利用分布函数就能很好地表示各事件的概率.例如,P{X>a}=1-P{X≤a}=1-F(a),P{X<a}=F(a-0),P{X=a}=F(a)-F(a-0)等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了,它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数,另有一种奇异型随机变量超出本书范围,就不作介绍了. 第二节离散型随机变量及其分布 如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量. 容易知道,要掌握一个离散型随机变量X的统计规律,必须且只须知道X的所有可能取的值以及取每一个可能值的概率. 设离散型随机变量X所有可能的取值为xk(k=1,2,„),X取各个可能值的概率,即事件{X=xk}的概率 P{X=xk}=pk, k=1,2,„ (2.2) 我们称(2.2)式为离散型随机变量X的概率分布或分布律.分布律也常用表格来表示(表2-1): 表2-1 X pk x1 x2 x3 … xk … p1 p2 p3 … pk … 由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°pk≥0,k=1,2,„; (2.3) 2° pk1k1. (2.4) 反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律. 为了直观地表达分布律,我们还可以作类似图2-1的分布律图. 2 图2-1 图2-1中xi处垂直于x轴的线段高度为pi,它表示X取xi的概率值. 例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互).以X表示汽车首次停下时已经通过的信号灯盏数,求X的分布律. 解 以p表示每盏灯禁止汽车通过的概率,显然X的可能取值为0,1,2,3,4,易知X的分布律为 表2-2 X pk 0 1 2 3 4 P (1-p)p (1-p)2 p p(1-p)3 p (1-p)4 或写成P{X=k}=(1-p)kp,k=0,1,2,3. P{X=4}=(1-p)4. 将p=0.4,1-p=0.6代入上式,所得结果如表2-3所示. 表2-3 X pk 0 1 2 3 4 0.4 0.24 0.144 0.08 0.1296 下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布 若随机变量X只可能取x1与x2两值,它的分布律是 P{X=x1}=1-p(0<p<1), P{X=x2}=p, 则称X服从参数为p的两点分布. 特别,当x1=0,x2=1时两点分布也叫(0-1)分布,记作X~(0-1)分布.写成分布律表形式见表2-4. 表2-4 X pk 0 1 1-p p 对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e1,e2},我们总能在Ω上定义一个服从(0-1)分布的随机变量 0,XX(e)1,当ee1, 当ee2,用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A出现与否,则可用一个服从(0-1)分布的随机变量来描述. (2)二项分布 若随机变量X的分布律为 3 kn-k P{X=k}=Cknp(1-p), k=0,1,„,n, (2.5) 则称X服从参数为n,p的二项分布(Binomial distribution),记作X~b(n,p). 易知(2.5)满足(2.3)、(2.4)两式.事实上,P(X=k)≥0是显然的;再由二项展开式知 P{Xk}Ck0k0nnknpk(1p)nk[p(1p)]n=1. knk我们知道,P{X=k}=Ck恰好是[p+(1-p)]n二项展开式中出现pk的那一项,np(1p)这就是二项分布名称的由来. 回忆n重贝努里试验中事件A出现k次的概率计算公式 kn-k Pn(k)=Cknp(1-p), k=0,1,…,n, 可知,若X~b(n,p),X就可以用来表示n重贝努里试验中事件A出现的次数.因此,二项分布 可以作为描述n重贝努里试验中事件A出现次数的数学模型.比如,射手射击n次中,“中的”次数的概率分布;随机抛掷硬币n次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n件,其中“废品”件数的概率分布等等. 不难看出,(0-1)分布就是二项分布在n=1时的特殊情形,故(0-1)分布的分布律也可写成 P{X=k}=pkq1-k(k=0,1)(q=1-p). 例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人. 三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利? 解 设系队得胜人数为X,则在上述三种方案中,系队胜利的概率为 (1) P{X≥2}= C(0.4)(0.6)k3kk2k5k5k33k≈0.352; (2) P{X≥3}= C(0.4)(0.6)k375≈0.317; (3) P{X≥4}= C(0.4)(0.6)k7kk47k≈0.290. 因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大. 例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k个(k=1,2,„,20)为合格品的概率是多少? 解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X记20个产品中合格 4 品的个数,那么X~b(20,0.98),即 P{X=k}=Ck)k(0.02)20k,k=1,2,„,20. 20(0.98若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n很大而p(或1-p)很小时的近似计算公式. 定理2.1(泊松(Poisson)定理) 设npn=λ(λ>0是一常数,n是任意正整数),则对任意一固定的非负整数k,有 limCpn(1pn)nknknkke-k!. 证 由pn=λ/n,有 Ck1pnnpnknkn(n1)(nk1)k()(1)nkk!nn12k1111111.k!nnnnnknk 对任意固定的k,当n→∞时, 12k111n1n1n1, 1e,1nn故 nk1 limCpn(1pn)nknknkkek!. 由于λ=npn是常数,所以当n很大时pn必定很小,因此,上述定理表明当n很大p很小时,有以下近似公式 Cp(1p)knknkkek!, (2.6) 其中λ=np. 从表2-5可以直观地看出(2.6)式两端的近似程度. 表2-5 按二项分布公式直接计算 k 0 1 2 3 4 按泊松近似公式(2.6)计算 n=100 p=0.01 0.366 0.370 0.185 0.061 0.015 0.368 0.368 0.184 0.061 0.015 5 n=10 p=0.1 0.349 0.385 0.194 0.057 0.011 n=20 p=0.05 0.358 0.377 0.1 0.060 0.013 n=40 p=0.025 0.363 0.372 0.186 0.060 0.014 λ=1(=np) … … … … … … 由上表可以看出,两者的结果是很接近的.在实际计算中,当n≥20,p≤0.05时近似效果颇佳,而当n≥100,np≤10时效果更好. kek!的值有表可查(见本书附表3) 二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A出现的概率p很小),当贝努里试验的次数n很大时,事件A发生的次数的分布. 例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率. 解 设X表示发生交通事故的汽车数,则X~b(n,p),此处n=5000,p=0.001,令λ=np=5, P{X≥2}=1-P{X<2}=1- PXk k01=1-(0.999)5000-5(0.999)4999 50e55e5≈1. 0!1!查表可得 P{X≥2}=1-0.00674-0.03369=0.95957. 例2.5 某人进行射击,设每次射击的命中率为0.02,射击400次,试求至少击中两次的概率. 解 将一次射击看成是一次试验.设击中次数为X,则X~b(400,0.02),即X的分布律为 k400-k P{X=k}=Ck, k=0,1,…,400. 400 (0.02)(0.98) 故所求概率为 P{X≥2}=1-p{X=0}-p{X=1} =1-(0.98)400-400(0.02)(0.98)399 =0.9972. 这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P{X<2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02. (3)泊松分布 若随机变量X的分布律为 P{X=k} = ke-k!,k=0,1,2,„, (2.7) 其中λ>0是常数,则称X服从参数为λ的泊松分布(Poisson distribution),记为X~P(λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P{X=k}≥0显然;再由 6 k0kek!=e-²e=1, λ λ 可知 P{Xk}=1. k0由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k=0,1,„的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,① 由某块放射性物质放射出的α质点,到达某个计数器的质点数;② 某地区发生交通事故的次数;③ 来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布. 例2.6 由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件? 解 设该商店每月销售这种商品数为X,月底进货为a件,则当X≤a时不脱销,故有 P{X≤a}≥0.95. 由于X~P(5),上式即为 e55k≥0.95. k!k0a查表可知 e55k≈0.9319<0.95, k!k09e510k≈0.9682>0.95 k!k010于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95% 以上的把握保证这种商品在下个月不会脱销. 下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X的分布律如表2-1所示. 由分布函数的定义可知 F(x)=P{X≤x}= 此处的 xkxP{Xx}pkxkxk, xkx和式表示对所有满足xk≤x的k求和,形象地讲就是对那些满足xk≤x所对应的 pk的累加. 例2.7 求例2.1中X的分布函数F(x). 解 由例2.1的分布律知 当x<0时, 7 F(x)=P{X≤x}=0; 当0≤x<1时, F(x)=P{X≤x}=P{X=0}=0.4; 当1≤x<2时, F(x)=P{X≤x}=P({X=0}∪{X=1})=P{X=0}+P{X=1}=0.4+0.24=0.; 当2≤x<3时 F(x)=P{X≤x}=P({X=0}∪{X=1}∪{X=2}) =P{X=0}+P{X=1}+P{X=2} =0.4+0.24+0.144 =0.784; 当3≤x<4时 F(x)=P{X≤x}=P({X=0}∪{X=1}∪{X=2}∪{X=3}) =0.4+0.24+0.144+0.08=0.8704; 当x≥4时 F(x)=P{X≤x} =P({X=0}∪{X=1}∪{X=2}∪{X=3}∪{X=4}) =0.4+0.24+0.144+0.08+0.1296=1. 综上所述 0,0.4,0.,F(x)=P{X≤x}=0.784,0.8704,1,x0,0x1,1x2,2x3, 3x4,x4.F(x)的图形是一条阶梯状右连续曲线,在x=0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.08,0.1296,这条曲线从左至右依次从F(x)=0逐步升级到F(x)=1.对表21所示的一般的分布律,其分布函数F(x)表示一条阶梯状右连续曲线,在X=xk(k=1,2,„)处有跳跃,跳跃的高度恰为pk=P{X=xk},从左至右,由水平直线F(x)=0,分别按阶高p1,p2,„升至水平直线F(x)=1. 以上是已知分布律求分布函数.反过来,若已知离散型随机变量X的分布函数F(x),则X的分布律也可由分布函数所确定: pk=P{X=xk}=F(xk)-F(xk-0). 第三节 连续型随机变量及其分布 上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X 8 丝毫不差刚好是其固定值(如1.824cm)的事件{X=1.824}几乎是不可能的,应认为P{X=1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子. 例2.8 一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数. 解 1°若x<0,因为事件{X≤x}是不可能事件,所以 F(x)=P{X≤x}=0. 2°若0≤x≤2,由题意P{0≤X≤x}=kx2,k是常数,为了确定k的值,取x=2,有P{0≤X≤2}=22k,但事件{0≤X≤2}是必然事件,故P{0≤X≤2}=1,即22k=1,所以k=1/4,即 P{0≤X≤x}=x2/4. 于是 F(x)=P{X≤x}=P{X<0}+P{0≤X≤x}= x2/4. 3°若x≥2,由于{X≤2}是必然事件,于是 F(x)=P{X≤x}=1. 综上所述 0,12F(x)=x,41,x0,0x2, x2,它的图形是一条连续曲线如图22所示. 图22 另外,容易看到本例中X的分布函数F(x)还可写成如下形式: F(x)= xf(t)dt, 0t2,其他.1t,其中 f(t)=20, 这就是说F(x)恰好是非负函数f(t)在区间(∞,x]上的积分,这种随机变量X我 们称为连续型随机变量.一般地有如下定义. 定义2.3 若对随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有 F(x)= xf(t)dx, (2.8) 则称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称概率密度或密度函数(Density function). 由(2.8)式知道连续型随机变量X的分布函数F(x)是连续函数.由分布函数的性质F(∞)=0,F(+∞)=1及F(x)单调不减,知F(x)是一条位于直线y=0与y=1之间的单调不减的连续(但不一定光滑)曲线. 由定义2.3知道,f(x)具有以下性质: 1°f(x)≥0; 2° f(x)dx=1; 9 3°P{x1<X≤x2}=F(x2)F(x1)= x2x1f(x)dx (x1≤x2); 4°若f(x)在x点处连续,则有F′(x)=f(x). 由2°知道,介于曲线y=f(x)与y=0之间的面积为1.由3°知道,X落在区间(x1,x2]的概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下的曲边梯形面积.由4°知道,f(x)的连续点x处有 f(x)= limx0F(xx)F(x)P{xXxx}lim. xxx0这种形式恰与物理学中线密度定义相类似,这也正是为什么称f(x)为概率密度的原因.同 样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f(x),一定可以作为某个连续型随机变量的密度函数. 前面我们曾指出对连续型随机变量X而言它取任一特定值a的概率为零,即P{X=a}=0,事实上,令Δx>0,设X的分布函数为F(x),则由 {X=a}{aΔx<X≤a}, 得 0≤P{X=a}≤P{aΔx<X≤a}=F(a)F(aΔx). 由于F(x)连续,所以 limF(ax)=F(a). x0当Δx→0时,由夹逼定理得 P{X=a}=0, 由此很容易推导出 P{a≤X<b}=P{a<X≤b}=P{a≤X≤b}=P{a<X<b}. 即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X=a}“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件. 例2.9 设连续型随机变量X的分布函数为 0,2F(x)=Ax,1,x0,0x1, x1.试求: (1)系数A; (2)X落在区间(0.3,0.7)内的概率; (3)X的密度函数. 解 (1)由于X为连续型随机变量,故F(x)是连续函数,因此有 1=F(1)= 即A=1,于是有 limx10F(x)limAx2 =A, x100,2F(x)=x,1,x0,0x1, x1. (2) P{0.3 f(x)=F′(x)=2x,0,0x1; 其他.由定义2.3知,改变密度函数f(x)在个别点的函数值,不影响分布函数F(x)的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x=0或x=1上f(x)的值). 例2.10 设随机变量X具有密度函数 kx,xf(x)=2,20,0x3,3x4, 其他.7}. 2(1) 确定常数k;(2) 求X的分布函数F(x);(3) 求P{1 4xkxdx(2032)dx=1, 3解得k=1/6,故X的密度函数为 x6,xf(x)=2,20, (2) 当x<0时,F(x)=P{X≤x}= 0x3,3x4, 其他.xxxf(t)dt =0; f(t)dt=0当0≤x<3时,F(x)=P{X≤x}= 0tx2f(t)dtf(t)dt=dt; 06012xx当3≤x<4时,F(x)=P{X≤x}= 3f(t)dt=f(t)dtf(t)dtf(t)dt 033x= 0xttx2dt(2)dt2x3; 3624当x≥4时,F(x)=P{X≤x}= = 即 3xf(t)dt=f(t)dtf(t)dtf(t)dtf(t)dt 034034x4ttdt(20632)dt =1. 11 0,2x,12F(x)=2x2x3,41, (3) P{1 若连续型随机变量X具有概率密度 x0,0x3, 3x4,x4.1,f(x)=ba0,axb,其他. (2.9) 则称X在区间(a,b)上服从均匀分布(Uniform distribution),记为X~U(a,b).易知f(x)≥0且 f(x)dx1dx=1. abab由(2.9)可得 1°P{X≥b}= b0dx =0,P{X≤a}=0dx=0, a即 P{a (a,b)内取值,而以概率0在区间(a,b)以外取值,并且X值落入(a,b)中任一子区间(c,d)中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X的分布函数为 0,xaF(x)=,ba1,xa,axb, (2.10) xb.密度函数f(x)和分布函数F(x)的图形分别如图23和图24所示. 图23 图24 在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X,一般可以看作是一个服从在[0.5,0.5]上的均匀分布的随机变量;又如在(a,b)中随机掷质点,则该质点的坐标X一般也可看作是一个服从在(a,b)上的均匀分布的随机变量. 例2.11 某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时 12 间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率. 解 设乘客于7时过X分钟到达车站,由于X在[0,30]上服从均匀分布,即有 1,f(x)=300,0x30,其他. 显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她) 等车的时间才少于5分钟,因此所求概率为 P{10<X≤15}+P{25<X≤30}= 3011dx10302530dx=1/3. 15(2)指数分布 若随机变量X的密度函数为 ex,f(x)=0,x0, (2.11) x0.其中λ>0为常数,则称X服从参数为λ的指数分布(Exponentially distribution),记作X~E(λ). 显然f(x)≥0,且 f(x)dxexdx=1. 0容易得到X的分布函数为 1ex,F(x)=0,有 x0, x0.指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s,t>0,P{X>s+t|X>s}=P{X>t}. (2.12) 如果用X表示某一元件的寿命,那么上式表明,在已知元件已使用了s小时的条件下,它还能再使用至少t小时的概率,与从开始使用时算起它至少能使用t小时的概率相等.这就是说元件对它已使用过s小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况. (2.12)式是容易证明的.事实上, P{XstXs}P{Xs,Xst}P{Xst}P{Xs}P{Xs}1F(st)e(st)-λsetP{Xt}.1F(s)e(3)正态分布 若连续型随机变量X的概率密度为 f(x)= 1e2π(x)222, ∞<x<+∞, (2.13) 其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布(Normal distribution),记为X~N(μ,σ2).显然f(x)≥0,下面来证明 f(x)dx=1.令 xu=t,得到 13 记I= 1e2π(x)222dx12πet22dt. et22dt,则有I2=et2s22dtds. 作极坐标变换:s=rcosθ,t=rsinθ,得到 I2= 而I>0,故有I=2π,即有 t222π0rer22drd2π, 于是 edt2π. 1e2(x)222dx12π1. 2π正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布. 参数μ,σ的意义将在第四章中说明.f(x)的图形如图25所示,它具有如下性质: 图25 图26 1°曲线关于x=μ对称; 2°曲线在x=μ处取到最大值,x离μ越远,f(x)值越小.这表明对于同样长度的区间,当区间离μ越远,X落在这个区间上的概率越小; 3°曲线在μ±σ处有拐点; 4°曲线以x轴为渐近线; 5°若固定μ,当σ越小时图形越尖陡(图26),因而X落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数. 由(2.13)式得X的分布函数 F(x)= 12πx-e(t)222dt. (2.14) 14 特别地,当=0,=1时,称X服从标准正态分布N(0,1),其概率密度和分布函数分别用(x),x表示,即有 (x)1e2πx22, (2.15) 1x2xedt. (2.16) 2π易知,(x)=1(x). 人们已事先编制了(x)的函数值表(见本书附录). 一般地,若X~N(,2),则有事实上,Z= t2X~N(0,1). X的分布函数为 P{Z≤x}=P{Xx} =P{X≤+x} (t)222= 令 x1e2πdt, t=s,得 P{Z≤x}= 1e2πxs22ds =(x), 由此知Z= X ~N(0,1). 因此,若X~N(,2),则可利用标准正态分布函数(x),通过查表求得X落在任一区间(x1,x2]内的概率,即 P{x1 x2x1. P{1≤X≤2}=P11.5X1.521.5 222=Φ(0.25)Φ(1.25) =Φ(0.25)[1Φ(1.25)] 15 =0.59871+0.44=0.4931. 设X~N(,2),由(x)函数表可得 P{μσ 例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X服从=170(cm),=6(cm)的正态分布,即X~N(170,62),问车门高度应如何确定? 解 设车门高度为h(cm),按设计要求P{X≥h}≤0.01或P{X<h}≥0.99,因为X~N(170,62),故 P{X<h}=PX170h170h170≥0.99, 666查表得 (2.33)=0.9901>0.99. 故取 h170=2.33,即h=184.设计车门高度为184(cm)时,可使成年男子与车门碰6头的机会不超过1%. 例2.13 测量到某一目标的距离时发生的随机误差X(单位:米)具有密度函数 f(x)= 1402πe(x20)23200. 试求在三次测量中至少有一次误差的绝对值不超过30米的概率. 解 X的密度函数为 f(x)= 1402πe(x20)232001e402π(x20)22402, 即X~N(20,402),故一次测量中随机误差的绝对值不超过30米的概率为 P{|X|≤30}=P{30≤X≤30}=30203020 4040=Φ(0.25)Φ(1.25)=0.5981(10.44)=0.4931. 设Y为三次测量中误差的绝对值不超过30米的次数,则Y服从二项分布b(3,0.4931),故 P{Y≥1}=1P{Y=0}=1(0.5069)3=0.8698. 为了便于今后应用,对于标准正态变量,我们引入了分位点的定义. 设X~N(0,1),若z满足条件 P{X>z}=,0<<1, (2.17) 则称点z为标准正态分布的上分位点,例如,由查表可得z0.05=1.5,z0.001=3.16.故1.5与3.16分别是标准正态分布的上0.05分位点与上0.001分位点. 16 第四节 随机变量函数的分布 我们常常遇到一些随机变量,它们的分布往往难于直接得到(如测量轴承滚珠体积值Y等),但是与它们有函数关系的另一些随机变量,其分布却是容易知道的(如滚珠直径测量值X).因此,要研究随机变量之间的函数关系,从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布. 例2.14 设随机变量X具有表2-6所示的分布律,试求X2的分布律. 表2-6 X Pk -1 0 1 1.5 3 0.2 0.1 0.3 0.3 0.1 解 由于在X的取值范围内,事件“X=0”,“X=1.5”,“X=3”分别与事件“X2=0”,“X2=2.25”,“X2=9”等价,所以 P{X2=0}=P{X=0}=0.1, P{X2=2.25}=P{X=1.5}=0.3, P{X2=9}=P{X=3}=0.1. 事件“X2=1”是两个互斥事件“X=-1”及“X=1”的和,其概率为这两事件概率和,即 P{X2=1}=P{X=-1}+P{X=+1}=0.2+0.3=0.5. 于是得X2的分布律如表2-7所示. 表2-7 X2 p 0 1 2.25 9 0.1 0.5 0.3 0.1 例2.15 设连续型随机变量X具有概率密度fX(x),-∞<x<+∞,求Y=g(X)=X2的概率密度. 解 先求Y的分布函数FY(y),由于Y=g(X)=X2≥0,故当y≤0时事件“Y≤y”的概率为0,即FY(y)=P{Y≤y}=0,当y>0时,有 FY(y)=P{Y≤y}=P{X2≤y}=P{-y≤X≤y} = yyfX(x)dx. 将FY(y)关于y求导,即得Y的概率密度为 1fXfY(y)=2y0,yfy,Xy0, y0.例如,当X~N(0,1),其概率密度为(2.15)式,则Y=X2的概率密度为 y11y2e2,y0, fY(y)=2πy0.0,此时称Y服从自由度为1的2分布. 上例中关键的一步在于将事件“Y≤y”由其等价事件“-y≤X≤y”代替,即将事件“Y≤y”转换为有关X的范围所表示的等价事件,下面我们仅对Y=g(X),其中g(x)为严格单调函数,写出一般结论. 定理2.2 设随机变量X具有概率密度fX(x),-∞<x<+∞,又设函数g(x)处处可 17 导且g′(x)>0(或g′(x)<0),则Y=g(X)是连续型随机变量,其概率密度为 fY(y)=fX[h(y)]h(y),x0,其他. (2.18) 其中=min(g(-∞),g(+∞)),β=max(g(-∞),g(+∞)),h(y)是g(x)的反函数. 我们只证g′(x)>0的情况.由于g′(x)>0,故g(x)在(-∞,+∞)上严格单调递增,它的反函数h(y)存在,且在(,β)严格单调递增且可导.我们先求Y的分布函数FY(y),并通过对FY(y)求导求出fY(y). 由于Y=g(X)在(,β)上取值,故 当y≤时,FY(y)=P{Y≤y}=0; 当y≥β时,FY(y)=P{Y≤y}=1; 当<y<β时, FY(y)=P{Y≤y}=P{g(X)≤y}=P{X≤h(y)}= 于是得概率密度 fY(y)=h(x)fX(x)dx. fX[h(y)]h(y),x, 其他.0,对于g′(x)<0的情况可以同样证明,即 fX[h(y)][h(y)],x,fY(y)= 0,其他.将上面两种情况合并得 fY(y)=fX(h(y))h(y),x,0,其他. 注:若f(x)在[a,b]之外为零,则只需假设在(a,b)上恒有g′(x)>0(或恒有g′(x) <0),此时 =min{g(a),g(b)},β=max{g(a),g(b)}. 例2.16 设随机变量X~N(μ,σ2).试证明X的线性函数Y=aX+b(a≠0)也服从正态分布. 证 设X的概率密度 1efX(x)= 2π(x)222, -∞<x<+∞. 再令y=g(x)=ax+b,得g(x)的反函数 x=h(y)= yb. a所以h′(y)=1/a. 由(2.18)式Y=g(X)=aX+b的概率密度为 fY(y)= 即 1ybfX, -∞<y<+∞, aa 18 fY(y)= 即有 1a2πe[y(ba)]22(a)2,-∞<y<+∞, Y=aX+b~N(aμ+b,(aσ)2). 例2.17 由统计物理学知分子运动速度的绝对值X服从麦克斯韦(Maxwell)分布,其概率密度为 4x2x2ea,x0, f(x)=3aπ0,x0,其中a>0为常数,求分子动能Y= 解 已知y=g(x)= 21mX2(m为分子质量)的概率密度. 212mx,f(x)只在区间(0,+∞)上非零且g′(x)在此区间恒单调递增,22y242ymae,y0, (y)m3/2a3π0,y0.由(2.18)式,得Y的概率密度为 小 结 随机变量X=X(e)是定义在样本空间Ω={e}上的实值单值函数,它的取值随试验结果而定,是不能预先确定的,且它的取值有一定的概率,因而它与普通函数是不同的.引入随机变量,就可以用微积分的理论和方法对随机试验与随机事件的概率进行数学推理与计算,从而完成对随机试验结果的规律性的研究. 分布函数 F(x)=P{X≤x}, -∞ P{x1 本书只讨论了两类重要的随机变量.一类是离散型随机变量.对于离散型随机变量,我们需要知道它可能取哪些值,以及它取每个可能值的概率,常用分布律 P{X=xk}=pk, k=1,2,„ 或用表 X pk x1 x2 … xk … p1 p2 … pk … 表示它取值的统计规律性.要掌握已知分布律求分布函数F(x)的方法以及已知分布函数F(x)求分布律的方法.分布律与分布函数是一一对应的. 另一类是连续型随机变量,设随机变量X的分布函数为F(x),若存在非负函数f(x), 19 使得对于任意x,有 F(x)= xf(t)dt, 则称X是连续型随机变量,其中f(x)称为X的概率密度函数.连续型随机变量的分布函数是连续的,但不能认为凡是分布函数为连续函数的随机变量就是连续型随机变量.判别一个随机变量是不是连续型的,要看符合定义条件的f(x)是否存在(事实上存在分布函数F(x)连续,但又不能以非负函数的变上限的定积分表示的随机变量). 要掌握已知f(x)求F(x)的方法,以及已知F(x)求f(x)的方法.由连续型随机变量定义可知,改变f(x)在个别点的函数值,并不改变F(x)的值,因此改变f(x)在个别点的值是无关紧要的. 读者要掌握分布函数、分布律、密度函数的性质. 本章还介绍了几种重要的随机变量的分布:(0-1)分布、二项分布、泊松分布、均匀分布、指数分布、正态分布.读者必须熟练掌握这几种分布的分布律或密度函数,还须知道每一种分布的概率意义,对这几种分布的理解不能仅限于知道它们的分布律或密度函数. 随机变量X的函数Y=g(X)也是一个随机变量.求Y的分布时,首先要准确界定Y的取值范围(在离散型时要注意相同值的合并),其次要正确计算Y的分布,特别是Y为连续型随机变量时的情形.当y=g(x)单调或分段单调时,可按定理写出Y的密度函数fY(y),否则应先按分布函数定义求出FY(y),再对y求导,得到fY(y)(即使是y=g(x)单调或分段单调时,也应掌握先求出FY(y),再求出fY(y)的一般方法). 重要术语及主题 随机变量 分布函数 离散型随机变量及其分布律 连续型随机变量及其密度函数 (0-1)分布 二项分布 泊松分布 均匀分布 指数分布 正态分布 随机变量函数的分布 习 题 二 1.一袋中有5只乒乓球,编号为1,2,3,4,5,在其中同时取3只,以X表示取出的3只球中的最大号码,写出随机变量X的分布律. 2.设在15只同类型零件中有2只为次品,在其中取3次,每次任取1只,作不放回抽样,以X表示取出的次品个数,求: (1) X的分布律; (2) X的分布函数并作图; (3) P{X≤12},P{1<X≤32},P{1≤X≤32},P{1<X<2}. 3.射手向目标地进行了3次射击,每次击中率为0.8,求3次射击中击中目标的次数的分布律及分布函数,并求3次射击中至少击中2次的概率. 4.(1) 设随机变量X的分布律为 P{X=k}=akk!, 20 其中k=0,1,2,„,λ>0为常数,试确定常数a. (2) 设随机变量X的分布律为 P{X=k}=a/N, k=1,2,„,N, 试确定常数a. 5.甲、乙两人投篮,投中的概率分别为0.6,0.7,今各投3次,求: (1) 两人投中次数相等的概率; (2) 甲比乙投中次数多的概率. 6.设某机场每天有200架飞机在此降落,任一飞机在某一时刻降落的概率设为0.02,且设各飞机降落是相互的.试问该机场需配备多少条跑道,才能保证某一时刻飞机需立即降落而没有空闲跑道的概率小于0.01(每条跑道只能允许一架飞机降落)? 7.有一繁忙的汽车站,每天有大量汽车通过,设每辆车在一天的某时段出事故的概率为0.0001,在某天的该时段内有1000辆汽车通过,问出事故的次数不小于2的概率是多少(利用泊松定理)? 8.已知在五重贝努里试验中成功的次数X满足P{X=1}=P{X=2},求概率P{X=4}. 9.设事件A在每一次试验中发生的概率为0.3,当A发生不少于3次时,指示灯发出信号, (1) 进行了5次试验,试求指示灯发出信号的概率; (2) 进行了7次试验,试求指示灯发出信号的概率. 10.某在长度为t的时间间隔内收到的紧急呼救的次数X服从参数为(1/2)t的泊松分布,而与时间间隔起点无关(时间以小时计). (1) 求某一天中午12时至下午3时没收到呼救的概率; (2) 求某一天中午12时至下午5时至少收到1次呼救的概率. k2k11.设P{X=k}=Ck, k=0,1,2 2p(1p)P{Y=m}=C4p(1p)mm4m, m=0,1,2,3,4 分别为随机变量X,Y的概率分布,如果已知P{X≥1}=59,试求P{Y≥1}. 12.某教科书出版了2000册,因装订等原因造成错误的概率为0.001,试求在这2000册书中恰有5册错误的概率. 13.进行某种试验,成功的概率为34,失败的概率为14.以X表示试验首次成功所需试验的次数,试写出X的分布律,并计算X取偶数的概率. 14.有2500名同一年龄和同社会阶层的人参加了保险公司的人寿保险.在一年中每个人死亡的概率为0.002,每个参加保险的人在1月1日须交12元保险费,而在死亡时家属可从保险公司领取2000元赔偿金.求: (1) 保险公司亏本的概率; (2) 保险公司获利分别不少于10000元、20000元的概率. 15.已知随机变量X的密度函数为 f(x)=Ae-|x|, -∞ 100,x100,f(x)=x2 x100.0,求:(1) 在开始150小时内没有电子管损坏的概率; (2) 在这段时间内有一只电子管损坏的概率; 21 (3) F(x). 17.在区间[0,a]上任意投掷一个质点,以X表示这质点的坐标,设这质点落在[0,a]中任意小区间内的概率与这小区间长度成正比例,试求X的分布函数. 18.设随机变量X在[2,5]上服从均匀分布.现对X进行三次观测,求至少有两次的观测值大于3的概率. 19.设顾客在某银行的窗口等待服务的时间X(以分钟计)服从指数分布E(15).某顾客在窗口等待服务,若超过10分钟他就离开.他一个月要到银行5次,以Y表示一个月内他未等到服务而离开窗口的次数,试写出Y的分布律,并求P{Y≥1}. 20.某人乘汽车去火车站乘火车,有两条路可走.第一条路程较短但交通拥挤,所需时间X服从N(40,102);第二条路程较长,但阻塞少,所需时间X服从N(50,42). (1) 若动身时离火车开车只有1小时,问应走哪条路能乘上火车的把握大些? (2) 又若离火车开车时间只有45分钟,问应走哪条路赶上火车把握大些? 21.设X~N(3,22), (1) 求P{2<X≤5},P{-4<X≤10},P{|X|>2},P{X>3}; (2) 确定c使P{X>c}=P{X≤c}. 22.由某机器生产的螺栓长度(cm)X~N(10.05,0.062),规定长度在10.05±0.12内为合格品,求一螺栓为不合格品的概率. 23.一工厂生产的电子管寿命X(小时)服从正态分布N(160,σ2),若要求P{120<X≤200}≥0.8,允许σ最大不超过多少? 24.设随机变量X分布函数为 ABet,x0,F(x)=(0), x0.0,(1) 求常数A,B; (2) 求P{X≤2},P{X>3}; (3) 求分布密度f(x). 25.设随机变量X的概率密度为 x,f(x)=2x,0,0x1,1x2, 其他.求X的分布函数F(x),并画出f(x)及F(x). 26.设随机变量X的密度函数为 (1) f(x)=ae-|x|,λ>0; bx,0x1,1(2) f(x)=2,1x2, x0,其他.试确定常数a,b,并求其分布函数F(x). 27.求标准正态分布的上分位点, (1) =0.01,求z; (2) =0.003,求z,z/2. 28.设随机变量X的分布律为 X -2 -1 0 1 3 22 Pk 1/5 1/6 1/5 1/15 1/130 求Y=X2的分布律. 29.设P{X=k}=(12)k, k=1,2,„,令 Y=1,当X取偶数时, 1,当X取奇数时.求随机变量X的函数Y的分布律. 30.设X~N(0,1). (1) 求Y=eX的概率密度; (2) 求Y=2X2+1的概率密度; (3) 求Y=|X|的概率密度. 31.设随机变量X~U(0,1),试求: (1) Y=eX的分布函数及密度函数; (2) Z=-2lnX的分布函数及密度函数. 32.设随机变量X的密度函数为 2x,0xπ,f(x)=π2 其他.0,试求Y=sinX的密度函数. 33.设随机变量X的分布函数如下: 1,F(x)1x2(2),x(1)x, (3).试填上(1),(2),(3)项. 34.同时掷两枚骰子,直到一枚骰子出现6点为止,求抛掷次数X的分布律. 35.随机数字序列要多长才能使数字0至少出现一次的概率不小于0.9? 36.已知 0,1F(x)=x,21,x0,10x, 21x.2则F(x)是( )随机变量的分布函数. (A) 连续型; (B)离散型; (C) 非连续亦非离散型. 37.设在区间[a,b]上,随机变量X的密度函数为f(x)=sinx,而在[a,b]外,f(x)=0,则区间 [a,b]等于( ) (A) [0,π/2]; (B) [0,π]; (C) [-π/2,0]; (D) [0, 3π]. 223 38.设随机变量X~N(0,σ2),问:当σ取何值时,X落入区间(1,3)的概率最大? 39.设在一段时间内进入某一商店的顾客人数X服从泊松分布P(λ),每个顾客购买某种物品的概率为p,并且各个顾客是否购买该种物品相互,求进入商店的顾客购买这种物品的人数Y的分布律. 40.设随机变量X服从参数为2的指数分布.证明:Y=1-e-2X在区间(0,1)上服从均匀分布.(1995研考) 41.设随机变量X的密度函数为 13,0x1,2f(x)=,3x6, 9其他.0,若k使得P{X≥k}=2/3,求k的取值范围. (2000研考) 42.设随机变量X的分布函数为 x1,0,0.4,1x1,F(x)= 0.8,1x3,x3.1,求X的概率分布. (1991研考) 43.设三次试验中,事件A出现的概率相等.若已知A至少出现一次的概率为19/27,求A在一次试验中出现的概率.(1988研考) 44.若随机变量X在(1,6)上服从均匀分布,则方程y2+Xy+1=0有实根的概率是多少?(19研考) 45.若随机变量X~N(2,σ2),且P{2 46.假设一厂家生产的每台仪器,以概率0.7可以直接出厂;以概率0.3需进一步调试,经调试后以概率0.8可以出厂,以概率0.2定为不合格品不能出厂.现该厂新生产了n(n≥2)台仪器(假设各台仪器的生产过程相互).求 (1) 全部能出厂的概率α; (2) 其中恰好有两台不能出厂的概率β; (3)其中至少有两台不能出厂的概率θ. (1995研考) 47.某地抽样调查结果表明,考生的外语成绩(百分制)近似服从正态分布,平均成绩为72分,96分以上的占考生总数的2.3%,试求考生的外语成绩在60分至84分之间的概率(.1990研考) 48.在电源电压不超过200V、200V~240V和超过240V三种情形下,某种电子元件损坏的概率分别为0.1,0.001和0.2(假设电源电压X服从正态分布N(220,252)).试求: (1) 该电子元件损坏的概率α; (2) 该电子元件损坏时,电源电压在200~240V的概率β.(1991研考) 49.设随机变量X在区间(1,2)上服从均匀分布,试求随机变量Y=e2X的概率密度fY(y).(1988研考) 50.设随机变量X的密度函数为 24 ex,x0,fX(x)= 0,x0.求随机变量Y=eX的密度函数fY(y). (1995研考) 51.设随机变量X的密度函数为 fX(x)= 1, 2π(1x)求Y=1-3x的密度函数fY(y). (1988研考) 52.假设一大型设备在任何长为t的时间内发生故障的次数N(t)服从参数为λt的泊松分布. (1) 求相继两次故障之间时间间隔T的概率分布; (2) 求在设备已经无故障工作8小时的情形下,再无故障运行8小时的概率Q.(1993研考) 53.设随机变量X的绝对值不大于1,P{X=-1}=1/8,P{X=1}=1/4.在事件{-1 25 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务