第04章概率随机变量

第4章概率

随机试验：对随机现象的客观观测。随机试验具有（1）可重复性；（2）可观测性；（3）随机性。

样本空间：随机试验的所有结果的集合称作样本空间。

概率的统计定义：在不变的一组条件下，重复进行n 次试验。当n 充分大时，若事件A 发生的频率稳定地在某个常数p 附近摆动，且一般来说，n 越大，摆动幅度越小，则称常数p 为事件A 的概率，记为P(A) = p。（如，投硬币，求正面朝上的概率。）

概率的古典定义：若A 1, A2, …, An 构成一个等可能完备事件组，而事件B 是由其中m 个基本事件构成，则事件B 的概率用下式表示。 P(B) = m / n

（投色子中求某个点的概率。）

客观概率：由可重复试验定义的概率为客观概率。（如投硬币时，正面朝上的概率，某次火车晚点的概率，某校学生每年通过英语4级的概率，某段公路上车辆发生交通事故的概率等。）概率的统计定义和古典定义都指的是客观概率。

主观概率：是对概率的主观解释。常用于不可重复试验的事件。（某学生来年能考上大学的概率，某市某天下雨的概率。）

相互独立：若两个事件积的概率等于这两个事件概率的积，即 P(A B) = P(A) P(B) 则称事件A ，B 相互独立。（例A 、B 表示两粒麦种各自发芽的概率。显然A 、B 相互独立，且相容。）

互不相容：若事件A ，B 不能同时发生则称事件A ，B 为互不相容事件。（投色子中“1点”和“2点”是互不相容事件。但“1点” 和“奇数点”是相容事件。）

注意：“相互独立” 和“互不相容”是两个不同的概念，不要混淆。互不相容事件一般不是相互独立事件。

因为对于两个相互独立事件A ，B ，有P(A) >0，P(B) >0。则P(A B) = P(A) P(B) > 0。当A ，B 为互不相容事件时，必有P(A B) = 0，不能满足相互独立的条件。

见61页例1。

条件概率：在事件A 已经发生的条件下，事件B 发生的概率称作事件B 在给定事件A 下的条件概率。表示为P(B|A) 。

利用概率的古典定义求概率时，完备事件组内的基本事件必须是等概的。下面介绍一种基本事件不一定是等概的求概率问题。

贝努里试验过程

若一个随机试验只含有两种相互对立的可能结果，则称作贝努里（Bernoulli ）试验。如一个篮球运动员投篮命中率为0.7，非命中率为0.3，投篮一次，结果可能是“投中”也可能是“未投中”。这就是一次贝努里试验。观察一个灯泡使用寿命低于还是高于100小时也是一次贝努里试验。实际中，常常不是只考察一次贝努里试验，而是连续考察多次。把这样的序列称作贝努里试验序列。

贝努里试验过程：在n 次贝努里试验中，假设每次试验结果与其他各次试验结果无关，且每次试验中该试验结果出现的概率都是p, （0

例1：一批小麦种子的发芽率为0.95，取10粒种子做发芽试验。求结果有8粒种子发芽的概率。

解：每粒种子种下后是否发芽都是一次贝努里试验。若取10粒种子做发芽试验，则每粒种子是否发芽是相互独立的。10粒种子中有8粒发芽的可能结果的概率是

P(A1, A2, …, A10) = P(A1) P(A2) … P(A10) = 0.958 ⨯ 0.052 = 0.00165855。

10粒种子中有8粒发芽的可能结果共有C 10种。因为C 10种结果相互独立，所以10粒种

子中有8粒发芽的概率是

P(8) = C 10⨯ 0.00165855 = 0.07463

第5章随机变量及其数字特征

在上一章，介绍的事件概率都是对某一事件而言。人们自然想到，对整个样本空间内各个事件的概率取值又如何呢？这就是随机变量的概率分布问题。随机变量及其分布的研究是以事件及其概率的研究为基础展开的。它是统计推断的理论基础。随机变量就是随机试验中被测量的量。随机试验每出现一个基本事件，随机变量就相应取一个实数值。从数学意义上讲，随机变量就是定义在样本空间上的函数。随机变量取各种可能值的概率称作随机变量的概率分布。

随机变量定义（1）：按一定的概率取不同实数值的变量称为随机变量，用x , y 等表示。随机变量定义（2）：样本空间内每一个可能结果ω都唯一地对应着一个实数x (ω) ，则称实数值变量x (ω) 为随机变量。常用x , y 等表示。

如（1）天津站每日的客流人数。（2）某商场日销售电视机台数。（3）某储蓄所的日存款余额。（4）某地区居民的日用水量。（5）高速公路上单位时间内通过的机动车数量。（6）流水线上生产的罐装啤酒的净重值。

若随机变量x 可能取的值为有限个或可列个，则称x 为离散型随机变量。若随机变量x 可能取的值是整个数轴，或数轴上的某个区间，则称x 为连续型随机变量。连续型随机变量的概率分布是通过随机变量在一切可能区域内取值的概率定义的。最常用和最简便的形式是通过概率密度函数表示。

对于随机变量x ，若存在非负可积函数f (x ) ，（- ∞

P{a ≤ x ≤ b } =

⎰a f (x ) dx

则称x 为连续型随机变量。f (x ) 为x 的概率密度函数（简称概率密度或密度）。由上式知f (x ) 在[a , b ]区间上的积分等于随机变量x 在[a , b ]区间取值的概率。

研究经济问题为什么还要学习随机变量？因为许多经济问题都符合随机变量的要求。通过随机变量把经济问题上升到统计理论高度进行研究，有利于找到经济变量变化的一般规律。（例：勾三股四弦五。周朝的商高发现了勾股定理。）

5.1随机变量的数学期望

对于离散型随机变量x ，若有概率分布

P{x = x i } = p i , (i = 1, 2, …, )

则称

∑

x i pi

为x 的数学期望，简称为期望或均值。记作E(x ) 。

对于连续型随机变量x ，若密度函数为f (x ) ，则称

⎰a xf (x ) dx

为x 的数学期望。记作E(x ) 。

期望属于位置特征。用来描述随机变量取值的集中位置。体现了随机变量取值的平均大小。期望就是随机变量取一切可能值的加权平均。其中的权数就是概率值。数学期望的性质如下：

(1) 常量的期望就是这个常量本身。 E(k ) = k

(2) 常量与随机变量和的期望等于这个随机变量的期望与这个常量的和。 E(x + k ) = E(x ) + k

(3) 常量与随机变量乘积的期望等于这个常量与随机变量期望的乘积。 E(k x) = k E(x )

(4) 随机变量的线性函数的期望等于这个随机变量期望的同一线性函数。 E(k x + c ) = k E(x ) + c

(5) 两个随机变量和（或差）的期望等于这两个随机变量期望的和（或差）。 E(x ± y ) = E(x ) ± E(y )

(6) 两个相互独立随机变量乘积的期望等于这两个随机变量期望的乘积。 E(x y) = E(x ) E(y )

5.2随机变量的方差、标准差

随机变量x 对其均值的离差平方的数学期望，

E[x - E(x ) ]2 称作随机变量x 的方差。记作Var(x ) 。(x ) 则称作x 的标准差。方差和标准差用来描述随机变量的离散特征。它们反映了随机变量取值离散程度的大小。

对于离散型随机变量x ，方差的定义是 Var(x ) =

∑(x i - E(x ) )2 p i

其中p i 表示x 取x i 值时的概率。

对于连续型随机变量x ，方差的定义是

Var(x ) =

⎰-∞[x - E(x ) ] f (x ) dx

∞

其中f (x ) 是x 的概率密度函数。

注意：（1）Var(x ) 的量纲是x 的量纲的平方。（2）(x ) 的量纲与x 的量纲相同。随机变量方差的性质： (1) 常量的方差为零。

Var(k ) = 0

(2) 随机变量与常量之和的方差等于这个随机变量的方差。

Var(x + k ) = Var(x )

其中x 为随机变量，k 为常量。

(3) 常量与随机变量乘积的方差等于这个常量的平方与随机变量方差的乘积。

Var(k x) = k 2 Var(x )

其中k 为常量。

证明：由方差定义

Var(k x) = E[k x - E(k x) ]2 = E[k x - k E(x ) ]2 = k 2 E[x - E(x ) ]2 = k 2 Var(x ) (4) 随机变量的方差等于这个随机变量平方的期望减其期望的平方。

Var (x ) = E(x 2) – [E(x )]2 证明：由方差定义

Var(x ) = E[x - E(x ) ]2 = E[x 2 – 2 x E(x ) + [E(x )]2] = E(x 2) – 2 E(x ) E(x ) + (E(x )) 2 = E(x 2) – (E(x )) 2

(5) 两个相互独立随机变量之和（或差）的方差等于这两个随机变量方差的和。 Var (x ± y ) = Var (x ) + Var (y )

下面证明随机变量之差情形。

证明：由方差定义

Var (x - y ) = E[(x - y ) – E (x - y ) ]2 = E[x - y – E(x ) - E (y ) ]2 = E[(x – E(x ) ) - (y - E (y ) ) ]2

= E[(x – E(x )) 2 + (y - E (y )) 2 – 2 (x – E(x )) (y - E(y )) ] = Var (x ) + Var (y ) – 2 E[(x – E(x )) (y - E(y ))]

其中E (x – E(x )) (y - E(y )) 是随机变量x 与y 的协方差。因为x 与y 相互独立，所以E[ (x – E(x )) (y - E(y ))] = 0（见下面第3小节，随机变量的协方差）。上式的结果是

Var (x - y ) = Var (x ) + Var (y )

注意：两个相互独立随机变量差的方差不等于这两个随机变量方差的差。

(6) 由性质（5）有如下结论：若两个随机变量是相互非独立的，其和与差的方差公式是，

Var (x + y ) = Var (x ) + Var (y ) + 2 Cov(x, y) Var (x - y ) = Var (x ) + Var (y ) - 2 Cov(x, y)

其中Cov(x, y) 表示x 与y 的协方差（协方差概念见下）。

5.3 随机变量的协方差

协方差定义：随机变量x , y 分别对其均值的离差乘积的数学期望

E [(x - E(x )) (y - E(y ))]

称作随机变量x , y 的协方差，记作Cov(x, y)。其中E(x ), E(x ) 分别表示x , y 的期望。协方差用来描述两个随机变量关系的紧密程度。

对于离散型随机变量x , y ，协方差定义为

Cov(x, y) =

∑∑(x - E(x )) (y - E(y )) p (x , y)

i j

其中p (x i , y j ) = P(x = x i , y = y j ) 表示x = x i , y = y j 条件下的概率。上式是协偏差[ x i - E(x ) ][y j - E(y )]的加权平均。

对于连续型随机变量x , y ，协方差定义为

Cov(x , y ) =

⎰-∞⎰-∞(x - E(x ) ) (y - E(y ) ) p (x , y ) dx dy

∞∞

其中p (x , y ) 是x , y 的概率密度函数。

当x , y 相互独立时，Cov(x , y ) = 0。协方差的大小与x , y 的量纲有关。一般来说，改变x , y 的量纲，则x , y 协方差的值也要改变。因此协方差所提供的主要信息是正值、负值还是零。

注意：虽然两个变量相互独立，意味着协方差为零，但反过来不一定成立，即协方差为零，该两个变量未必独立（但肯定不存在线性相关）。

第6章随机变量的概率分布

6.1 离散型随机变量的概率分布

离散型随机变量的一切可能取值及其取值的相应概率称作离散型随机变量的概率分布。可用表格法和作图法表示。

表格法是：

例2：

仍以例1为例。10粒种子中发芽粒数的样本空间是x = 0, 1, 2, 3, …, 10。用表格法和作图法表示离散型随机变量的概率分布如下。

x 0 1 2 3 4 5 6 7 8 9 10 合计

p 0.000 0.000 0.000 0.000 0.000 0.000 0.00096 0.01047 0.07463 0.31512 0.59873 1.00000

计算公式

p(0) = C100 ⨯ 0.950 ⨯

0.0510 p(1) = C101 ⨯ 0.951 ⨯ 0.059 p(2) = C102 ⨯ 0.952 ⨯ 0.058 p(3) = C103 ⨯ 0.953 ⨯ 0.057 p(4) = C104 ⨯ 0.954 ⨯ 0.056 p(5) = C105 ⨯ 0.955 ⨯ 0.055 p(6) = C106 ⨯ 0.956 ⨯ 0.054 p(7) = C107 ⨯ 0.957 ⨯ 0.053 p(8) = C108 ⨯ 0.958 ⨯ 0.052 p(9) = C109 ⨯ 0.959 ⨯ 0.051 p(10) = C1010 ⨯ 0.9510 ⨯ 0.050

概率分布图

（文件名stat02）

离散型随机变量的概率分布有如下性质：

(1) p i ≥ 0

(2) ∑ pi = 1

二项概率分布：

n 个独立的、同分布的贝努利随机变量之和用x 表示， x = x 1 + x 2 + … + x n 则称x 为二项随机变量。

二项概率函数为，

p (x ) = C n x p x (1- p ) n – x x = 0, 1, 2, …, n 其中C n x =

n !

。则称x 的分布为二项概率分布。（分布图形见88页）。p = 0.5时，为

x ! (n -x )!

对称分布；p > 0.5时，为左偏分布；p

Var(x ) = n p (1- p )

离散型随机变量的累计概率分布：列出随机变量值的累计概率。图形成阶梯形（见68页），为右连续函数。

6.2 连续型随机变量的概率分布（正态分布、t 分布、χ2分布和F 分布） 6.2.1 正态分布与标准正态分布

正态分布定义：若连续型随机变量x 的概率密度函数为

f (x ) =

12πσ

exp(-

(x -μ) 22σ2

)

其中μ, σ为常量，σ > 0，则称x 服从正态分布。记作x ~ N(μ, σ2 ) 。μ, σ分别是x 的数学期望和标准差。可以证明

E(x ) =

⎰-∞

∞

x f (x ) dx =⎰

∞

-∞

12πσ

∞

exp(-

(x -μ) 22σ

) dx = μ

Var (x ) =

⎰-∞

(x - μ) f (x ) dx =

⎰-∞

(x - μ)

12πσ

exp(-

(x -μ) 22σ

) dx = σ 2

(x ) = σ

三种不同参数的正态分布曲线见图1。概率密度函数f (x ) 呈钟形。最大值点在x = μ 处。曲线以x = μ 对称。在x = μ ± σ 处密度函数曲线有拐点。当x → ± ∞ 时，f (x ) 以x 轴为渐近线。当σ 较大时，f (x ) 曲线较平缓；当σ 较小时，f (x ) 曲线较陡峭。已知μ 和 σ的值，就可以完全确定正态分布密度函数。

对某产品的物理量测量常服从于正态分布。

标准正态分布定义：对于正态分布密度函数f (x ) ，当μ = 0，σ = 1时，即

x 2

f 0 (x ) =exp(-)

22π

称连续型随机变量x 服从标准正态分布。记作x ~ N(0, 1 ) 。

对于标准正态分布E(x ) = 0，Var(x ) = (x ) =1。

标准正态分布曲线见图2。标准正态分布密度函数f 0(x)有如下性质：（1） f 0(x) 以纵轴对称；（2）x = 0 时，f 0(x ) 的极大值是 1/π= 0.3989；（3）f 0(x ) 在x = ±1处有两个拐点；

（4）p lim f 0 (x ) = 0。

T →∞

图1 正态分布曲线图2 标准正态分布曲线

正态分布随机变量的标准化。若x ~ N(μ, σ 2 ) ，a , b 为任意实数，且a

P{a ≤ x ≤ b } =

⎰a

12πσ

exp(-

(x -μ) 22σ

) dx

设Z = (x -μ) / σ，则（参见微积分中换元积分法）

P{a ≤ x ≤ b } = P{

a -μ

≤ Z ≤

b -μ

} =σa -μσ

Z 2

exp(-) dZ 22π1

显然Z 是一个服从标准正态分布的随机变量。当x ~ N(μ, σ 2 ) 时，则

Z =

x -μ

~ N(0, 1 )

可见对一般正态分布随机变量x 做变换Z = (x -μ) / σ，则可以把x 转化为服从标准正态

分布的随机变量Z 。

对一般正态分布随机变量x 计算概率非常不方便。通过标准化变换，利用标准正态分布累计概率表，则很容易计算出x 取任意两个值之间的概率。正态分布的线性性质：

① 若x i ~ N (μi , σi 2), (i = 1, 2, …, n ), 且相互独立，则

∑x i ~ N (∑μi , ∑σi 2)

i =1

② 若x i ~ N (μi , σi 2), (i = 1, 2, …, n ) 且相互独立，a i ≠ 0为常数，则

a i xi ~ N (a i μi , a i 2 σi 2 )

连续型随机变量的累计概率分布：用积分法计算连续型随机变量的累计概率。连续型随机变量的累计概率分布函数用F (x ) 表示。定义为

F (x ) = P(x ≤ x i ), (- ∞

练习查正态分布表。

例：P {Z

Z 0.95 = 1.64，- u0.95 = -1.64。

6.2.2 t 分布

如果随机变量x 有如下密度函数，

f (x ) =

γn

⎛x ⎫ 1+⎪ n ⎪⎝⎭

(n +1) /2

其中常量γ n只与n 有关（而不是与x 有关）n = 1, 2, …, 则称连续型随机变量x 服从自由度

为n 的t 分布。

t 分布是连续型的概率分布，并具有一个参数n 。n 称作自由度。n 可以取所有正整数，构成一个t 分布族。服从自由度为n 的t 分布的随机变量用t (n ) 表示。t (n ) 的取值范围是（- ∞, ∞）。

t 分布密度曲线见图4。t 分布以纵轴对称，也呈钟形。当n 为有限值时，t 分布的峰值小于正态分布的峰值，而尾部要比正态分布的厚，即t 分布呈低峰厚尾特征。当t → ∞，t 分布趋近于标准正态分布。实际中，当n > 30，t 分布就很近似于标准正态分布。

t 分布的均值和方差分别为

E(t (n ) ) = 0

Var(t (n

) ) = n / (n -2), n > 2

图4 t 分布密度曲线图5 χ2分布密度曲线

注意：（1）当n ≤ 2时，方差无定义。（2）当n → ∞ 时，Var(t (n ) ) = 1，与标准正态分布的方差相同。t 分布的百分位数可以通过t 分布表（附录2）查到。

练习查t 分布表 (p.427)。

t 0.95(30) = 1.70

6.2.3 χ2分布

如果随机变量x 有如下密度函数，

f (x ) = α n x (n -2) /2e -x /2, x > 0

0, x ≤ 0

其中常量α n只与n 有关（而与x 关）n = 1, 2, …, 则称连续型随机变量x 服从自由度为n 的χ2分布。

χ2（读作“开方”，χ 是希腊字母）分布是连续型的概率分布，并具有一个参数n 。n 是χ2分布的自由度。n 可以取所有正整数，从而构成一个χ2分布族。n 的不同值对应着χ2分布族中不同的具体的χ2分布曲线。服从自由度为n 的χ2分布的随机变量用χ2 (n ) 表示。χ2 (n ) 的取值范围是（0, ∞）。

χ2 (2) , χ2 (3) , χ2 (5) 的分布密度曲线见图5。χ2分布密度曲线是单峰的，右偏倚的。随着自由度n 的加大，偏倚程度变小。当n 增大时，χ2分布的形状趋近于正态分布。

可以证明（略），χ2分布的均值和方差分别为

E(χ2 (n ) ) = n

Var(χ2 (n ) ) = 2 n , n > 2

由上两式知，当n 增大时，χ2分布的均值和方差也分别增大。

注意：χ2分布的百分位数可以在χ2分布表（附表3）中查到。练习查χ2分布表 (p.426)。

例：已知 P{χ2> χ2α（10）} = 0.05，求χ2α。

χ20.95（10） = 18.31

例：P{χ2> χ2α（18）} = 0.01，求χ2α。 χ20.99（18） = 34.81

例：P{χ2> χ2α（18）} = 0.95，求χ2α。

χ20.05（18） = 9.39

6.2.4 F 分布

如果随机变量x 有如下密度函数，

f (x ) = β(n1, n2)

x (n 1-2) /2

(n 1x +n 2)(n +n ) /2

, x > 0

0, x ≤ 0

其中常量 β(n1, n2) 只与n 1和n 2有关（而与x 无关）n = 1, 2, …, 则称连续型随机变量x 服从第1自由度为n 1，第2自由度为n 2的F 分布。

图6 F 分布密度曲线

F 分布是连续型的概率分布，并具有两个参数n 1和n 2 。n 1和n 2是F 分布的两个自由度。n 1称作第1自由度（或分子自由度），n 2称作第2自由度（或分母自由度）。n 1和n 2可以取所有正整数，从而构成一个F 分布族。每个（n 1, n 2）对应着F 分布族中一个不同的具体的分布曲线。服从自由度为n 1和n 2的F 分布的随机变量用F (n 1, n 2) 表示。F (n 1, n 2) 的取值范围是（0, ∞）。

服从F 分布的密度曲线见图6。F 分布密度曲线是单峰的，右偏倚的。随着自由度n 1

和n 2的加大，F 分布的众数趋近于1。

F 分布的分布密度曲线随二个自由度的不同而不同。F 分布表给出了左侧概率 α = 0.9，α = 0.95时，对应F α（临界值）的值，即P （F

F 分布的均值为

E(F (n 1, n 2) ) = n 2 / (n2 - 2) , n 2 > 2

注意：（1）当n 2 ≤ 2时，均值无定义。（2）当n 2增大时，E(F (n 1, n 2) ) 趋近于1。 F 分布的方差为 Var(F (n 1, n 2) ) =

2n 22(n 1+n 2-2) n 1(n 2-2) 2(n 2-4)

, n 2 > 4

注意：（1）当n 2 ≤ 4时，方差无定义。（2）当n 1, n 2增大时，Var(F (n 1, n 2) ) 趋近于零。因为F 分布有两个自由度，所以F 分布是以不同的百分位数分别编表的。附表c-4给出F 分布第95，99百分位数表（相对于α = 0.95 和α = 0.99）。

已知F 分布第95，99百分位数，可利用下式求其第5，1百分位数。

F 1-α (n 1, n2) = 1 / (F α (n 2, n1) )

注意：在上式的分母中n 1, n 2对调了位置。

练习查F 分布表 (p.428)。例：已知 P （F ≤ F 0.95（4，6））= 0.95，求F 0.95（4，6）= ?。查F 分布表，F 0.95（4，6）= 4.5

例：P ( F ≤ F 0.05（6.4）) = 0.05 时，求 F 0.05（6.4）) = ?。

F 0.05 (6，4) = = = 0.22

F 0. 95(4, 6) 4. 53

例：已知 P （F ≤ F 0.99（8，25））= 0.99，求F 0.99（8，25）= ?。

查F 分布表 (p.430)，F 0.99（8，25）= 3.32

注意：t 分布、χ2分布、F 分布是统计推断中常用到的三个统计量。 6.3 随机变量Z 、t 、χ2与F 的关系 1．Z 2 = F (1, ∞) 2．t ( n) 2 = F (1, n ) 3. χ2( n) / n = F (n, ∞)

第7章中心极限定理

第4章介绍过随机事件发生的频率具有稳定性，例如投硬币。在实践中人们还认识到大量观测值的算术平均数也具有稳定性。无论个别随机现象的结果如何，大量随机现象的平均结果实际上与每一个个别随机现象的特征无关。这种平均结果几乎不再是随机的了。

7.1 大数定律

设随机变量x 1, x 2, …, x n 相互独立，服从同一分布，且分别具有相同的期望和方差（有限值），E(x i ) = μ, Var(x i ) = σ 2 (i = 1, 2, …, n ) ，则对于任意正数ε 有

Lim P {|- μ |

n →∞

其中=∑x i 。{|- μ|

n i =1

近于1。随着n 的增加，依概率收敛于μ。

7.2 中心极限定理

设随机变量x 1, x 2, …, x n 相互独立，服从同一分布，且有相同的期望与方差（有限值），E(x i ) = μ, Var (x i ) = σ 2，( i = 1, 2, …, n)，则对于一切实数 a

∑x i -n μ

Lim P {a

n →∞

i =1

n σ

⎰a

12π

u 22

du (7.2)

因为E(∑x i ) = n μ, Var (∑x i ) = n σ ，所以只要n 充分大，无论x i 服从何种分布，∑x i

i =1

近似服从正态分布，即∑x i →N (n μ, n σ 2) 。

i =1

∑x i -n μ

当

i =1

n σ

的分子和分母同除n 时，(2) 式也可写成，

Lim P {

n →∞

-μ

σn

≤ z } =

⎰-∞

12π

u 2

du (7.3)

即服从正态分布，

-μ

σn

服从标准正态分布。当n 充分大时，近似服从正态分布。

7.3 李雅普诺夫（Liapunov ）定理

设随机变量x 1, x 2, …, x n 相互独立，具有有限的数学期望与方差E(x i ) = μi , Var (x i ) = σ 2， (i = 1, 2, …, n ) ，且每个x i 对和式∑x i 影响都不大，则

i =1n

∑x i -∑μi

Lim P {

n →∞

n n

i =1i =1

∑σi 2

i =1

≤ z } =

⎰-∞

12π

u 2

其中 z 为一切实数。这说明一个随机现象有众多随机因素引起，且每一因素都不在变化中起显著作用，那么，当n 充分大时，描述这个随机现象的随机变量∑x i 近似服从正态分布。

i =1n

例1：一个螺丝重量是一个随机变量x i ，E(x i ) = 0.1公斤，Var(x i ) = 0.01公斤2，求一盒（100个）螺丝重量超过12公斤的概率。

解：依据中心极限定理，∑x i 近似服从正态分布。E(∑x i ) = 100⨯0.1=10，V ar(∑x i )

i =1

100

= 100⨯0.01 = 1

100i =1

P {∑x i > 12 } = P{

∑x i -10

i =1

100

12-10

} = 1 - P(Z≤ 2) = 1 - 0.9773 = 0.0227 1

例2 某一部件包括10部分，每部分的长度X 是一个随机变量，它们相互独立，服从同一分布E(X) = 2(cm),(X ) = 0.05, 若规定总长度为20±0.1cm 时为合格品，求该部件为合格品的概率。

解：已知X i ~ N(2, 0.052) 。依据中心极限定理，

P {|∑X i - 20|

i =110

0. 1-0⨯0. 05

} = P{| Z |

= P{ Z

例3：计算机在进行加法时，对每个加数取整，设所有的取整误差是相互独立的，且它们都在（-0.5, 0.5）上服从均匀分布。

（1）若将1500个数相加，问误差总和绝对值超过15的概率是多少？（2）多少个数加在一起，使得误差总和的绝对值小于10的概率为0.90。

解：（1）虽然随机变量取整误差X 是均匀分布的，（E(X) = 0 , Var(X) =

）依据中心极12

限定理可认为1500个取整误差的和是近似正态分布的。（不用）

则 P {|∑X i | > 15 }= 1- P {|∑X i |

i =1

15001500

15-0112

}

= 1 - P {| Z |

10-01Z 12

} = 0.90, 2Ф(10 /Z /12) -1 = 0.90

Ф(10/Z /12) ) = 0.95,

10Z /12

= 1.65,

102Z 10

, Z = (=) ⨯ 12 = 441

121. 651. 65

7.4 拉普拉斯（Laplace ）定理

设X ~ B(u, p)，则对于任意区间 (a, b) 有

L i m P {a

X -np np (1-p )

n →∞

⎰a

12π

n 2

这是中心极限定理的一个特例，二次分布以正态分布为极限。

例4 将一枚硬币连掷100次，计算出现正面的次数大于60的概率。

解每次试验出现正面的概率为0.5，掷100次出现正面的次数X 看作服从二项分布的随机变量。则

X ~ B(100,0.5) 依据拉普拉斯定理

P {X > 60} = P{Z >

60-100⨯0. 5⨯0. 5

} = 1- P{Z

例5 某单位设置一电话总机，共有200台电话，设每台电话有5%的时间要使用外线，假定每个分机是否用外线通话是相互独立的，问总机要设置多少条外线才能以90%的概率保证每台电话随时使用外线。

解：

设同时使用外线的电话台数为X ，据题意 X ~ B(200, 0.05)。设需要设置b 条外线。根据拉普拉斯定理

P {X

P {Z

b -10. 5

b -200⨯0. 05⨯0. 05⨯0. 95b -109. 5

}

} = 0.9

= 1.29 b = 1.29. 5+10 = 14

答：需设置14 条外线。

第4章概率

随机试验：对随机现象的客观观测。随机试验具有（1）可重复性；（2）可观测性；（3）随机性。

样本空间：随机试验的所有结果的集合称作样本空间。

概率的古典定义：若A 1, A2, …, An 构成一个等可能完备事件组，而事件B 是由其中m 个基本事件构成，则事件B 的概率用下式表示。 P(B) = m / n

（投色子中求某个点的概率。）

主观概率：是对概率的主观解释。常用于不可重复试验的事件。（某学生来年能考上大学的概率，某市某天下雨的概率。）

注意：“相互独立” 和“互不相容”是两个不同的概念，不要混淆。互不相容事件一般不是相互独立事件。

因为对于两个相互独立事件A ，B ，有P(A) >0，P(B) >0。则P(A B) = P(A) P(B) > 0。当A ，B 为互不相容事件时，必有P(A B) = 0，不能满足相互独立的条件。

见61页例1。

条件概率：在事件A 已经发生的条件下，事件B 发生的概率称作事件B 在给定事件A 下的条件概率。表示为P(B|A) 。

利用概率的古典定义求概率时，完备事件组内的基本事件必须是等概的。下面介绍一种基本事件不一定是等概的求概率问题。

贝努里试验过程

贝努里试验过程：在n 次贝努里试验中，假设每次试验结果与其他各次试验结果无关，且每次试验中该试验结果出现的概率都是p, （0

例1：一批小麦种子的发芽率为0.95，取10粒种子做发芽试验。求结果有8粒种子发芽的概率。

P(A1, A2, …, A10) = P(A1) P(A2) … P(A10) = 0.958 ⨯ 0.052 = 0.00165855。

10粒种子中有8粒发芽的可能结果共有C 10种。因为C 10种结果相互独立，所以10粒种

子中有8粒发芽的概率是

P(8) = C 10⨯ 0.00165855 = 0.07463

第5章随机变量及其数字特征

对于随机变量x ，若存在非负可积函数f (x ) ，（- ∞

P{a ≤ x ≤ b } =

⎰a f (x ) dx

5.1随机变量的数学期望

对于离散型随机变量x ，若有概率分布

P{x = x i } = p i , (i = 1, 2, …, )

则称

∑

x i pi

为x 的数学期望，简称为期望或均值。记作E(x ) 。

对于连续型随机变量x ，若密度函数为f (x ) ，则称

⎰a xf (x ) dx

为x 的数学期望。记作E(x ) 。

(1) 常量的期望就是这个常量本身。 E(k ) = k

(2) 常量与随机变量和的期望等于这个随机变量的期望与这个常量的和。 E(x + k ) = E(x ) + k

(3) 常量与随机变量乘积的期望等于这个常量与随机变量期望的乘积。 E(k x) = k E(x )

(4) 随机变量的线性函数的期望等于这个随机变量期望的同一线性函数。 E(k x + c ) = k E(x ) + c

(5) 两个随机变量和（或差）的期望等于这两个随机变量期望的和（或差）。 E(x ± y ) = E(x ) ± E(y )

(6) 两个相互独立随机变量乘积的期望等于这两个随机变量期望的乘积。 E(x y) = E(x ) E(y )

5.2随机变量的方差、标准差

随机变量x 对其均值的离差平方的数学期望，

对于离散型随机变量x ，方差的定义是 Var(x ) =

∑(x i - E(x ) )2 p i

其中p i 表示x 取x i 值时的概率。

对于连续型随机变量x ，方差的定义是

Var(x ) =

⎰-∞[x - E(x ) ] f (x ) dx

∞

其中f (x ) 是x 的概率密度函数。

注意：（1）Var(x ) 的量纲是x 的量纲的平方。（2）(x ) 的量纲与x 的量纲相同。随机变量方差的性质： (1) 常量的方差为零。

Var(k ) = 0

(2) 随机变量与常量之和的方差等于这个随机变量的方差。

Var(x + k ) = Var(x )

其中x 为随机变量，k 为常量。

(3) 常量与随机变量乘积的方差等于这个常量的平方与随机变量方差的乘积。

Var(k x) = k 2 Var(x )

其中k 为常量。

证明：由方差定义

Var(k x) = E[k x - E(k x) ]2 = E[k x - k E(x ) ]2 = k 2 E[x - E(x ) ]2 = k 2 Var(x ) (4) 随机变量的方差等于这个随机变量平方的期望减其期望的平方。

Var (x ) = E(x 2) – [E(x )]2 证明：由方差定义

Var(x ) = E[x - E(x ) ]2 = E[x 2 – 2 x E(x ) + [E(x )]2] = E(x 2) – 2 E(x ) E(x ) + (E(x )) 2 = E(x 2) – (E(x )) 2

(5) 两个相互独立随机变量之和（或差）的方差等于这两个随机变量方差的和。 Var (x ± y ) = Var (x ) + Var (y )

下面证明随机变量之差情形。

证明：由方差定义

Var (x - y ) = E[(x - y ) – E (x - y ) ]2 = E[x - y – E(x ) - E (y ) ]2 = E[(x – E(x ) ) - (y - E (y ) ) ]2

= E[(x – E(x )) 2 + (y - E (y )) 2 – 2 (x – E(x )) (y - E(y )) ] = Var (x ) + Var (y ) – 2 E[(x – E(x )) (y - E(y ))]

Var (x - y ) = Var (x ) + Var (y )

注意：两个相互独立随机变量差的方差不等于这两个随机变量方差的差。

(6) 由性质（5）有如下结论：若两个随机变量是相互非独立的，其和与差的方差公式是，

Var (x + y ) = Var (x ) + Var (y ) + 2 Cov(x, y) Var (x - y ) = Var (x ) + Var (y ) - 2 Cov(x, y)

其中Cov(x, y) 表示x 与y 的协方差（协方差概念见下）。

5.3 随机变量的协方差

协方差定义：随机变量x , y 分别对其均值的离差乘积的数学期望

E [(x - E(x )) (y - E(y ))]

称作随机变量x , y 的协方差，记作Cov(x, y)。其中E(x ), E(x ) 分别表示x , y 的期望。协方差用来描述两个随机变量关系的紧密程度。

对于离散型随机变量x , y ，协方差定义为

Cov(x, y) =

∑∑(x - E(x )) (y - E(y )) p (x , y)

i j

其中p (x i , y j ) = P(x = x i , y = y j ) 表示x = x i , y = y j 条件下的概率。上式是协偏差[ x i - E(x ) ][y j - E(y )]的加权平均。

对于连续型随机变量x , y ，协方差定义为

Cov(x , y ) =

⎰-∞⎰-∞(x - E(x ) ) (y - E(y ) ) p (x , y ) dx dy

∞∞

其中p (x , y ) 是x , y 的概率密度函数。

注意：虽然两个变量相互独立，意味着协方差为零，但反过来不一定成立，即协方差为零，该两个变量未必独立（但肯定不存在线性相关）。

第6章随机变量的概率分布

6.1 离散型随机变量的概率分布

离散型随机变量的一切可能取值及其取值的相应概率称作离散型随机变量的概率分布。可用表格法和作图法表示。

表格法是：

例2：

仍以例1为例。10粒种子中发芽粒数的样本空间是x = 0, 1, 2, 3, …, 10。用表格法和作图法表示离散型随机变量的概率分布如下。

x 0 1 2 3 4 5 6 7 8 9 10 合计

p 0.000 0.000 0.000 0.000 0.000 0.000 0.00096 0.01047 0.07463 0.31512 0.59873 1.00000

计算公式

p(0) = C100 ⨯ 0.950 ⨯

概率分布图

（文件名stat02）

离散型随机变量的概率分布有如下性质：

(1) p i ≥ 0

(2) ∑ pi = 1

二项概率分布：

n 个独立的、同分布的贝努利随机变量之和用x 表示， x = x 1 + x 2 + … + x n 则称x 为二项随机变量。

二项概率函数为，

p (x ) = C n x p x (1- p ) n – x x = 0, 1, 2, …, n 其中C n x =

n !

。则称x 的分布为二项概率分布。（分布图形见88页）。p = 0.5时，为

x ! (n -x )!

对称分布；p > 0.5时，为左偏分布；p

Var(x ) = n p (1- p )

离散型随机变量的累计概率分布：列出随机变量值的累计概率。图形成阶梯形（见68页），为右连续函数。

6.2 连续型随机变量的概率分布（正态分布、t 分布、χ2分布和F 分布） 6.2.1 正态分布与标准正态分布

正态分布定义：若连续型随机变量x 的概率密度函数为

f (x ) =

12πσ

exp(-

(x -μ) 22σ2

)

其中μ, σ为常量，σ > 0，则称x 服从正态分布。记作x ~ N(μ, σ2 ) 。μ, σ分别是x 的数学期望和标准差。可以证明

E(x ) =

⎰-∞

∞

x f (x ) dx =⎰

∞

-∞

12πσ

∞

exp(-

(x -μ) 22σ

) dx = μ

Var (x ) =

⎰-∞

(x - μ) f (x ) dx =

⎰-∞

(x - μ)

12πσ

exp(-

(x -μ) 22σ

) dx = σ 2

(x ) = σ

对某产品的物理量测量常服从于正态分布。

标准正态分布定义：对于正态分布密度函数f (x ) ，当μ = 0，σ = 1时，即

x 2

f 0 (x ) =exp(-)

22π

称连续型随机变量x 服从标准正态分布。记作x ~ N(0, 1 ) 。

对于标准正态分布E(x ) = 0，Var(x ) = (x ) =1。

（4）p lim f 0 (x ) = 0。

T →∞

图1 正态分布曲线图2 标准正态分布曲线

正态分布随机变量的标准化。若x ~ N(μ, σ 2 ) ，a , b 为任意实数，且a

P{a ≤ x ≤ b } =

⎰a

12πσ

exp(-

(x -μ) 22σ

) dx

设Z = (x -μ) / σ，则（参见微积分中换元积分法）

P{a ≤ x ≤ b } = P{

a -μ

≤ Z ≤

b -μ

} =σa -μσ

Z 2

exp(-) dZ 22π1

显然Z 是一个服从标准正态分布的随机变量。当x ~ N(μ, σ 2 ) 时，则

Z =

x -μ

~ N(0, 1 )

可见对一般正态分布随机变量x 做变换Z = (x -μ) / σ，则可以把x 转化为服从标准正态

分布的随机变量Z 。

① 若x i ~ N (μi , σi 2), (i = 1, 2, …, n ), 且相互独立，则

∑x i ~ N (∑μi , ∑σi 2)

i =1

② 若x i ~ N (μi , σi 2), (i = 1, 2, …, n ) 且相互独立，a i ≠ 0为常数，则

a i xi ~ N (a i μi , a i 2 σi 2 )

连续型随机变量的累计概率分布：用积分法计算连续型随机变量的累计概率。连续型随机变量的累计概率分布函数用F (x ) 表示。定义为

F (x ) = P(x ≤ x i ), (- ∞

练习查正态分布表。

例：P {Z

Z 0.95 = 1.64，- u0.95 = -1.64。

6.2.2 t 分布

如果随机变量x 有如下密度函数，

f (x ) =

γn

⎛x ⎫ 1+⎪ n ⎪⎝⎭

(n +1) /2

其中常量γ n只与n 有关（而不是与x 有关）n = 1, 2, …, 则称连续型随机变量x 服从自由度

为n 的t 分布。

t 分布的均值和方差分别为

E(t (n ) ) = 0

Var(t (n

) ) = n / (n -2), n > 2

图4 t 分布密度曲线图5 χ2分布密度曲线

练习查t 分布表 (p.427)。

t 0.95(30) = 1.70

6.2.3 χ2分布

如果随机变量x 有如下密度函数，

f (x ) = α n x (n -2) /2e -x /2, x > 0

0, x ≤ 0

其中常量α n只与n 有关（而与x 关）n = 1, 2, …, 则称连续型随机变量x 服从自由度为n 的χ2分布。

可以证明（略），χ2分布的均值和方差分别为

E(χ2 (n ) ) = n

Var(χ2 (n ) ) = 2 n , n > 2

由上两式知，当n 增大时，χ2分布的均值和方差也分别增大。

注意：χ2分布的百分位数可以在χ2分布表（附表3）中查到。练习查χ2分布表 (p.426)。

例：已知 P{χ2> χ2α（10）} = 0.05，求χ2α。

χ20.95（10） = 18.31

例：P{χ2> χ2α（18）} = 0.01，求χ2α。 χ20.99（18） = 34.81

例：P{χ2> χ2α（18）} = 0.95，求χ2α。

χ20.05（18） = 9.39

6.2.4 F 分布

如果随机变量x 有如下密度函数，

f (x ) = β(n1, n2)

x (n 1-2) /2

(n 1x +n 2)(n +n ) /2

, x > 0

0, x ≤ 0

其中常量 β(n1, n2) 只与n 1和n 2有关（而与x 无关）n = 1, 2, …, 则称连续型随机变量x 服从第1自由度为n 1，第2自由度为n 2的F 分布。

图6 F 分布密度曲线

服从F 分布的密度曲线见图6。F 分布密度曲线是单峰的，右偏倚的。随着自由度n 1

和n 2的加大，F 分布的众数趋近于1。

F 分布的分布密度曲线随二个自由度的不同而不同。F 分布表给出了左侧概率 α = 0.9，α = 0.95时，对应F α（临界值）的值，即P （F

F 分布的均值为

E(F (n 1, n 2) ) = n 2 / (n2 - 2) , n 2 > 2

注意：（1）当n 2 ≤ 2时，均值无定义。（2）当n 2增大时，E(F (n 1, n 2) ) 趋近于1。 F 分布的方差为 Var(F (n 1, n 2) ) =

2n 22(n 1+n 2-2) n 1(n 2-2) 2(n 2-4)

, n 2 > 4

已知F 分布第95，99百分位数，可利用下式求其第5，1百分位数。

F 1-α (n 1, n2) = 1 / (F α (n 2, n1) )

注意：在上式的分母中n 1, n 2对调了位置。

练习查F 分布表 (p.428)。例：已知 P （F ≤ F 0.95（4，6））= 0.95，求F 0.95（4，6）= ?。查F 分布表，F 0.95（4，6）= 4.5

例：P ( F ≤ F 0.05（6.4）) = 0.05 时，求 F 0.05（6.4）) = ?。

F 0.05 (6，4) = = = 0.22

F 0. 95(4, 6) 4. 53

例：已知 P （F ≤ F 0.99（8，25））= 0.99，求F 0.99（8，25）= ?。

查F 分布表 (p.430)，F 0.99（8，25）= 3.32

第7章中心极限定理

7.1 大数定律

Lim P {|- μ |

n →∞

其中=∑x i 。{|- μ|

n i =1

近于1。随着n 的增加，依概率收敛于μ。

7.2 中心极限定理

∑x i -n μ

Lim P {a

n →∞

i =1

n σ

⎰a

12π

u 22

du (7.2)

因为E(∑x i ) = n μ, Var (∑x i ) = n σ ，所以只要n 充分大，无论x i 服从何种分布，∑x i

i =1

近似服从正态分布，即∑x i →N (n μ, n σ 2) 。

i =1

∑x i -n μ

当

i =1

n σ

的分子和分母同除n 时，(2) 式也可写成，

Lim P {

n →∞

-μ

σn

≤ z } =

⎰-∞

12π

u 2

du (7.3)

即服从正态分布，

-μ

σn

服从标准正态分布。当n 充分大时，近似服从正态分布。

7.3 李雅普诺夫（Liapunov ）定理

设随机变量x 1, x 2, …, x n 相互独立，具有有限的数学期望与方差E(x i ) = μi , Var (x i ) = σ 2， (i = 1, 2, …, n ) ，且每个x i 对和式∑x i 影响都不大，则

i =1n

∑x i -∑μi

Lim P {

n →∞

n n

i =1i =1

∑σi 2

i =1

≤ z } =

⎰-∞

12π

u 2

i =1n

例1：一个螺丝重量是一个随机变量x i ，E(x i ) = 0.1公斤，Var(x i ) = 0.01公斤2，求一盒（100个）螺丝重量超过12公斤的概率。

解：依据中心极限定理，∑x i 近似服从正态分布。E(∑x i ) = 100⨯0.1=10，V ar(∑x i )

i =1

100

= 100⨯0.01 = 1

100i =1

P {∑x i > 12 } = P{

∑x i -10

i =1

100

12-10

} = 1 - P(Z≤ 2) = 1 - 0.9773 = 0.0227 1

解：已知X i ~ N(2, 0.052) 。依据中心极限定理，

P {|∑X i - 20|

i =110

0. 1-0⨯0. 05

} = P{| Z |

= P{ Z

例3：计算机在进行加法时，对每个加数取整，设所有的取整误差是相互独立的，且它们都在（-0.5, 0.5）上服从均匀分布。

（1）若将1500个数相加，问误差总和绝对值超过15的概率是多少？（2）多少个数加在一起，使得误差总和的绝对值小于10的概率为0.90。

解：（1）虽然随机变量取整误差X 是均匀分布的，（E(X) = 0 , Var(X) =

）依据中心极12

限定理可认为1500个取整误差的和是近似正态分布的。（不用）

则 P {|∑X i | > 15 }= 1- P {|∑X i |

i =1

15001500

15-0112

}

= 1 - P {| Z |

10-01Z 12

} = 0.90, 2Ф(10 /Z /12) -1 = 0.90

Ф(10/Z /12) ) = 0.95,

10Z /12

= 1.65,

102Z 10

, Z = (=) ⨯ 12 = 441

121. 651. 65

7.4 拉普拉斯（Laplace ）定理

设X ~ B(u, p)，则对于任意区间 (a, b) 有

L i m P {a

X -np np (1-p )

n →∞

⎰a

12π

n 2

这是中心极限定理的一个特例，二次分布以正态分布为极限。

例4 将一枚硬币连掷100次，计算出现正面的次数大于60的概率。

解每次试验出现正面的概率为0.5，掷100次出现正面的次数X 看作服从二项分布的随机变量。则

X ~ B(100,0.5) 依据拉普拉斯定理

P {X > 60} = P{Z >

60-100⨯0. 5⨯0. 5

} = 1- P{Z

解：

设同时使用外线的电话台数为X ，据题意 X ~ B(200, 0.05)。设需要设置b 条外线。根据拉普拉斯定理

P {X

P {Z

b -10. 5

b -200⨯0. 05⨯0. 05⨯0. 95b -109. 5

}

} = 0.9

= 1.29 b = 1.29. 5+10 = 14

答：需设置14 条外线。

第04章概率随机变量

相关文章