非参数假设检验补充例题

符号检验的补充例题

1

例1 对同一种药用植物的有效成份,用 两种不同的测定方法,共测20对,结果如下: A

48.0

33.0

B

37.0

41.0

差的符号

37.5 48.0 42.5

40.0 42.0

23.4 17.0 31.5

40.0 31.0

+ - + + +

0

+

0

2

36.0

36.0

11.3 22.0

5.7 11.5

36.0 27.3 14.2 32.1 52.0

38.0 17.3

21.0 6.1 26.5 21.3 44.5

28.0 22.6

+ + + +

+ + +

0

20.0 21.0 46.1

20.0 11.0 22.3

+ +

3

n+=14,n-=3,n0=3, n=17 问:两种测量方法是否有显著 差异?(α=0.10) 解:查表得 c=13,d=17-13=4 n+=14>13=c 拒绝原假设, 两种测量方法有显著差异.

4

例2 工厂有两个化验室,每天同时 从工厂的冷却水中取样,测定水中的

含氯量(ppm),下表是11天的记录,试

问两个化验室的测定结果在显著性水平 α=0.10下有无显著性差异?

5

日期 1

2 3

化验室A(xi) 化验室B(yi) 符号 1.15 1.00 +

1.86 0.76

1.90 0.90

4 5 6 7 8

9

1.82 1.24 1.65 1.92 1.01

1.12

1.80

1.20 1.70 1.95

- - +

1.02

1.23

+ - - -

- - -

10 11

0.90 1.40

0.97 1.52

6

解: n+=3,n-=8,n0=0, n=11 查表得 c=9,d=11-9=2 d=2

7

例3 从生产线上随机抽取10根纤维 作强力测验,得数据如下: 140.6, 146.2, 150.3, 144.4, 128.1, 139.7, 134.1, 124.3, 147.9, 143.0 问纤维强度的中位数是否为140?

(  0.10)

8

解:

H 0 : m  140 ; H1 : m  140

-11.9, 3.0

作差数 xi  140 ,得 0.6, 6.2, 10.3, 4.4, -0.3, -5.9, -15.7, 7.9,

n  6, n  4, n  n  10.

查符号检验表

c  9, d  1.

1  n  9

接受原假设.

9

优点:

1.简单、直观 2.不要求知道被检验量所服从的分布

缺点:

1.精度较差,未充分利用样本所提供的 信息 2.要求数据搭配成对

10

拟合优度检验的补充例题

11

例1 交通部门统计事故与星期的关系 得到 星期:一 二 三 四 五 六 日 次数:36 23 29 31 34 60 25 问事故发生的可能性是否相同?(α=0.05) 解:P  X  j   p j , j  1, 2,

1 H 0 : p j  , j  1, 2, , 7 7 H1 : 事故的发生与星期有关

12

,7

列表计算如下

星期

实际频数 n j

一 二 36 23

概率 p j

1/7 1/7

理论频数 np j

34 34

四 五

29

31 34

1/7

1/7 1/7

34

34 34

六 日

总和

60 25

238

1/7 1/7

1

34 34

238

13

1  n n  7  j 7  2    26.941 1 j 1 n 7 2  12.592  6  0.05

2

拒绝H0,即事故发生可能性不同,的 确与星期有关

14

例2 孟德尔豌豆试验中,发现黄色豌豆有25个, 绿色豌豆有11个,试在显著性水平α=0.05下 检验黄色豌豆与绿色豌豆数目之比为3:1这个比例. 解:定义随机变量

1,若豌豆为黄色, X  0,若豌豆为绿色.

记P{X  1}  p1,P{X  0}  p2,则提出如下假设

3 1 H 0 : p1  , p2  4 4

15

列表计算如

豌豆颜色 黄色 绿色 总和

实际频数n j

概率p j

理论频数np j

25 11 36

3/4 1/4 1

27 9 36

16

 

2 j 1

7

n

j

 np j  np j

2

 0.593

 3.842    0.05

2 1

接受H0,即认为黄色豌豆与绿色豌豆 数目之比为3:1.

17

例3 某电话交换台一小时内接到用户呼叫次数 按照每分钟记录如下: 呼叫次数: 0 1 2 3 4 5 6  7 频数: 8 16 17 10 6 2 1 0 试问这个分布能否认为是泊松分布?(α=0.05)

解:参数为  的泊松分布列为  i  P{ X  i}  e , i  0,1, 2 i!  的最大似然估计为

ˆ 2

18

ˆ ˆ 将  2代入计算pi 分别为

ˆ pi  ˆi  i!

e , i  0,1, 2,

ˆ 

,6

ˆ p7  

i 7

i

i!

e



19

x=i 0 1 2 3 4 5 6

≥7

ni 8 16 17 10 6 2 1 0

ˆ pi

ˆ npi

ˆ ˆ  ni  npi  / npi

2

0.13534 0.27067 0.27067 0.18045 0.09022 0.03609 0.01203 0.00453

8.1201 16.2402 16.2402 10.8268 5.4134 2.1654 0.7218 0.2720

0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0158

合计 60

1.0000

60

0.5595

20

 

2

n

j

ˆ  np j  ˆ np j

2

 0.5595

 12.592  

2 k  r 1

 0.05    0.05

2 6

接受H0,即认为观测数据服从泊松分布

21

例4 卢瑟福在2608个相等时间间隔 (7.5秒)内观测了一放射性物质放射的

粒子数X,下表中的ni是观测到i个粒子

的时间间隔数(最后一项已经合并), 试检验观测数据是否服从泊松分布? α=0.05

22

x=i 0 1 2 3 4 5 6 7 8 9 10

≥11

ni 57 203 383 525 532 408 273 139 45 27 10 6

23

解: 参数为的泊松分布为

k! 由原始数据算得的最大似然估计为 ˆ   x  3.870

 

2 i 1 12

P( X  k ) 

k

e



ˆ  ni  npi  ˆ npi

2

 12.8967   (0.05)  18.307

2 10

接受H0,认为观测数据服从 泊松分布

24

x=i

ni

pi

npi

ˆ  ni  npi 

2

ˆ / npi

0 1 2 3 4 5 6 7 8 9 10

≥11

57 203 383 525 532 408 273 139 45 27 10 6

0.0209 0.0807 0.1562 0.2015 0.1950 0.1509 0.0973 0.0538 0.0260 0.0112 0.0043 0.0022

54.5 210.5 407.4 525.5 508.6 393.5 253.8 140.3 67.8 29.2 11.2 5.7

0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0120 7.6673 0.1658 0.1286 0.0158

25

例5 某公司的考勤员试图证实星期 一的缺勤是其他工作日缺勤的两倍, 已经有三月的缺勤记录如下表所示? (α=0.05)

日期 星期 星期 星期 星期 星期 一 二 三 四 五 176 139 141 130

缺勤数 304

26

解:因为缺勤比例为2:1:1:1:1,因此 2 1 H 0 : P( X  1)  , P( X  i)  , i  2, 3, 4, 5 6 6

1  1  1  304  890   176  890    139  890    3  6  6 2     1 1 1 890  890  890  3 6 6

2 2 2 2 2

1  1  141  890    130  890   6  6 2    8.5542  9.488   4  0.05 

1 1 890  890  6 6

接受H0,可以认为星期一的缺勤是其 他工作日缺勤的两倍

27

独立性检验的补充例题

28

例1 有1000人按照性别与色盲分类如下

男 女 合计 正常 442 514 956 色盲 38 6 44 合计 480 520 1000

试在显著性水平0.01下检验色盲与性别 的关系? 解: 提出假设 H0:色盲与性别是相互独立的

29

检验统计量

  L (nik ) 2   n    1   (1)   i 1 k 1 ni n k 

2 2 2 2

拒绝域

  2 2 (nik )2  2    W  n    1  0.01 (1)    i 1 k 1 ni n k    

2 1

其中n  1000, (0.01)  6.635 ,计算得

30

 2 2 (nik )2   (n11 ) 2 (n12 ) 2 (n21 ) 2 (n22 ) 2  n    1  1000      1  n1 n 1 n1 n 2 n2 n 1 n2 n 2   i 1 k 1 ni n k   4422  382 5142 62  1000      1  480  956 480  44 520  956 520  44   1000  0.4257  0.0684  0.5315  0.0016  1  27.2

由于27.2>6.635,因此拒绝原假设, 表明色盲与性别有关系.

31

符号检验的补充例题

1

例1 对同一种药用植物的有效成份,用 两种不同的测定方法,共测20对,结果如下: A

48.0

33.0

B

37.0

41.0

差的符号

37.5 48.0 42.5

40.0 42.0

23.4 17.0 31.5

40.0 31.0

+ - + + +

0

+

0

2

36.0

36.0

11.3 22.0

5.7 11.5

36.0 27.3 14.2 32.1 52.0

38.0 17.3

21.0 6.1 26.5 21.3 44.5

28.0 22.6

+ + + +

+ + +

0

20.0 21.0 46.1

20.0 11.0 22.3

+ +

3

n+=14,n-=3,n0=3, n=17 问:两种测量方法是否有显著 差异?(α=0.10) 解:查表得 c=13,d=17-13=4 n+=14>13=c 拒绝原假设, 两种测量方法有显著差异.

4

例2 工厂有两个化验室,每天同时 从工厂的冷却水中取样,测定水中的

含氯量(ppm),下表是11天的记录,试

问两个化验室的测定结果在显著性水平 α=0.10下有无显著性差异?

5

日期 1

2 3

化验室A(xi) 化验室B(yi) 符号 1.15 1.00 +

1.86 0.76

1.90 0.90

4 5 6 7 8

9

1.82 1.24 1.65 1.92 1.01

1.12

1.80

1.20 1.70 1.95

- - +

1.02

1.23

+ - - -

- - -

10 11

0.90 1.40

0.97 1.52

6

解: n+=3,n-=8,n0=0, n=11 查表得 c=9,d=11-9=2 d=2

7

例3 从生产线上随机抽取10根纤维 作强力测验,得数据如下: 140.6, 146.2, 150.3, 144.4, 128.1, 139.7, 134.1, 124.3, 147.9, 143.0 问纤维强度的中位数是否为140?

(  0.10)

8

解:

H 0 : m  140 ; H1 : m  140

-11.9, 3.0

作差数 xi  140 ,得 0.6, 6.2, 10.3, 4.4, -0.3, -5.9, -15.7, 7.9,

n  6, n  4, n  n  10.

查符号检验表

c  9, d  1.

1  n  9

接受原假设.

9

优点:

1.简单、直观 2.不要求知道被检验量所服从的分布

缺点:

1.精度较差,未充分利用样本所提供的 信息 2.要求数据搭配成对

10

拟合优度检验的补充例题

11

例1 交通部门统计事故与星期的关系 得到 星期:一 二 三 四 五 六 日 次数:36 23 29 31 34 60 25 问事故发生的可能性是否相同?(α=0.05) 解:P  X  j   p j , j  1, 2,

1 H 0 : p j  , j  1, 2, , 7 7 H1 : 事故的发生与星期有关

12

,7

列表计算如下

星期

实际频数 n j

一 二 36 23

概率 p j

1/7 1/7

理论频数 np j

34 34

四 五

29

31 34

1/7

1/7 1/7

34

34 34

六 日

总和

60 25

238

1/7 1/7

1

34 34

238

13

1  n n  7  j 7  2    26.941 1 j 1 n 7 2  12.592  6  0.05

2

拒绝H0,即事故发生可能性不同,的 确与星期有关

14

例2 孟德尔豌豆试验中,发现黄色豌豆有25个, 绿色豌豆有11个,试在显著性水平α=0.05下 检验黄色豌豆与绿色豌豆数目之比为3:1这个比例. 解:定义随机变量

1,若豌豆为黄色, X  0,若豌豆为绿色.

记P{X  1}  p1,P{X  0}  p2,则提出如下假设

3 1 H 0 : p1  , p2  4 4

15

列表计算如

豌豆颜色 黄色 绿色 总和

实际频数n j

概率p j

理论频数np j

25 11 36

3/4 1/4 1

27 9 36

16

 

2 j 1

7

n

j

 np j  np j

2

 0.593

 3.842    0.05

2 1

接受H0,即认为黄色豌豆与绿色豌豆 数目之比为3:1.

17

例3 某电话交换台一小时内接到用户呼叫次数 按照每分钟记录如下: 呼叫次数: 0 1 2 3 4 5 6  7 频数: 8 16 17 10 6 2 1 0 试问这个分布能否认为是泊松分布?(α=0.05)

解:参数为  的泊松分布列为  i  P{ X  i}  e , i  0,1, 2 i!  的最大似然估计为

ˆ 2

18

ˆ ˆ 将  2代入计算pi 分别为

ˆ pi  ˆi  i!

e , i  0,1, 2,

ˆ 

,6

ˆ p7  

i 7

i

i!

e



19

x=i 0 1 2 3 4 5 6

≥7

ni 8 16 17 10 6 2 1 0

ˆ pi

ˆ npi

ˆ ˆ  ni  npi  / npi

2

0.13534 0.27067 0.27067 0.18045 0.09022 0.03609 0.01203 0.00453

8.1201 16.2402 16.2402 10.8268 5.4134 2.1654 0.7218 0.2720

0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0158

合计 60

1.0000

60

0.5595

20

 

2

n

j

ˆ  np j  ˆ np j

2

 0.5595

 12.592  

2 k  r 1

 0.05    0.05

2 6

接受H0,即认为观测数据服从泊松分布

21

例4 卢瑟福在2608个相等时间间隔 (7.5秒)内观测了一放射性物质放射的

粒子数X,下表中的ni是观测到i个粒子

的时间间隔数(最后一项已经合并), 试检验观测数据是否服从泊松分布? α=0.05

22

x=i 0 1 2 3 4 5 6 7 8 9 10

≥11

ni 57 203 383 525 532 408 273 139 45 27 10 6

23

解: 参数为的泊松分布为

k! 由原始数据算得的最大似然估计为 ˆ   x  3.870

 

2 i 1 12

P( X  k ) 

k

e



ˆ  ni  npi  ˆ npi

2

 12.8967   (0.05)  18.307

2 10

接受H0,认为观测数据服从 泊松分布

24

x=i

ni

pi

npi

ˆ  ni  npi 

2

ˆ / npi

0 1 2 3 4 5 6 7 8 9 10

≥11

57 203 383 525 532 408 273 139 45 27 10 6

0.0209 0.0807 0.1562 0.2015 0.1950 0.1509 0.0973 0.0538 0.0260 0.0112 0.0043 0.0022

54.5 210.5 407.4 525.5 508.6 393.5 253.8 140.3 67.8 29.2 11.2 5.7

0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0120 7.6673 0.1658 0.1286 0.0158

25

例5 某公司的考勤员试图证实星期 一的缺勤是其他工作日缺勤的两倍, 已经有三月的缺勤记录如下表所示? (α=0.05)

日期 星期 星期 星期 星期 星期 一 二 三 四 五 176 139 141 130

缺勤数 304

26

解:因为缺勤比例为2:1:1:1:1,因此 2 1 H 0 : P( X  1)  , P( X  i)  , i  2, 3, 4, 5 6 6

1  1  1  304  890   176  890    139  890    3  6  6 2     1 1 1 890  890  890  3 6 6

2 2 2 2 2

1  1  141  890    130  890   6  6 2    8.5542  9.488   4  0.05 

1 1 890  890  6 6

接受H0,可以认为星期一的缺勤是其 他工作日缺勤的两倍

27

独立性检验的补充例题

28

例1 有1000人按照性别与色盲分类如下

男 女 合计 正常 442 514 956 色盲 38 6 44 合计 480 520 1000

试在显著性水平0.01下检验色盲与性别 的关系? 解: 提出假设 H0:色盲与性别是相互独立的

29

检验统计量

  L (nik ) 2   n    1   (1)   i 1 k 1 ni n k 

2 2 2 2

拒绝域

  2 2 (nik )2  2    W  n    1  0.01 (1)    i 1 k 1 ni n k    

2 1

其中n  1000, (0.01)  6.635 ,计算得

30

 2 2 (nik )2   (n11 ) 2 (n12 ) 2 (n21 ) 2 (n22 ) 2  n    1  1000      1  n1 n 1 n1 n 2 n2 n 1 n2 n 2   i 1 k 1 ni n k   4422  382 5142 62  1000      1  480  956 480  44 520  956 520  44   1000  0.4257  0.0684  0.5315  0.0016  1  27.2

由于27.2>6.635,因此拒绝原假设, 表明色盲与性别有关系.

31


相关文章

  • 深入理解假设检验原理
  • 教学参考 深入理解假设检验原理 康铁祥 &上海财经大学 统计学系,上海 !4447,+ 摘要:本文通过一道假设检验问题引入了对假设检验原理的思考.文中作者对假设检验中的两类错误及原假设与备择假设之间的关系进行了深入的分析. 关键词: ...查看


  • 体育统计学
  • 体育统计学 1.体育统计:是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科,属方法论学科范畴.2.总体:是根据统计研究的具体研究目的而确定的同质对象的全体 3.样本:是根据需要与可能从总体中抽取的部分研究对 ...查看


  • 医学统计学_总结_重点_笔记_复习资料
  • 第一章 2选1 总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合.可分为有限总体和无限总体.总体中的所有单位都能够标识者为有限总体,反之为无限总体. 总体population根据 ...查看


  • 概率论与数理统计知识点总结
  • <概率论与数理统计> 第一章随机事件及其概率 §1.1 随机事件 一.给出事件描述,要求用运算关系符表示事件: 二.给出事件运算关系符,要求判断其正确性: §1.2 概率 古典概型公式:P (A )= A 所含样本点数Ω所含样本 ...查看


  • 概率论与数理统计知识点总结! 1
  • <概率论与数理统计> 第一章随机事件及其概率 §1.1 随机事件 一.给出事件描述,要求用运算关系符表示事件: 二.给出事件运算关系符,要求判断其正确性: §1.2 概率 古典概型公式:P (A )= A 所含样本点数Ω所含样本 ...查看


  • [统计学]重点归纳
  • <统计学>期末重点 1. 统计学的类型和不同类型的特点 统计数据:按所采用的计量尺度不同分: (1)(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述: (2)(定性数据 ...查看


  • 六西格玛黑带考试辅导
  • 从今天起,介绍六西格玛黑带考试的各章考试重点. 第一章 六西格玛管理概论 重点:烦·········· 1.质量管理发展的三个阶段: 2.质量大师的贡献 3.戴明14点 4.朱兰质量管理三部曲 5.田口四大技术.QLF概念.设计三阶段. 6 ...查看


  • 统计学第三版
  • 1统计学:统计学(statistics)是一门收集.整理.显示和分析统计数据的科学,其目的是探索数据内在的数量规律.其统计的数据不是指个别的单个数字,而是指同类的较数据,离开了数据统计方法那只统计学就失去了其存在的意义 2中心极限定理:设均 ...查看


  • 统计学第四版综合复习(公式)
  • 1. 统计学:是收集.汇总和分析统计数据的科学和艺术. 2. 统计推断的方法探索数据内在规律的过程. 3.普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查.工业普查.农业普查等. 4.抽样调查的特点:经济性:时效性高:适应面广: ...查看


热门内容