独立性检验的思想方法

独立性检验的思想方法

独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.在进行独位性检验时,应注意给定的可靠性的要求,不同的可靠性要求可能会导致得出完全不同的结论.在断言正确时很少发生的结果若发生了,就是断言不正确的证据.一般地,对分类变量的相关

2关系的判断方法有:2×2列联表、二维条形图、三维柱形图和利用随机变量K来确定,与表

格相比,三维柱形图和二维条形图能够更直观地反映出相关数据的总体状况.并能从中清晰地看出各个频数的相对大小关系.三维柱形图和二维条形图因为所表示的关系只是一种粗略的估计,不能够精确地反应有关的两个分类变量的可信程度,因而不常用,并且在实际问题

2的解决中也较为烦琐,故在判断两个分类变量的关系的可靠性时,一般利用随机变量K来

确定的.下面举例说明.

一.二维条形图

在二维条形图中,可以估计满足条件X=x1的个体中具有Y= y1的个体所占的比例ac,也可以估计满足条件X=x2的个体中具有Y= y2的个体所占的比例,两个比例abcd的值相差越大,H1成立的可能性就越大.

例1.有甲、乙两个班级进行一门课程的考试,按照学生的考试成绩优秀和不优秀统计人数后,得到下面的列联表:

请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性假设检验估计判断成绩是否优秀与所在班级是否有关.

分析:本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断.

解:根据列联表的数据,作出二维条形图,如图.

从条形图中可以看出,甲班学生中优秀的人数的比例数为

数的比例为10,乙班学生中优秀的人457,二者差别不是很大,因此我们认为成绩是否优秀与所在的班级没有关系,45

用独立性假设检验来判断,由题意知a=10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90.

代入公式

n(adbc)2

K(ab)(bd)(ac)(cd)2

90(1038735)2

k45451773

0.65.

由于0.65

点拨:在列联表中注意事件的对应关系及有关值的确定,避免混乱.利用图形来判断两个变量之间是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以作两个分类变量关系的粗略的估计,可以结合所求的数值来进行比较.

练习:

1.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关,你所得到的结论在什么范围内有效?

解:根据题目所给的数据作出如下的列联表:

图形法:根据列联表作出相应的二维条形图,如图

从二维条形图来看,在男人中患色盲的比例为386,在女人中患色盲的比例为.又520480

386386>,其差值为|-|≈0.068,差值较大,因而我们可认为性别与患色盲是[1**********]0

有关的.

根据列联表中所给的数据可以有a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式

n(adbc)2

K, (ac)(ad)(bd)(cd)2

1000(385146442)2

27.14,由于K≈27.14 4>10.828, 得k48052044956

所以我们有99.9%的把握认为性别与患色盲有关系.

二. 三维柱形图

在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大,

例2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:

试用三维柱形图分析服用药和患病之间是否有关系.

分析:若要推断的论述为H0:X与Y有关系,可以用三维柱形图来粗略地判断两个分类变量X与Y是 否有关系.

解:根据列联表所给的数据作出三维柱形图如图

,

主对角线上两个柱形的高度a与d的乘积ad=10×30=300,与副对角线上两个柱形高度的乘积bc=20×45=900相差很大,因而服用药与未患病之间有关的程度很大.

点拨:在三维柱形图中,应对主对角线上两个柱形的高度的乘积ad与副对角线上两个柱形高度的乘积bc作比较,两个乘积相差越大,H0成立的可能性就越大.

练习:

2.研究人员选取170名青年大学生的样本,对他们进行一项心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定回答的有22名,否定回答的有38名;男生110名在相同的题目上作肯定回答的有22名,否定回答的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.

解:根据题目所给数据建立如下列联表:

性别与态度的关系列联表

相应的三维柱形图如图,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.

根据列联表中的数据得到

170(22382288)2

k5.6225.024. 1106044126

所以有97.5%的把握认为性别与态度有关.

2三. 利用随机变量K来确定

2解独立性检验问题的基本步骤是:①找出相关数据,作列联表;②求统计量K的观测

值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.

例3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构通过考察160位专业运动员运动前是否做热身运动而得到的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?

n(adbc)2

解:由K (ac)(ab)(cd)(bd)2

160(19207645)2

38.94. k95656496

因为38.974>10.828,所以有99.9%的把握认为运动员受伤与不做热身运动有关. 点拨:独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这

2种判断的可靠程度的一种统计方法.利用这一方法,可以直接用K的观测值解决实际问题.这

里需特别说明的是:K与k的关系并不是k=K2,K是一个随机变量,它在a,b,c,d取不22

同的值时,K可能不同;而k是K的观测值,是取定一组数a、b、c、d后的一个确定的值.

练习:

3.某些行为在运动员的比赛之中往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛时先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛.获得数据如下表:

22

据此资料,你能得出什么结论? n(adbc)2

解:由K , (ac)(ab)(bd)(cd)2

308(178198427)2

1.502. 得k20510326246

因为1.502

在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能错误,这是数学中的统计思维与确定性思维差异的反映,但我们可以利用统计分析的结果去预测实际问题的结果.

独立性检验的思想方法

独立性检验实际上是检验两个分类变量是否相关,相关的程度有多大.在进行独位性检验时,应注意给定的可靠性的要求,不同的可靠性要求可能会导致得出完全不同的结论.在断言正确时很少发生的结果若发生了,就是断言不正确的证据.一般地,对分类变量的相关

2关系的判断方法有:2×2列联表、二维条形图、三维柱形图和利用随机变量K来确定,与表

格相比,三维柱形图和二维条形图能够更直观地反映出相关数据的总体状况.并能从中清晰地看出各个频数的相对大小关系.三维柱形图和二维条形图因为所表示的关系只是一种粗略的估计,不能够精确地反应有关的两个分类变量的可信程度,因而不常用,并且在实际问题

2的解决中也较为烦琐,故在判断两个分类变量的关系的可靠性时,一般利用随机变量K来

确定的.下面举例说明.

一.二维条形图

在二维条形图中,可以估计满足条件X=x1的个体中具有Y= y1的个体所占的比例ac,也可以估计满足条件X=x2的个体中具有Y= y2的个体所占的比例,两个比例abcd的值相差越大,H1成立的可能性就越大.

例1.有甲、乙两个班级进行一门课程的考试,按照学生的考试成绩优秀和不优秀统计人数后,得到下面的列联表:

请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性假设检验估计判断成绩是否优秀与所在班级是否有关.

分析:本题应首先作出调查数据的列联表,再根据列联表画出二维条形图或三维柱形图,并进行分析,最后利用独立性检验作出判断.

解:根据列联表的数据,作出二维条形图,如图.

从条形图中可以看出,甲班学生中优秀的人数的比例数为

数的比例为10,乙班学生中优秀的人457,二者差别不是很大,因此我们认为成绩是否优秀与所在的班级没有关系,45

用独立性假设检验来判断,由题意知a=10,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90.

代入公式

n(adbc)2

K(ab)(bd)(ac)(cd)2

90(1038735)2

k45451773

0.65.

由于0.65

点拨:在列联表中注意事件的对应关系及有关值的确定,避免混乱.利用图形来判断两个变量之间是否有关系,可以画出三维柱形图,也可以画出二维条形图,仅从图形上只可以作两个分类变量关系的粗略的估计,可以结合所求的数值来进行比较.

练习:

1.在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关,你所得到的结论在什么范围内有效?

解:根据题目所给的数据作出如下的列联表:

图形法:根据列联表作出相应的二维条形图,如图

从二维条形图来看,在男人中患色盲的比例为386,在女人中患色盲的比例为.又520480

386386>,其差值为|-|≈0.068,差值较大,因而我们可认为性别与患色盲是[1**********]0

有关的.

根据列联表中所给的数据可以有a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式

n(adbc)2

K, (ac)(ad)(bd)(cd)2

1000(385146442)2

27.14,由于K≈27.14 4>10.828, 得k48052044956

所以我们有99.9%的把握认为性别与患色盲有关系.

二. 三维柱形图

在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大,

例2.为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:

试用三维柱形图分析服用药和患病之间是否有关系.

分析:若要推断的论述为H0:X与Y有关系,可以用三维柱形图来粗略地判断两个分类变量X与Y是 否有关系.

解:根据列联表所给的数据作出三维柱形图如图

,

主对角线上两个柱形的高度a与d的乘积ad=10×30=300,与副对角线上两个柱形高度的乘积bc=20×45=900相差很大,因而服用药与未患病之间有关的程度很大.

点拨:在三维柱形图中,应对主对角线上两个柱形的高度的乘积ad与副对角线上两个柱形高度的乘积bc作比较,两个乘积相差越大,H0成立的可能性就越大.

练习:

2.研究人员选取170名青年大学生的样本,对他们进行一项心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定回答的有22名,否定回答的有38名;男生110名在相同的题目上作肯定回答的有22名,否定回答的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.

解:根据题目所给数据建立如下列联表:

性别与态度的关系列联表

相应的三维柱形图如图,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.

根据列联表中的数据得到

170(22382288)2

k5.6225.024. 1106044126

所以有97.5%的把握认为性别与态度有关.

2三. 利用随机变量K来确定

2解独立性检验问题的基本步骤是:①找出相关数据,作列联表;②求统计量K的观测

值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.

例3.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构通过考察160位专业运动员运动前是否做热身运动而得到的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?

n(adbc)2

解:由K (ac)(ab)(cd)(bd)2

160(19207645)2

38.94. k95656496

因为38.974>10.828,所以有99.9%的把握认为运动员受伤与不做热身运动有关. 点拨:独立性检验是用来考查两个分类变量是否具有相关关系,并且能较精确地给出这

2种判断的可靠程度的一种统计方法.利用这一方法,可以直接用K的观测值解决实际问题.这

里需特别说明的是:K与k的关系并不是k=K2,K是一个随机变量,它在a,b,c,d取不22

同的值时,K可能不同;而k是K的观测值,是取定一组数a、b、c、d后的一个确定的值.

练习:

3.某些行为在运动员的比赛之中往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛时先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛.获得数据如下表:

22

据此资料,你能得出什么结论? n(adbc)2

解:由K , (ac)(ab)(bd)(cd)2

308(178198427)2

1.502. 得k20510326246

因为1.502

在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能错误,这是数学中的统计思维与确定性思维差异的反映,但我们可以利用统计分析的结果去预测实际问题的结果.


相关文章

  • 3.2独立性检验的基本思想及其初步应用
  • 3.2 独立性检验的基本思想及其初步应用 (共计3课时) 授课类型:新授课 一.教学内容与教学对象分析 通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题. ① 通过对典型案例(如"患肺癌与吸烟有关吗& ...查看


  • 经管应用数学B模块教学大纲
  • 经管应用数学B 模块教学大纲 模块编号:M071103 模块名称:经管应用数学B 理论学时:72 实践学时:8 总学时数:80 总学分:5 后续模块: 一. 说明部分 1. 模块性质 本模块是文科类本科各专业(包括经济系.管理系各专业)的学 ...查看


  • 1.1独立性检验
  • 1.1独立性检验 重难点:了解独立性检验(只要求 考纲要求:①了解独立性检验(只要求列联表)的基本思想.方法及其简单应用. 列联表)的基本思想.方法及其简单应用. ②了解假设检验的基本思想.方法及其简单应用. 经典例题:在一次恶劣气候的飞机 ...查看


  • 统计案例导学案
  • §1.1.1回归分析的基本思 想及其初步应用 1. 通过典型案例的探究,进一步了解回归分析的基本思想.方法及初步应用: 2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数 . 从散点图可以看出 和 ...查看


  • 教育统计学大纲
  • 高纲1428 江苏省高等教育自学考试大纲 28063 教育统计学 南京师范大学编 江苏省高等教育自学考试委员会办公室 Ⅰ 课程的性质与设置目的 <教育统计学>是研究如何整理.分析在包括教育实验.教育调查等教育研究中所获取的数字资 ...查看


  • 统计学基本概念最新
  • 一.聚类分析 1.概念:聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照它们在性质上的亲疏程度进行分类.或者说,聚类分析就是要找出具有相近程度的点或类聚为一类: 距离的种类很多,其中欧式距离在聚类分析中用得最广,它的表达式如下: ...查看


  • 概率论与数理统计考试大纲
  • <概率论与数理统计>课程考试大纲 一.考核内容与考核要求 第1章 随机事件与概率 [考核的知识点和要求] 考核知识点 1.随机事件及其运算 2.概率的定义及其确定方法 3.概率的性质 4.条件概率 5.独立性 考核要求 1. 随 ...查看


  • spss实训目的与要求.实训内容(8个...
  • 实训一 项目名称:数据文件的建立与预处理 实训目的和要求: 1.掌握SPSS的基本窗口.菜单安排及利用SPSS进行统计分析的基本步骤: 2.掌握数据文件的录入.导入和管理: 3.熟练掌握数据文件的筛选.排序.分类汇总.分组等预处理方法. 实 ...查看


  • 卡方检验法在检验学生成绩中的应用
  • 巢湖学院2013届本科毕业论文(设计) χ检验法在检验学生成绩中的应用 2 摘 要 在对学生成绩分析时,采用数理统计中的χ2检验法可以方便有效地得出相关数据.以某初中全体学生的数学成绩为总体,采用卡方拟合检验法来检验初三学生的数学成绩近似的 ...查看


热门内容