中数,标准偏差等的计算

中数

一、中数的概念与求法

中数,又称中点数,中位数。符号为Md或Mdn(英文为Median),中数是指位于一组数据中较大一半与较小一半中间位置的那个数。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据依大小顺序排列,中数恰于中间,它将数据的数目分成较大的一半和较小的一半。中数是集中量数的一种,它能描述一组数据的典型情况,在心理与教育研究工作中常有应用。

中数的求法根据数据是否分组,而有不同的方法。

(一)未分组数据求中数的方法

根据中数的概念,首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中数。这里又有两种不同的情况:

1.单列数目的情况。所谓单列数目是指一组数据中没有相同的,这时取处于序列中间位置的那个数为中数:如果数据个数为奇数,则取序列为第(N+1)/2的那个数据为中数。如果数据个数为偶数,则取序列为第N/2与第N/2+1个这两个数据的均数为中数。 例1 有下列9个数,依大小排列为:

4、7、8、9、10、11、12、13、14 (N=9)

(N+1)/2=5,序列第五的数据是10,则该组数据的中数是10。 例2 有下列8个数,依大小排列为:

2、3、5、7、8、10、15、19 (N=8) 序列为N/2 = 4者是7,序列为N/2+1=5者为8,则其中数为(7+8)/2=7.5。

从以上两例可以看出,求中数不受极大值与极小值的影响,而决定中数的关键是居中的那几个数据的数值大小。

2.有重复数目的情况。所谓重复数目是指一组数据中有数值相同的数。这时计算中数的方法基本同单列数目,但当位于中间的那几个数是重复数目时,求中数的方法就比较复杂了。具体算法如下:

首先假设位于中间的几个重复数目为连续数目,取序列中上下各N/2那一点上的数值为中数。

例3 有以下重复数列(N=9)

依大小排序:

2、3、5、5、7、7、7、11、13,居中的数是7,但7是重复数,这时要将7视作连续数。N/2是4.5,序列中上下各4.5的那一点恰是第一个7(即序列为5的那个7)的中点,而这个7的中点如何确定呢?我们知道将7视作连续数可以理解为:6.5—7.5之间有三个数据分布其中,而这三个7是均匀分布在这区间之内的,可用图示如下:

6.5~7.5之间均匀分布三个数据,每一个数据占1/3的距离,那么可理解为第一个7落在6.5—6.83这一区间内,第二个7落在 6.83—7.16区间内,第三个7落在7.16—7.5(实是7.499.....)区间内。第一个7的中点是6.67,

这一点就是整个序列中位居最中间的那一点,因此,该组数据的中数是6.67。这是重复数列为奇数的情形。如果是偶数,作法也同奇数基本相同。例如给上组数据再增加一个15,它就变为偶数的重复序列了:

2、3、5、5、7、7、7、11、13、15 (N=10)

N/2是5,那就是说,该组数据的中点应该是第五个数的上限,也是第六个数的下限,(前两个7的中点)图示如下:

图2—1 重复数目求中数示意图

根据前面的计算可知位于序列中最前面那个7的上限是6.83,即该组数据的中数是6.83。

从图(2—1),可以清楚地看到,中数是将整个数据的个数分作大的一半和小的一半,而不是将数据的值分作相等的两部分。

(二)次数分布表求中数的方法

一将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。其具体步骤如下,

第一步求N/2,并找到N/2所在的分组区间;

第二步求含有中数那一区间以下各区间的次数和(即中数组区间下限以下的累加次数)记作Fb;

第三步是求N/2与Fb之差;

第四步求序列为第N/2那一点的值。

设中数所在那一分组区间的数据次数为fMd,Lb为中数所在那一分组区间精确下限值。根据重复数列求中数的原理,设有fMd个数据均匀地落在距离为i的区间内,那么每个数据各占i / fMd,那么至N/2这一段距离为i / fMd * (N/2一Fb),如果这一段距离求出后再加上该区间的精确下限值,那就是中数的值了。

求中数的公式整理如下:

Md = Lb + (N / 2 – Fb) / fMd * i (2—4a)

同理,用精确上限计算可写作下式:

Md = La + (N / 2 – Fa) / fMd * i (2—4b)

式中La为中数所在分组区间的精确上限Fa为该组以上各组的累加次数,i为组距。

分组区间 f Cfl Cf2

96— 2 100 2 (1)N/2=100/2=50

93— 3 98 5

90— 4 95 9 (2)中数所在组区间是

87— 8 91 17 77.5—80.5

84— 11 93 28

81— 17 72 45 (3)中数所在组以下的次

78— 19 55 64 数和Fb=36

75— 14 36 78 中数所在组以上的

72— 10 22 88 次数和Fa=45

69—

66—

63—

60一 7 3 1 l 12 5 2 1 95 98 99 100 (4)fmd=19 i=3 Md=77.5+(50-36)/19*3=79

.7l

Md=80.5—(50-45)/19*3=

79.71

N=Σf=100

二、标准偏差

1.样本的标准偏差

SN12

2.总体的标准偏差



2 方差等于标准偏差的平方。

三、四分位数

见PDF

四、协方差

中数

一、中数的概念与求法

中数,又称中点数,中位数。符号为Md或Mdn(英文为Median),中数是指位于一组数据中较大一半与较小一半中间位置的那个数。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据依大小顺序排列,中数恰于中间,它将数据的数目分成较大的一半和较小的一半。中数是集中量数的一种,它能描述一组数据的典型情况,在心理与教育研究工作中常有应用。

中数的求法根据数据是否分组,而有不同的方法。

(一)未分组数据求中数的方法

根据中数的概念,首先将数据依其取值大小排列成序,然后找出位于中间的那个数,就是中数。这里又有两种不同的情况:

1.单列数目的情况。所谓单列数目是指一组数据中没有相同的,这时取处于序列中间位置的那个数为中数:如果数据个数为奇数,则取序列为第(N+1)/2的那个数据为中数。如果数据个数为偶数,则取序列为第N/2与第N/2+1个这两个数据的均数为中数。 例1 有下列9个数,依大小排列为:

4、7、8、9、10、11、12、13、14 (N=9)

(N+1)/2=5,序列第五的数据是10,则该组数据的中数是10。 例2 有下列8个数,依大小排列为:

2、3、5、7、8、10、15、19 (N=8) 序列为N/2 = 4者是7,序列为N/2+1=5者为8,则其中数为(7+8)/2=7.5。

从以上两例可以看出,求中数不受极大值与极小值的影响,而决定中数的关键是居中的那几个数据的数值大小。

2.有重复数目的情况。所谓重复数目是指一组数据中有数值相同的数。这时计算中数的方法基本同单列数目,但当位于中间的那几个数是重复数目时,求中数的方法就比较复杂了。具体算法如下:

首先假设位于中间的几个重复数目为连续数目,取序列中上下各N/2那一点上的数值为中数。

例3 有以下重复数列(N=9)

依大小排序:

2、3、5、5、7、7、7、11、13,居中的数是7,但7是重复数,这时要将7视作连续数。N/2是4.5,序列中上下各4.5的那一点恰是第一个7(即序列为5的那个7)的中点,而这个7的中点如何确定呢?我们知道将7视作连续数可以理解为:6.5—7.5之间有三个数据分布其中,而这三个7是均匀分布在这区间之内的,可用图示如下:

6.5~7.5之间均匀分布三个数据,每一个数据占1/3的距离,那么可理解为第一个7落在6.5—6.83这一区间内,第二个7落在 6.83—7.16区间内,第三个7落在7.16—7.5(实是7.499.....)区间内。第一个7的中点是6.67,

这一点就是整个序列中位居最中间的那一点,因此,该组数据的中数是6.67。这是重复数列为奇数的情形。如果是偶数,作法也同奇数基本相同。例如给上组数据再增加一个15,它就变为偶数的重复序列了:

2、3、5、5、7、7、7、11、13、15 (N=10)

N/2是5,那就是说,该组数据的中点应该是第五个数的上限,也是第六个数的下限,(前两个7的中点)图示如下:

图2—1 重复数目求中数示意图

根据前面的计算可知位于序列中最前面那个7的上限是6.83,即该组数据的中数是6.83。

从图(2—1),可以清楚地看到,中数是将整个数据的个数分作大的一半和小的一半,而不是将数据的值分作相等的两部分。

(二)次数分布表求中数的方法

一将原始数据整理成次数分布表后,求中数的原理同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。其具体步骤如下,

第一步求N/2,并找到N/2所在的分组区间;

第二步求含有中数那一区间以下各区间的次数和(即中数组区间下限以下的累加次数)记作Fb;

第三步是求N/2与Fb之差;

第四步求序列为第N/2那一点的值。

设中数所在那一分组区间的数据次数为fMd,Lb为中数所在那一分组区间精确下限值。根据重复数列求中数的原理,设有fMd个数据均匀地落在距离为i的区间内,那么每个数据各占i / fMd,那么至N/2这一段距离为i / fMd * (N/2一Fb),如果这一段距离求出后再加上该区间的精确下限值,那就是中数的值了。

求中数的公式整理如下:

Md = Lb + (N / 2 – Fb) / fMd * i (2—4a)

同理,用精确上限计算可写作下式:

Md = La + (N / 2 – Fa) / fMd * i (2—4b)

式中La为中数所在分组区间的精确上限Fa为该组以上各组的累加次数,i为组距。

分组区间 f Cfl Cf2

96— 2 100 2 (1)N/2=100/2=50

93— 3 98 5

90— 4 95 9 (2)中数所在组区间是

87— 8 91 17 77.5—80.5

84— 11 93 28

81— 17 72 45 (3)中数所在组以下的次

78— 19 55 64 数和Fb=36

75— 14 36 78 中数所在组以上的

72— 10 22 88 次数和Fa=45

69—

66—

63—

60一 7 3 1 l 12 5 2 1 95 98 99 100 (4)fmd=19 i=3 Md=77.5+(50-36)/19*3=79

.7l

Md=80.5—(50-45)/19*3=

79.71

N=Σf=100

二、标准偏差

1.样本的标准偏差

SN12

2.总体的标准偏差



2 方差等于标准偏差的平方。

三、四分位数

见PDF

四、协方差


相关文章

  • 实测实量检查标准
  • 实测实量检查标准 截面尺寸: 评判标准:[-5,8]mm 同一墙/柱面作为1个实测区.每个实测区从地面向上300mm 和1500mm各测量截面尺寸1次,选取其中与设计尺寸偏差最大的数,作为判断该实测指标合格率的1个计算点 外门窗洞口尺寸: ...查看


  • 华润住宅(毛坯)实测实量作业
  • 住宅(毛坯)实测实量作业指引 (内部试行) 编制 赵鹏 张盛银 日期 日期 2012-12-01 2012-12-01 审核 审批 日期 修订状态赵炜 日期 修订记录 修改内容 修改人 2012-12-01 审核人 审批人 目录 1. 2. ...查看


  • 相对标准方差的计算公式
  • 相对标准方差的计算公式 准确度:测定值与真实值符合的程度 绝对误差:测量值(或多次测定的平均值)与真(实)值之差称为绝对误差,用δ表示. 相对误差:绝对误差与真值的比值称为相对误差.常用百分数表示. 绝对误差可正可负,可以表明测量仪器的准确 ...查看


  • 混凝土用钢纤维
  • 混凝土用钢纤维 YB/T 151-1999 国家冶金工业局1999-08-19批准 2000-01-01实施 前言 本标准非等效采用美国材料与试验协会标准ASTM A820-1990<增强纤维混凝土用钢纤维>. 本标准在钢纤维定 ...查看


  • 保利实测实量
  • 保利(长沙)实业有限公司 产品质量实测实量工作指引(试行) 1.目的 1.1提高产品质量,增加公司对所开发项目的可控制程度,降低客户投拆的风险. 1.2规范产品质量实测过程中的程序.取样方法.测量操作.数据处理等具体步骤和要求,提供产品质量 ...查看


  • 第二章 实验数据的误差与结果处理
  • 第2章 实验数据的误差与结果处理(3学时) 2.1 实验误差及其表示方法2.2 实验数据处理及结果评价2.3 有效数字的修约及其运算规则 2012年9月7日10时20分1 2.1 实验误差及其表示方法 2.1.1 误差的种类及产生原因 2. ...查看


  • 算术平均值的实验标准偏差附件1-2
  • 算术平均值的实验标准偏差 P212 附件1-2 [案例]:某计量人员在建立计量标准时,对计量标准进行过重复性评定,对被测件重复测量10次,按贝塞尔公式计算出实验标准偏差s(x)=0.08V.现在,在相同条件下对同一被测件测量4次,取4次测量 ...查看


  • 财产保险公司经营指标
  • 险公司经营分析指标 (征求意见稿) 目 录 1. 引言 ............................................................................................ ...查看


  • 公差与技术测量试题
  • 综合练习题 一.填空题 1.公差标准是对 的限制性措施, 是贯彻公差与配合制的技术保证. 2.轴φ50js8,其上偏差为 mm,下偏差为 mm. 3.由于 包括了圆柱度误差和同轴度误差,当 不大于给定的圆柱度公差值时,可以肯定圆柱度误差不会 ...查看


  • 分析化学误差部分总结
  • 分析化学(第六版)总结 第二章 误差和分析数据处理 第一节 误差 定量分析中的误差就其来源和性质的不同,可分为系统误差.偶然误差和过失误差. 一. 定义:由于某种确定的原因引起的误差,也称可测误差 特点:①重现性,②单向性,③可测性(大小成 ...查看


热门内容