统计学实训报告

统计学实训报告

实训(一)和(三)excel基本统计

一、实训目的

利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。利用统计图表工具进行数据直观分析,掌握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。

二、实训内容

(一)基本函数使用

某班学生期末成绩单

(1)计算个人平均成绩,按平均分从大到小进行排序挑选出学习成绩最好、最差的3个同学;

(2)(2)求这3 门课的平均分和标准差、最大值、最小值、峰度、偏度;

(3)将数学成绩按性别分类汇总统计男女同学各科成绩平均值,并按5级分类统计(优、良、中、及格和不及格)人数。 (二)计算各种平均指标

(1)(算术平均数)中国股市中的10种股票在2014年9月1日收盘价如表,求该10种股票价格当日的平均价格。

股票代码 600519 002310 300026

证券名称 贵州茅台 东方园林 红日药业

价格 165.21 116.5 100.89

股票代码 300002 002304 002294

证券名称 神州泰岳 洋河股份 信立泰

价格 124 110 94.5

(2)(加权平均数)某公司员工工资情况如下表,计算平均工资。

(3)(调和平均数)成都某小区菜市芹菜的价格,早上3.8元/kg,中午3.5元

/kg,晚上2.9元/kg。如果早、中、晚各买一元,求平均价格。

(4)(几何平均数)孙女士到中国银行存入一笔资金,按复利计算,10年的年利率分别是2.88%有3年,2.79%有2年,3.6%有2年,5%有3年。计算其平均存款利率。

(5)根据上面(2)员工工资表计算中位数和众数。 (三)计算各种离散指标 (1)(极差)景经理在2013年度工资收入分别是5280、6421、7345、4888、7243、6896、5889、7124、7586、9200、7854、8455,计算其工资收入的极差。 (2)(未分组数据平均差)某公司10名工人的工资为2569、2807、3018、2587、2848、1989、2368、2345、1956、1833,计算其平均差。 (3)(分组数据平均差)根据员工工资表计算员工收入的平均差。 (4)(标准差和方差)根据员工工资表计算员工工资收入的方差和标准差。 (5)(离散系数)根据员工工资表计算员工工资收入的离散系数。 (四)利用描述统计工具进行指标分析 现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、3107、3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、2874、2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、3133、3176、1459、1097、1396,使用描述统计工具对工资进行统计

(五)图表的运用

根据某地三大产业情况基本数据,绘制该地三个产业的条形图、饼图、折线图。

第一产第二产第三产

年份

业 业 业

1990 53.2 29.8 17 1995 44 33.7 22.3 2000 35.6 35.4 29 2004 26.1 43.6 30.3 2005 24.5 45.1 30.4 2006 22.6 45.8 31.6 2007 20.1 46.8 33.1 2008 19.2 47.6 33.2

三、实训步骤及结果分析

(一)、基本函数运用

1. 通过函数AVERAGE把每个同学平均分求出来,数据按钮中的降序功能,成绩最好的3个同学和最差的3个同学就出来了,在把每科平均值求出,例:Average(a1:a5)或者Average(1,3,5)。偏度函数SKEW(number1,number2,...),

(Mx)SK

fs

i

i1

3i

k

3

fi

。其中s为标准差,Mi为中位数,fi为频数。

2. 使用KURT函数将峰度算出,然后使用STDEV函数求出标准差,同理最大值MAX,最小值MIN 。利用分内汇总功能,先将数据进行按性别降序或升序排列,再进行汇总,统计学生成绩优、良、中、差和不及格。运用COUNT IF函数,例:=IF(F2>=90,"A",IF(F2>=80,"B",IF(F2>=70,"C",IF(F2>=60,"D","E"))))结果如下:

从这道题来看,考核了一些基本函数的运用,比如,AVERAGE、COUNT IF、SKEW、STDEV等,特别是COUNT IF 函数嵌套时应该注意各函数之间的关系,另外分内汇总时应先进行排序,否则结果是错误的。

(二)计算各种平均指标

1.算术平均即为各个数求和再除以总的个数,将10只股票价格加总除以10,得到平均价格。

2.加权平均是不同比重数据的平均数,就是把原始数据按照合理的比例来计算。

3.调和平均数(Harmonic Average)是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数,先计算斤数,用金额除以单价。利用公式=SUM(D24:D26)/SUM(E24:E26)得出下面结果。

4.几何平均GEOMEAN:返回正数数组或数据区域的几何平均值。GEOMEAN(number1,number2, ...)

面这道

题,不能直接计算,要将增长速度变为发展速度,然后利用公式=POWER(D31^B31*D32^B32*D33^B33*D34^B34,0.1)计算,才能正确 ,如果直接利用函数GEOMEAM计算,结果会错误。

N

5.中位数和众数,利用公式:ML

112

i MeL2

Sm1

fm

i

从这一道题来看,难点主要在于几何平均,加权平均,中位数,众数的计算,特别是数据为分组数据时,要注意分析和理解,才能减少错误。

(三)离散指标 1.极差

R=max-min=9200-4888=4312,此处叫为简单。

-

2.未分组数据平均差,公式为:

X

n

X

首先计算该组数据平均值,与各个据

做差取绝对值求和再除以总的人数,计算较为简单。

3.分组数据平均差,计算较为复杂,首先将下图中的X-平均值、|X-平均值|、|X-平均值|*频数算出来,最后 |X-平均值

|*f/

f

算出。

4.方差和标准差,利用公式VAR:估算样本方差。

n

VAR(number1,number2,...)。s

2

(xx)

i

i1

2

n1

=

nx2(

x)2

n2

5.离散系数

由上图可算Vs=110.68/1768=0.0626

通过这道题可知,对极差、方差、标准差、离散系数等指标的分析来对数据分布离散程度的测度,数据比较多计算有点困难,但可以通过计算机,应注意样本方差和总体方差之间自由度的不同。 (四)描述统计

只需要加载宏利用数据分析工具,各种指标就出来了。

(五)图表运用

根据某地1990年-2008年三大产业比重情资料,制作直方图、折线图、饼图。首先把数据输入工作表中,如图1所示。

利用插入图表功能,选中数据区域,生成折线图、直方图、饼图。

实训(二) 统计分组

一、实训目的

掌握Excel在统计资料搜集和整理中的应用。用Excel进行统计分组和抽样数据搜集。掌握利用Excel进行抽样的基本方法,掌握频数分布表和直方图数据分析基本技巧和操作方法。

二、实训内容

(一)(抽样)利用数据分析工具进行随机抽样。假设欲对某公司50名工

人工资进行调查,现要抽取10个,采用随机抽样和等距抽样方法分别确定抽取的员工编号。

(二)(函数法进行统计分组和编制频数分布表)在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不同的函数。当分组标志是品质标志时应使用COUNTIF()函数;当分组标志是数量标志时应使用FREQUENCY()函数。

三、实训步骤及结果分析

1.首先将数据输入Excel单元格中,观察数据的类型个数,在工作表中的空余位置列出各组名称,如图所示。

第一,将上述资料输入Excel工作表;在单元格D2中输入“工作单位性质”,在E2中输入“学生人数”,在D3:D6区域中依次输入国家机关、事业单位、企业、自主创业,表示分组方式,同时这也可以表示分组组限。

第二,选择单元格E3至E6区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框;在“函数分类”列表中选择“常用函数” 或者选择“统计”也可以,在“函数名”列表中选择“COUNTIF”。

第三,单击“确定”按钮,Excel弹出“函数参数”对话框。在数据区域“Range”中输入单元格B2:B31,在数据接受区间Criteria 中输入单元格D3:D6。

第四,由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl +Shift组合键,同时敲“回车”键,得到频数分布。

2.运用同样的方法可以将学生的英语成绩统计出来。 3.利用“直方图”工具进行统计分组

直方图分析工具是一个用于确定数据的频数分布、累计频数分布,并提供直方图的分析模块。它在给定工作表中数据单元格区域和接收区间的情况下,计算数据的频数和累积频数

这道题应该注意的是频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl +Shift组合键,同时敲“回车”键,得出频数分布。

实训(四) 置信区间估计与假设检验应用实训

一、实训目的

掌握Excel软件中假设检验方法(单样本t检验)及置信区间应用。

二、实训内容

在正常生产情况下,某厂生产的一种无缝钢管服从正态分布。从某日生产的钢管中随机抽取10根,测得其内径分别为:

53.8、54.0、55.1、54.2、52.1、54.2、55.0、55.8、55.4、55.5(单位:mm) 要求:

(1)请建立该批无缝钢管平均内径95%的置信区间?

(2)若该日无缝钢管的内径服从均值为54mm的正态分布。试在5%的显著性水平下检验该日产品的生产是否正常?

三、实训步骤及结果分析

(一)区间估计

(1)计算样本标准差(STDEV函数):s=1.0948871 (2)计算样本平均值(AVERAGE函数):x=54.51

(3)利用t分布函数计算t/2=2.6850168。(为显著性水平的一半,使用函数TINV)

(4

)计算抽样误差t/2s。

(5)构造置信区间(54.51-0.929641251,54.51+0.929641251) (二)假设检验 (1)设定假设

原假设:H0:54 备择假设:H1:54

(2)计算样本标准差(STDEV函数):s=1.0948871 (3)计算样本平均值(AVERAGE函数):x=54.51

(4)利用t分布函数计算t/2=2.6850168。(为显著性水平的一半,使用函数TINV) (5

)计算统计量t

(6)决策:t小于t/2,所以不拒绝原假设。

(三)用P值检验 (1)计算统计量t

(2)利用函数TDIST计算P值,即TDIST(1.472994,9,2)=0.17484316>0.05,不拒绝原假设。 结果如下:

这道题注重考了对假设的检验,这题为双侧检验,老师做时弄成了单侧检验,有两种方法,一是计算出统计量和给定的显着性水平比较,看是否落在拒绝域。二是P检验,计算出P值,P>α,不拒绝原假设,P

实训(五) 方差分析应用实训

一、实训目的

掌握Excel软件中方差分析应用(单因素方差分析和双因素方差分析) 二、实训内容

(1)某城市东西南北5个地区发生交通事故的次数如下表所示。由于是随机抽样,有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、发生事故少(如东部)。试以α=5%的显著水平检验各地区平均每天交通事故次数是否相等?

表1 某城市5个地区交通事故发生次数 东部 15 17 14 11 - -

(2)某农科所实训在水溶液中种植西红柿,采用了3种施肥方式和4种不同的

水温。3种施肥方式一开始就给可溶性的肥料;每两个月给1/2的溶液;每月给以1/4的溶液。水温分别为4℃、10℃、16℃、20℃。实验结果的产量如下表所示。

北部 12 10 13 17 14 -

中部 10 14 13 15 12 -

南部 14 9 7 10 8 7

西部 13 12 9 14 10 9

表2 不同水温水平不同施肥方式下的西红柿产量

问施肥的方式和水温对产量的影响是否显著(α=5%)? 三、实训步骤及结果分析

(一)单因素方差分析

(1)设定假设:原假设:H0:东西南北中

备择假设:H1:东,西,南,北,中不全相等 (2)工具——>数据分析——>单因素方差分析。 (3)决策:F>F,拒绝原假设。

(二)双因素方差分析

(1)假设:

列因素(施肥方式)原假设:H0:12:3 施肥方式对产量没有有影响 H1:1,2,3不全相等 施肥方式对产量有显著影响

行因素(水温) H:0冷凉温热

H1:冷,凉,温,热

水温对产量没有影响 水温对产量有影响

(2)操作:工具——>数据分析——>双因素方差分析。

(3)决策

从上表可以看出F=1.423077

因为F行=78.4>Fcrit=4.75706,所以拒绝原假设,表明水温对产量有显著影响。F列=0.25

实训(六) 相关与回归分析实训

一、实训目的

掌握Excel软件中回归分析及相关分析应用

二、实训内容

零售商要了解每周的广告费X及消费额Y之间的关系,记录如表所示。

表1 每周广告费X与消费额Y数据表

X 40 20 25 18 50 45 40 22 55 48 38 52 38Y

5

5

5

5

5

1)画出散点图;

2)计算相关系数,并进行相关系数的显著性检验(α=5%); 3)求出线性回归方程,并评价其拟合程度; 4)请对回归系数作统计检验。(α=5%)

[***********]4851

三、实训步骤及结果

(一)散点图

图表——>图标类型——>XY散点图 (二)计算相关系数并检验

(1)工具——>数据分析——>相关系数 (2)函数CORREL

(3)相关系数显著性检验 ①提出假设: 原假设:H0:0 备择假设:H0:0

②计算统计量:t

=4.592645

③计算临界值t(n2)=t0.05(122)=2.228139(函数TINV) ④决策:t>t(n2),拒绝原假设,说明线性相关性显著。 (三)求线性回归方程并评价

(1)工具——>数据分析——>回归

(2)评价:根据R2判断。根据回归分析表知道R2=0.810392,回归效果较好。 (四)对回归系数进行统计检验(以为例) (1)提出假设:

原假设:H0:0

备择假设:H1:0



(2)计算检验统计量:t=6.[1**********]085

Se()

(3)计算临界值:t/2(n2)t0.025(122)=2.633767(函数TINV)。

(4)决策:因为t>t/2(n2),拒绝原假设。表明X是影响Y的一个重要因素。

1、Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。

如例中:R为0.[**************],表示二者之间的关系是高度正相关。 2、R Square(复测定系数R2,即可决系数 ):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。

3、Adjusted R Square (调整复测定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。

4、标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。 5、观测值:是指用于估计回归方程的数据的观测值个数。 模块二:方差分析表

方差分析表的主要作用是通过F检验来判断回归模型的回归效果。 1、 df列为自由度 2、 SS为平方和

3、 MS为均方差:MS=SS/df 4、

F为对回归方程进行显著性检验的统计量。F

ESS/1

~F(1,n2)。

RSS/(n2)

5、 Significance F相当于计算后所得到的P值。 6、 回归方程显著性检验的方法: (1) 提出假设:

原假设:H0:0 备择假设:H1:0 (2) (3) (4)

计算统计量:F

ESS/1

,一般方差分析表都给出。

RSS/(n2)

计算临界值F(1,n2) 决策:

方法一:如果F>F(1,n2),拒绝H0,表明X和Y之间存在显著的线性关系。 方法二:如果Significance F小于显著性水平,拒绝H0,表明X和Y之间存在显著的线性关系。 回归参数表:

1、 Intercept:截距

2、 第二、三行: (截距) 和β(斜率)的各项指标。 3、 第二列:回归系数 (截距)和β(斜率)的值。 4、 第三列:回归系数的标准误差 5、 6、

第四列:根据原假设Ho:β0=β1=0计算的样本统计量t的值。 第五列:各个回归系数的p值(双侧)

7、 第六列:和β为95%的置信区间的上下限。

实训总结

通过这次实训,对自己的统计学知识有了更深的理解,做到了学以致用,也加强了计算机基础知识的巩固,另外,在本次的实训活动中我们所收获知识较多既有学习中的也有生活中。在学习中我们将自己所学的知识应用于实际的操作中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼。本次实训还开阔了我的视野,使我对统计在现实中的运作有了进一步的理解。

我们这次实训时间较短,只是短短的两天。我们所学到的知识相对来说还是少之又少的,因此,在以后涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。同时,我们以后无论是在学习知识上,还是实际运用上都要学习运用统计学知识。

统计学实训报告

实训(一)和(三)excel基本统计

一、实训目的

利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。利用统计图表工具进行数据直观分析,掌握Excel柱形图、条形图、折线图、饼图、散点图、面积图、环形图等各种图形工具的使用方法和统计作用。

二、实训内容

(一)基本函数使用

某班学生期末成绩单

(1)计算个人平均成绩,按平均分从大到小进行排序挑选出学习成绩最好、最差的3个同学;

(2)(2)求这3 门课的平均分和标准差、最大值、最小值、峰度、偏度;

(3)将数学成绩按性别分类汇总统计男女同学各科成绩平均值,并按5级分类统计(优、良、中、及格和不及格)人数。 (二)计算各种平均指标

(1)(算术平均数)中国股市中的10种股票在2014年9月1日收盘价如表,求该10种股票价格当日的平均价格。

股票代码 600519 002310 300026

证券名称 贵州茅台 东方园林 红日药业

价格 165.21 116.5 100.89

股票代码 300002 002304 002294

证券名称 神州泰岳 洋河股份 信立泰

价格 124 110 94.5

(2)(加权平均数)某公司员工工资情况如下表,计算平均工资。

(3)(调和平均数)成都某小区菜市芹菜的价格,早上3.8元/kg,中午3.5元

/kg,晚上2.9元/kg。如果早、中、晚各买一元,求平均价格。

(4)(几何平均数)孙女士到中国银行存入一笔资金,按复利计算,10年的年利率分别是2.88%有3年,2.79%有2年,3.6%有2年,5%有3年。计算其平均存款利率。

(5)根据上面(2)员工工资表计算中位数和众数。 (三)计算各种离散指标 (1)(极差)景经理在2013年度工资收入分别是5280、6421、7345、4888、7243、6896、5889、7124、7586、9200、7854、8455,计算其工资收入的极差。 (2)(未分组数据平均差)某公司10名工人的工资为2569、2807、3018、2587、2848、1989、2368、2345、1956、1833,计算其平均差。 (3)(分组数据平均差)根据员工工资表计算员工收入的平均差。 (4)(标准差和方差)根据员工工资表计算员工工资收入的方差和标准差。 (5)(离散系数)根据员工工资表计算员工工资收入的离散系数。 (四)利用描述统计工具进行指标分析 现有300名员工,从中随机抽取30名员工的工资进行统计,具体资料为3569、3107、3013、2187、1848、1689、1368、1342、1256、1133、1157、1082、1088、2874、2310、1762、3172、1939、1851、1480、1424、1354、1700、1097、2003、3133、3176、1459、1097、1396,使用描述统计工具对工资进行统计

(五)图表的运用

根据某地三大产业情况基本数据,绘制该地三个产业的条形图、饼图、折线图。

第一产第二产第三产

年份

业 业 业

1990 53.2 29.8 17 1995 44 33.7 22.3 2000 35.6 35.4 29 2004 26.1 43.6 30.3 2005 24.5 45.1 30.4 2006 22.6 45.8 31.6 2007 20.1 46.8 33.1 2008 19.2 47.6 33.2

三、实训步骤及结果分析

(一)、基本函数运用

1. 通过函数AVERAGE把每个同学平均分求出来,数据按钮中的降序功能,成绩最好的3个同学和最差的3个同学就出来了,在把每科平均值求出,例:Average(a1:a5)或者Average(1,3,5)。偏度函数SKEW(number1,number2,...),

(Mx)SK

fs

i

i1

3i

k

3

fi

。其中s为标准差,Mi为中位数,fi为频数。

2. 使用KURT函数将峰度算出,然后使用STDEV函数求出标准差,同理最大值MAX,最小值MIN 。利用分内汇总功能,先将数据进行按性别降序或升序排列,再进行汇总,统计学生成绩优、良、中、差和不及格。运用COUNT IF函数,例:=IF(F2>=90,"A",IF(F2>=80,"B",IF(F2>=70,"C",IF(F2>=60,"D","E"))))结果如下:

从这道题来看,考核了一些基本函数的运用,比如,AVERAGE、COUNT IF、SKEW、STDEV等,特别是COUNT IF 函数嵌套时应该注意各函数之间的关系,另外分内汇总时应先进行排序,否则结果是错误的。

(二)计算各种平均指标

1.算术平均即为各个数求和再除以总的个数,将10只股票价格加总除以10,得到平均价格。

2.加权平均是不同比重数据的平均数,就是把原始数据按照合理的比例来计算。

3.调和平均数(Harmonic Average)是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数,先计算斤数,用金额除以单价。利用公式=SUM(D24:D26)/SUM(E24:E26)得出下面结果。

4.几何平均GEOMEAN:返回正数数组或数据区域的几何平均值。GEOMEAN(number1,number2, ...)

面这道

题,不能直接计算,要将增长速度变为发展速度,然后利用公式=POWER(D31^B31*D32^B32*D33^B33*D34^B34,0.1)计算,才能正确 ,如果直接利用函数GEOMEAM计算,结果会错误。

N

5.中位数和众数,利用公式:ML

112

i MeL2

Sm1

fm

i

从这一道题来看,难点主要在于几何平均,加权平均,中位数,众数的计算,特别是数据为分组数据时,要注意分析和理解,才能减少错误。

(三)离散指标 1.极差

R=max-min=9200-4888=4312,此处叫为简单。

-

2.未分组数据平均差,公式为:

X

n

X

首先计算该组数据平均值,与各个据

做差取绝对值求和再除以总的人数,计算较为简单。

3.分组数据平均差,计算较为复杂,首先将下图中的X-平均值、|X-平均值|、|X-平均值|*频数算出来,最后 |X-平均值

|*f/

f

算出。

4.方差和标准差,利用公式VAR:估算样本方差。

n

VAR(number1,number2,...)。s

2

(xx)

i

i1

2

n1

=

nx2(

x)2

n2

5.离散系数

由上图可算Vs=110.68/1768=0.0626

通过这道题可知,对极差、方差、标准差、离散系数等指标的分析来对数据分布离散程度的测度,数据比较多计算有点困难,但可以通过计算机,应注意样本方差和总体方差之间自由度的不同。 (四)描述统计

只需要加载宏利用数据分析工具,各种指标就出来了。

(五)图表运用

根据某地1990年-2008年三大产业比重情资料,制作直方图、折线图、饼图。首先把数据输入工作表中,如图1所示。

利用插入图表功能,选中数据区域,生成折线图、直方图、饼图。

实训(二) 统计分组

一、实训目的

掌握Excel在统计资料搜集和整理中的应用。用Excel进行统计分组和抽样数据搜集。掌握利用Excel进行抽样的基本方法,掌握频数分布表和直方图数据分析基本技巧和操作方法。

二、实训内容

(一)(抽样)利用数据分析工具进行随机抽样。假设欲对某公司50名工

人工资进行调查,现要抽取10个,采用随机抽样和等距抽样方法分别确定抽取的员工编号。

(二)(函数法进行统计分组和编制频数分布表)在Excel中利用函数进行统计分组和编制频数分布表可利用COUNTIF()和FREQUENCY()等函数,但要根据变量值的类型不同而选择不同的函数。当分组标志是品质标志时应使用COUNTIF()函数;当分组标志是数量标志时应使用FREQUENCY()函数。

三、实训步骤及结果分析

1.首先将数据输入Excel单元格中,观察数据的类型个数,在工作表中的空余位置列出各组名称,如图所示。

第一,将上述资料输入Excel工作表;在单元格D2中输入“工作单位性质”,在E2中输入“学生人数”,在D3:D6区域中依次输入国家机关、事业单位、企业、自主创业,表示分组方式,同时这也可以表示分组组限。

第二,选择单元格E3至E6区域,在“插入”菜单中单击“函数”选项,打开“粘贴函数”对话框;在“函数分类”列表中选择“常用函数” 或者选择“统计”也可以,在“函数名”列表中选择“COUNTIF”。

第三,单击“确定”按钮,Excel弹出“函数参数”对话框。在数据区域“Range”中输入单元格B2:B31,在数据接受区间Criteria 中输入单元格D3:D6。

第四,由于频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl +Shift组合键,同时敲“回车”键,得到频数分布。

2.运用同样的方法可以将学生的英语成绩统计出来。 3.利用“直方图”工具进行统计分组

直方图分析工具是一个用于确定数据的频数分布、累计频数分布,并提供直方图的分析模块。它在给定工作表中数据单元格区域和接收区间的情况下,计算数据的频数和累积频数

这道题应该注意的是频数分布是数组操作,所以,此处不能直接单击“确定”按钮,而应按Ctrl +Shift组合键,同时敲“回车”键,得出频数分布。

实训(四) 置信区间估计与假设检验应用实训

一、实训目的

掌握Excel软件中假设检验方法(单样本t检验)及置信区间应用。

二、实训内容

在正常生产情况下,某厂生产的一种无缝钢管服从正态分布。从某日生产的钢管中随机抽取10根,测得其内径分别为:

53.8、54.0、55.1、54.2、52.1、54.2、55.0、55.8、55.4、55.5(单位:mm) 要求:

(1)请建立该批无缝钢管平均内径95%的置信区间?

(2)若该日无缝钢管的内径服从均值为54mm的正态分布。试在5%的显著性水平下检验该日产品的生产是否正常?

三、实训步骤及结果分析

(一)区间估计

(1)计算样本标准差(STDEV函数):s=1.0948871 (2)计算样本平均值(AVERAGE函数):x=54.51

(3)利用t分布函数计算t/2=2.6850168。(为显著性水平的一半,使用函数TINV)

(4

)计算抽样误差t/2s。

(5)构造置信区间(54.51-0.929641251,54.51+0.929641251) (二)假设检验 (1)设定假设

原假设:H0:54 备择假设:H1:54

(2)计算样本标准差(STDEV函数):s=1.0948871 (3)计算样本平均值(AVERAGE函数):x=54.51

(4)利用t分布函数计算t/2=2.6850168。(为显著性水平的一半,使用函数TINV) (5

)计算统计量t

(6)决策:t小于t/2,所以不拒绝原假设。

(三)用P值检验 (1)计算统计量t

(2)利用函数TDIST计算P值,即TDIST(1.472994,9,2)=0.17484316>0.05,不拒绝原假设。 结果如下:

这道题注重考了对假设的检验,这题为双侧检验,老师做时弄成了单侧检验,有两种方法,一是计算出统计量和给定的显着性水平比较,看是否落在拒绝域。二是P检验,计算出P值,P>α,不拒绝原假设,P

实训(五) 方差分析应用实训

一、实训目的

掌握Excel软件中方差分析应用(单因素方差分析和双因素方差分析) 二、实训内容

(1)某城市东西南北5个地区发生交通事故的次数如下表所示。由于是随机抽样,有一些地区的汽车密度高、发生事故多(如南部和西部),而有些地区汽车密度低、发生事故少(如东部)。试以α=5%的显著水平检验各地区平均每天交通事故次数是否相等?

表1 某城市5个地区交通事故发生次数 东部 15 17 14 11 - -

(2)某农科所实训在水溶液中种植西红柿,采用了3种施肥方式和4种不同的

水温。3种施肥方式一开始就给可溶性的肥料;每两个月给1/2的溶液;每月给以1/4的溶液。水温分别为4℃、10℃、16℃、20℃。实验结果的产量如下表所示。

北部 12 10 13 17 14 -

中部 10 14 13 15 12 -

南部 14 9 7 10 8 7

西部 13 12 9 14 10 9

表2 不同水温水平不同施肥方式下的西红柿产量

问施肥的方式和水温对产量的影响是否显著(α=5%)? 三、实训步骤及结果分析

(一)单因素方差分析

(1)设定假设:原假设:H0:东西南北中

备择假设:H1:东,西,南,北,中不全相等 (2)工具——>数据分析——>单因素方差分析。 (3)决策:F>F,拒绝原假设。

(二)双因素方差分析

(1)假设:

列因素(施肥方式)原假设:H0:12:3 施肥方式对产量没有有影响 H1:1,2,3不全相等 施肥方式对产量有显著影响

行因素(水温) H:0冷凉温热

H1:冷,凉,温,热

水温对产量没有影响 水温对产量有影响

(2)操作:工具——>数据分析——>双因素方差分析。

(3)决策

从上表可以看出F=1.423077

因为F行=78.4>Fcrit=4.75706,所以拒绝原假设,表明水温对产量有显著影响。F列=0.25

实训(六) 相关与回归分析实训

一、实训目的

掌握Excel软件中回归分析及相关分析应用

二、实训内容

零售商要了解每周的广告费X及消费额Y之间的关系,记录如表所示。

表1 每周广告费X与消费额Y数据表

X 40 20 25 18 50 45 40 22 55 48 38 52 38Y

5

5

5

5

5

1)画出散点图;

2)计算相关系数,并进行相关系数的显著性检验(α=5%); 3)求出线性回归方程,并评价其拟合程度; 4)请对回归系数作统计检验。(α=5%)

[***********]4851

三、实训步骤及结果

(一)散点图

图表——>图标类型——>XY散点图 (二)计算相关系数并检验

(1)工具——>数据分析——>相关系数 (2)函数CORREL

(3)相关系数显著性检验 ①提出假设: 原假设:H0:0 备择假设:H0:0

②计算统计量:t

=4.592645

③计算临界值t(n2)=t0.05(122)=2.228139(函数TINV) ④决策:t>t(n2),拒绝原假设,说明线性相关性显著。 (三)求线性回归方程并评价

(1)工具——>数据分析——>回归

(2)评价:根据R2判断。根据回归分析表知道R2=0.810392,回归效果较好。 (四)对回归系数进行统计检验(以为例) (1)提出假设:

原假设:H0:0

备择假设:H1:0



(2)计算检验统计量:t=6.[1**********]085

Se()

(3)计算临界值:t/2(n2)t0.025(122)=2.633767(函数TINV)。

(4)决策:因为t>t/2(n2),拒绝原假设。表明X是影响Y的一个重要因素。

1、Multiple R(复相关系数R):R2的平方根,又称为相关系数,它用来衡量变量x和y之间相关程度的大小。

如例中:R为0.[**************],表示二者之间的关系是高度正相关。 2、R Square(复测定系数R2,即可决系数 ):用来说明用自变量解释因变量变差的程度,以测量同因变量y的拟合效果。

3、Adjusted R Square (调整复测定系数R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型。

4、标准误差:又称为标准回归误差或叫估计标准误差,它用来衡量拟合程度的大小,也用于计算与回归有关的其他统计量,此值越小,说明拟合程度越好。 5、观测值:是指用于估计回归方程的数据的观测值个数。 模块二:方差分析表

方差分析表的主要作用是通过F检验来判断回归模型的回归效果。 1、 df列为自由度 2、 SS为平方和

3、 MS为均方差:MS=SS/df 4、

F为对回归方程进行显著性检验的统计量。F

ESS/1

~F(1,n2)。

RSS/(n2)

5、 Significance F相当于计算后所得到的P值。 6、 回归方程显著性检验的方法: (1) 提出假设:

原假设:H0:0 备择假设:H1:0 (2) (3) (4)

计算统计量:F

ESS/1

,一般方差分析表都给出。

RSS/(n2)

计算临界值F(1,n2) 决策:

方法一:如果F>F(1,n2),拒绝H0,表明X和Y之间存在显著的线性关系。 方法二:如果Significance F小于显著性水平,拒绝H0,表明X和Y之间存在显著的线性关系。 回归参数表:

1、 Intercept:截距

2、 第二、三行: (截距) 和β(斜率)的各项指标。 3、 第二列:回归系数 (截距)和β(斜率)的值。 4、 第三列:回归系数的标准误差 5、 6、

第四列:根据原假设Ho:β0=β1=0计算的样本统计量t的值。 第五列:各个回归系数的p值(双侧)

7、 第六列:和β为95%的置信区间的上下限。

实训总结

通过这次实训,对自己的统计学知识有了更深的理解,做到了学以致用,也加强了计算机基础知识的巩固,另外,在本次的实训活动中我们所收获知识较多既有学习中的也有生活中。在学习中我们将自己所学的知识应用于实际的操作中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼。本次实训还开阔了我的视野,使我对统计在现实中的运作有了进一步的理解。

我们这次实训时间较短,只是短短的两天。我们所学到的知识相对来说还是少之又少的,因此,在以后涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。同时,我们以后无论是在学习知识上,还是实际运用上都要学习运用统计学知识。


相关文章

  • 事故报告统计制度
  • 中国石油天然气股份有限公司 事故报告统计制度 石油质字[2000]第231号 第一条 为了加强事故管理工作,及时准确地报告.记录.统计分析事故,根据国家和政府主管部门有关事故法规及<中国石油天然气股份有限公司事故管理暂行规定>, ...查看


  • 教育统计分析报告写作7.16
  • 教育统计分析报告的写作 案例1:从教育统计工作存在的问题谈起: 个人曾经在高校教育统计岗位上工作了很短的一段时间,对教育统计工作有些关注: 1.教育统计工作的"任务观":这是上级下达的任务,必须完成统计工作,因而缺乏分析 ...查看


  • 统计分析报告概述及范文
  • 统计分析报告概述及范文 什么是统计分析报告 统计分析报告(Statistical Analysis Report).统计分析报告,就是指运用统计资料和统计分析方法,以独特的表达方法和结构特点,表现所研究事物本质和规律性的一种应用文章.统计分 ...查看


  • 应用统计学试验二报告模板研究生
  • 高级管理统计实验报告 一.实验目的 本实验是<高级管理统计>课程的实践环节,通过实验,对所学理论知识进行进一步理解.让学生能够应用SPSS软件有效提高学生的数据处理能力,使学生掌握研究群体现象的基本方法,获得处理实际管理问题的本 ...查看


  • 矿山机械行业薪酬情况统计分析报告2016版
  • 矿山机械行业薪酬情况统计分析报告2016版 <矿山机械行业薪酬状况统计分析报告2016版>以中华产业网历年对矿山机械行业内重点企业调查访问获得的一手数据资料为基础,结合劳动局.工信部等权威部门的数据,对矿山机械行业薪酬状况进行了 ...查看


  • 中国城市茶叶消费情况调查统计报告2016版
  • 中国城市茶叶消费情况调查统计报告2016版 <中国城市茶叶消费情况调查统计报告2016版>包括:调研样本介绍.茶叶消费量月度统计分析.茶叶价格月度变动统计分析.茶叶家庭月度购买频率统计分析四部分内容.报告依据城市的政治地位.经济 ...查看


  • 2015年薪酬报告
  • 2015年度太智联合薪酬智库报告 ---年末盘点 本报告薪酬福利数据内容仅供参考 本报告所有方法论及信息内容的最终解释权归太智联合所有 欲了解更多信息请与太智联合薪酬数据研究中心联系 电话:400-809-8577 或访问:www.taiz ...查看


  • 管理统计学实验报告
  • 实 验 报 告 课 程 管理统计学 班 级 09信息管理与信息系统 学 号 091104006 姓 名 郭 诚 实验项目数 6 2011年5月 赣南师范学院 商学院 经济管理实验教学中心制 实验 一 (实验项目序号) 管理统计学 课程实验报 ...查看


  • 医疗器械临床试验中的统计学问题(非原创)
  • 医疗器械临床试验中的统计学问题 <医疗器械临床试验规定>第十四条要求, 医疗器械临床试验方案应当针对具体受试产品的特性, 确定临床试验例数.持续时间和临床评价标准, 使试验结果具有统计学意义. 因此, 医疗器械临床试验中的统计学 ...查看


  • 财产保险公司经营指标
  • 险公司经营分析指标 (征求意见稿) 目 录 1. 引言 ............................................................................................ ...查看


热门内容