统计学知识点
1. 统计学的研究对象 统计学的研究对象:统计研究所要认识的客体。所谓客体是指客观存在的社会经济现象的数量特征和数量关系。 统计学研究对象的特点:(1)数量性(2)总体性(3)变异性 2. 统计总体、总体单位、填报单位
统计总体, 是指客观存在的,在某一相同性质基础上结合起来的许多个别事物组成的整体。统计总体的基本特征是:(1)大量性,即总体所包含的单位数要足够多;(2)同质性,即总体中各单位最少在某一方面具有共同性质;(3)变异性,即总体中各单位存在多方面的差异。总体单位:构成统计总体的个体单位称总体单位。
填报单位:负责向上报告调查内容,提交统计资料的单位。 3什么是总体标志总量、总体单位总量?
总体标志总量:总体单位某一数量标志的标志值总和 总体单位总量:总体所包含的总体单位的数量 4. 什么叫标志值?
可变的数量标志和所有的统计指标称变量。变量的数值表现称变量值,即标志值或指标值。 5. 什么是抽样调查?
抽样调查是指从调查总体中按照随机原则抽取一部分单位组成进行观测,并用这部分单位的资料推断总体数量特征的一种统计方法。其主要特点是:(1)按照随机原则抽取调查单位;(2)用样本数据推断总体指标;(3)存在抽样误差,但可以计算并加以控制。 6. 统计分组的关键是什么?
分组标志的选择是统计分组的关键。
7. 什么是比较相对指标、比例相对指标? 比较相对指标:是将两个同类指标作静态对比得出的综合指标,表明同类现象在不同条件下的数量对比关系。 比例相对指标:同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。
8. 什么叫频数密度?
次数密度(频数密度)=各组次数/各组组距 9. 什么是时期指标、时点指标?
时期指标是说明总体现象在一定时期内累计总量水平的指标,而时点指标是说明总体现象在某一时刻状态下总量水平的指标。其区别是:(1)指标数值的可加性不同;(2)指标数值的大小与时间单位的关系不同;(3)指标数值的来源不同。
时期指标不能用于反映时点的状况;时点指标要以序时平均数的形式来反映时期的水平。 10. 什么情况下用加权算术平均数、加权调和平均数?
若只知 x 和xf ,而f 未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。
加权算术平均数:权数是分母 =
∑xf
∑f
加权调和平均数:权数是分子 =
∑xf
1∑xf x
11. 比较平均指标的代表性
12什么时候用标准差,什么时候用标准差系数?
标准差:是方差的算术平方根。也称均方差、均方根差、离差均方根等。标准差是反映总体分布趋势的重要特征值在现实生活中具有广泛的利用价值. 比如产品质量检验、教学质量评估等。
标准差系数 根据标准差与算术平均数对比的离散系数,称作标准差系数用"V" 表示,反映各单位标志值的离散程度。 13. 算术平均数的性质
(1)变量值与其算术平均数的离差之和衡等于零。即:∑(x -) =0 (2)变量值与其算术平均数的离差平方和为最小。即:∑(x -) 2=min 14. 标志变异指标与平均代表性的关系 标志变异指标越大,平均代表性越小 15. 定基发展速度与环比发展速度的关系 定基发展速度(总速度)
a a 1a 2
, , , n a 0a 0a 0a a 1a 2
, , , n a 0a 1a n -1
环比发展速度(年速度)
a a a a a a a a a 1a 2
⨯⨯ ⨯n -1⨯n =n i ÷i -1=i ⨯0=i (i =1, 2, n )
a 0a 0a 0a i -1a i -1a 0a 1a n -2a n -1a 0
16. 年平均发展速度的计算
⑴ 几何平均法(水平法)a n =a 0⋅X G
n
X G =a n =R =X 1⋅X 2 X n =∏X a 0
【例】计算1985~1990年间我国GNP 的平均发展速度及平均增长速度(资料见P275表9-7): 解:平均发展速度为:X G =17695. 3=2. 0678=115. 64﹪
8557. 6
﹪-100﹪=15. 64﹪ 平均增长速度为:X G -1=115. 64
⑵ 方程法(累计法)X +X
n
n -1
+ +X +X =∑a i 0
i =1
2
n
求解方法 (关于 X 的一元n 次方程)
①逐渐逼近法 ②查“累计法查对表”法
【例】某公司2000年实现利润15万元,计划今后三年共实现利润60万元,求该公司利润应按多大速度增长才能达到目的。
已知a 0=15, a 1+a 2+a 3=60, n =3,
解: 则X +X +X -
3
23
2
∑a
i =1
n
i
0=0,即
X +X +X -4=0,解得X =1. 151
17. 编制综合指数最重要的问题是同度量因素
“理想公式”:是对拉氏指数和派氏指数所求的几何平均数
K P =K Q =
P Q ⨯P Q P Q P Q Q P ⨯Q P Q P Q P
1
1
1000
11
1101
拉氏数量指数 优点:未包含价格的变动,真实反映数量的变动 缺点:报告期的新产品在基期没有价
格,给指数计算带来限制
派氏数量指数 优点:克服了拉氏数量指数的缺点 缺点:以报告期价格作为同度量因素,数量指数中已
包含了价格变动的影响,与数量指数的编制初衷不符
数量指标质量指标Q P
式中:k q =1, k p =1 括号内为权数
0个体指数0个体指数
19. 重复抽样
不重复抽样无放回抽样 最为常用的抽样方法,用于无限总体和许多有限总体的抽样。 重复抽样放回抽样 通常只在必须使样本单位能重复出现时使用 20. 什么是总量指标?列举
反映现象总体规模或水平的综合指标,即数量指标,也称为绝对数
例如,2008年我国国内生产总值为300670亿元。有时,总量指标还可以表现为总量之间的绝对差数,例如,2008年末我国就业人员比上年末增加490万人。 21. 什么是结构相对指标? 利用分组法,将总体区分为不同性质的各部分,以部分数值与总体全部数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。
总体部分数值
⨯100﹪
相对数总体全部数值
=
(1)为无名数; (2)同一总体各组的结构相对数之和为1; (3)用来分析现象总体的内部构成状况。 22. 标志变异指标有哪些?
全距、四分位差、平均差、方差与标准差、离散系数 23. 位置平均数有哪些? 众数、中位数、分位数 24. 数值平均数有哪些?
算术平均数、调和平均数、几何平均数、平方平均数 25. 计算平均发展的方法有哪几个? ⑴ 几何平均法(水平法) ⑵ 方程法(累计法)
26. 在平均指标中,哪些不受极端影响? 众数 中位数
27. 在次数分布数列中
(1)各组次数之和等于总次数 (2)各组频率之和等于1 (3)各组频率大于0小于1
(4)频率越小,该组标志值所起作用越小 28. 影响抽样平均误差的因素?
抽样误差是由于样本的随机性带来的样本指标与总体指标之间的一种误差。影响抽样误差的主要因素是:(1)总体被研究标志的变异程度;(2)样本单位数目的多少;(3)抽样的组织方式;(4)抽样方法。
29. 什么是强度相对指标?有几种形式?
强度相对数是两个性质不同,但有一定联系的总量指标对比的结果,用来表明现象的强度、密度和普遍程度的综合指标。
结构
某一总量指标数值
的总量指标数值相对数另一有联系但性质不同
=
分类:正指标 、逆指标
30. 什么是简单分组、复合分组?
简单分组:即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
强度
复合分组:指对所研究的总体按两个或两个以上的标志进行的多层次分组。可用于对事物多方面、多层次的分析研究。
31. 统计有几种含义,它们之间的关系? 统计有三种涵义:(1)统计工作,即对客观现象的数量方面进行的搜集、整理和分析活动;(2)统计资料,是统计活动过程中所取得的各项数字资料以及与之相联系的其他资料的总称;(3)统计学,是一门关于研究客观事物数量方面和数量关系的方法论科学。
统计工作和统计资料是活动过程和活动成果的关系,统计学和统计工作是理论和实践的关系。
32. 标志与指标的联系与区别
区别是:(1)标志是说明总体单位特征的, 而指标是说明总体数量特征的, 即反映对象不同;(2)标志既可以用数字也可用文字表示, 而指标全部用数字表示, 即表现形式不同。 联系是:(1)汇总关系,即许多统计指标的数值是由标志表现汇总而成;(2)转化关系,即随着研究目的的变化,两者可以相互转化。 33. 什么是抽样调查及特点?
抽样调查是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。
特点: 调查范围:非全面 ; 调查时间:经常或一时 ;组织形式:专门调查 34. 序时平均值与一般平均值的联系和区别?
相同之处是两者都是将研究现象的个别数量差异抽象化,概括地来反映现象的一般水平。 不同之处:(1)序时平均数是根据动态数列计算的,而一般平均数通常是根据变量数列计算的。(2)序时平均数所平均的是研究现象本身的数量在不同时间上的差异,而一般平均数所平均的是总体各单位某一标志值的差异。(3)序时平均数是从动态上表明被研究现象本身在一段时间内的平均发展水平;而一般平均数是从静态上说明总体各单位某一数量标志的平均水平。
35. 一个完整的统计调查方案包括哪些内容? 统计调查方案应包括的内容有:(1)确定调查目的和任务;(2)确定调查对象和调查单位;(3)确定调查项目和设计调查表;(4)确定调查时间、地点和方式方法;(5)拟定调查的组织实施计划。
36. 影响抽样数目多少的因素? 主要影响因素有:(1)总体被研究标志的变异程度;(2)对推断精确度的要求;(3)对推断可靠性的要求;(4)抽样的组织方式和方法;(5)人力、物力、财力的允许条件。 37. 相关系数r=1完全正相关 r=—1完全负相关
统计学知识点
1. 统计学的研究对象 统计学的研究对象:统计研究所要认识的客体。所谓客体是指客观存在的社会经济现象的数量特征和数量关系。 统计学研究对象的特点:(1)数量性(2)总体性(3)变异性 2. 统计总体、总体单位、填报单位
统计总体, 是指客观存在的,在某一相同性质基础上结合起来的许多个别事物组成的整体。统计总体的基本特征是:(1)大量性,即总体所包含的单位数要足够多;(2)同质性,即总体中各单位最少在某一方面具有共同性质;(3)变异性,即总体中各单位存在多方面的差异。总体单位:构成统计总体的个体单位称总体单位。
填报单位:负责向上报告调查内容,提交统计资料的单位。 3什么是总体标志总量、总体单位总量?
总体标志总量:总体单位某一数量标志的标志值总和 总体单位总量:总体所包含的总体单位的数量 4. 什么叫标志值?
可变的数量标志和所有的统计指标称变量。变量的数值表现称变量值,即标志值或指标值。 5. 什么是抽样调查?
抽样调查是指从调查总体中按照随机原则抽取一部分单位组成进行观测,并用这部分单位的资料推断总体数量特征的一种统计方法。其主要特点是:(1)按照随机原则抽取调查单位;(2)用样本数据推断总体指标;(3)存在抽样误差,但可以计算并加以控制。 6. 统计分组的关键是什么?
分组标志的选择是统计分组的关键。
7. 什么是比较相对指标、比例相对指标? 比较相对指标:是将两个同类指标作静态对比得出的综合指标,表明同类现象在不同条件下的数量对比关系。 比例相对指标:同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。
8. 什么叫频数密度?
次数密度(频数密度)=各组次数/各组组距 9. 什么是时期指标、时点指标?
时期指标是说明总体现象在一定时期内累计总量水平的指标,而时点指标是说明总体现象在某一时刻状态下总量水平的指标。其区别是:(1)指标数值的可加性不同;(2)指标数值的大小与时间单位的关系不同;(3)指标数值的来源不同。
时期指标不能用于反映时点的状况;时点指标要以序时平均数的形式来反映时期的水平。 10. 什么情况下用加权算术平均数、加权调和平均数?
若只知 x 和xf ,而f 未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。
加权算术平均数:权数是分母 =
∑xf
∑f
加权调和平均数:权数是分子 =
∑xf
1∑xf x
11. 比较平均指标的代表性
12什么时候用标准差,什么时候用标准差系数?
标准差:是方差的算术平方根。也称均方差、均方根差、离差均方根等。标准差是反映总体分布趋势的重要特征值在现实生活中具有广泛的利用价值. 比如产品质量检验、教学质量评估等。
标准差系数 根据标准差与算术平均数对比的离散系数,称作标准差系数用"V" 表示,反映各单位标志值的离散程度。 13. 算术平均数的性质
(1)变量值与其算术平均数的离差之和衡等于零。即:∑(x -) =0 (2)变量值与其算术平均数的离差平方和为最小。即:∑(x -) 2=min 14. 标志变异指标与平均代表性的关系 标志变异指标越大,平均代表性越小 15. 定基发展速度与环比发展速度的关系 定基发展速度(总速度)
a a 1a 2
, , , n a 0a 0a 0a a 1a 2
, , , n a 0a 1a n -1
环比发展速度(年速度)
a a a a a a a a a 1a 2
⨯⨯ ⨯n -1⨯n =n i ÷i -1=i ⨯0=i (i =1, 2, n )
a 0a 0a 0a i -1a i -1a 0a 1a n -2a n -1a 0
16. 年平均发展速度的计算
⑴ 几何平均法(水平法)a n =a 0⋅X G
n
X G =a n =R =X 1⋅X 2 X n =∏X a 0
【例】计算1985~1990年间我国GNP 的平均发展速度及平均增长速度(资料见P275表9-7): 解:平均发展速度为:X G =17695. 3=2. 0678=115. 64﹪
8557. 6
﹪-100﹪=15. 64﹪ 平均增长速度为:X G -1=115. 64
⑵ 方程法(累计法)X +X
n
n -1
+ +X +X =∑a i 0
i =1
2
n
求解方法 (关于 X 的一元n 次方程)
①逐渐逼近法 ②查“累计法查对表”法
【例】某公司2000年实现利润15万元,计划今后三年共实现利润60万元,求该公司利润应按多大速度增长才能达到目的。
已知a 0=15, a 1+a 2+a 3=60, n =3,
解: 则X +X +X -
3
23
2
∑a
i =1
n
i
0=0,即
X +X +X -4=0,解得X =1. 151
17. 编制综合指数最重要的问题是同度量因素
“理想公式”:是对拉氏指数和派氏指数所求的几何平均数
K P =K Q =
P Q ⨯P Q P Q P Q Q P ⨯Q P Q P Q P
1
1
1000
11
1101
拉氏数量指数 优点:未包含价格的变动,真实反映数量的变动 缺点:报告期的新产品在基期没有价
格,给指数计算带来限制
派氏数量指数 优点:克服了拉氏数量指数的缺点 缺点:以报告期价格作为同度量因素,数量指数中已
包含了价格变动的影响,与数量指数的编制初衷不符
数量指标质量指标Q P
式中:k q =1, k p =1 括号内为权数
0个体指数0个体指数
19. 重复抽样
不重复抽样无放回抽样 最为常用的抽样方法,用于无限总体和许多有限总体的抽样。 重复抽样放回抽样 通常只在必须使样本单位能重复出现时使用 20. 什么是总量指标?列举
反映现象总体规模或水平的综合指标,即数量指标,也称为绝对数
例如,2008年我国国内生产总值为300670亿元。有时,总量指标还可以表现为总量之间的绝对差数,例如,2008年末我国就业人员比上年末增加490万人。 21. 什么是结构相对指标? 利用分组法,将总体区分为不同性质的各部分,以部分数值与总体全部数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。
总体部分数值
⨯100﹪
相对数总体全部数值
=
(1)为无名数; (2)同一总体各组的结构相对数之和为1; (3)用来分析现象总体的内部构成状况。 22. 标志变异指标有哪些?
全距、四分位差、平均差、方差与标准差、离散系数 23. 位置平均数有哪些? 众数、中位数、分位数 24. 数值平均数有哪些?
算术平均数、调和平均数、几何平均数、平方平均数 25. 计算平均发展的方法有哪几个? ⑴ 几何平均法(水平法) ⑵ 方程法(累计法)
26. 在平均指标中,哪些不受极端影响? 众数 中位数
27. 在次数分布数列中
(1)各组次数之和等于总次数 (2)各组频率之和等于1 (3)各组频率大于0小于1
(4)频率越小,该组标志值所起作用越小 28. 影响抽样平均误差的因素?
抽样误差是由于样本的随机性带来的样本指标与总体指标之间的一种误差。影响抽样误差的主要因素是:(1)总体被研究标志的变异程度;(2)样本单位数目的多少;(3)抽样的组织方式;(4)抽样方法。
29. 什么是强度相对指标?有几种形式?
强度相对数是两个性质不同,但有一定联系的总量指标对比的结果,用来表明现象的强度、密度和普遍程度的综合指标。
结构
某一总量指标数值
的总量指标数值相对数另一有联系但性质不同
=
分类:正指标 、逆指标
30. 什么是简单分组、复合分组?
简单分组:即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
强度
复合分组:指对所研究的总体按两个或两个以上的标志进行的多层次分组。可用于对事物多方面、多层次的分析研究。
31. 统计有几种含义,它们之间的关系? 统计有三种涵义:(1)统计工作,即对客观现象的数量方面进行的搜集、整理和分析活动;(2)统计资料,是统计活动过程中所取得的各项数字资料以及与之相联系的其他资料的总称;(3)统计学,是一门关于研究客观事物数量方面和数量关系的方法论科学。
统计工作和统计资料是活动过程和活动成果的关系,统计学和统计工作是理论和实践的关系。
32. 标志与指标的联系与区别
区别是:(1)标志是说明总体单位特征的, 而指标是说明总体数量特征的, 即反映对象不同;(2)标志既可以用数字也可用文字表示, 而指标全部用数字表示, 即表现形式不同。 联系是:(1)汇总关系,即许多统计指标的数值是由标志表现汇总而成;(2)转化关系,即随着研究目的的变化,两者可以相互转化。 33. 什么是抽样调查及特点?
抽样调查是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。
特点: 调查范围:非全面 ; 调查时间:经常或一时 ;组织形式:专门调查 34. 序时平均值与一般平均值的联系和区别?
相同之处是两者都是将研究现象的个别数量差异抽象化,概括地来反映现象的一般水平。 不同之处:(1)序时平均数是根据动态数列计算的,而一般平均数通常是根据变量数列计算的。(2)序时平均数所平均的是研究现象本身的数量在不同时间上的差异,而一般平均数所平均的是总体各单位某一标志值的差异。(3)序时平均数是从动态上表明被研究现象本身在一段时间内的平均发展水平;而一般平均数是从静态上说明总体各单位某一数量标志的平均水平。
35. 一个完整的统计调查方案包括哪些内容? 统计调查方案应包括的内容有:(1)确定调查目的和任务;(2)确定调查对象和调查单位;(3)确定调查项目和设计调查表;(4)确定调查时间、地点和方式方法;(5)拟定调查的组织实施计划。
36. 影响抽样数目多少的因素? 主要影响因素有:(1)总体被研究标志的变异程度;(2)对推断精确度的要求;(3)对推断可靠性的要求;(4)抽样的组织方式和方法;(5)人力、物力、财力的允许条件。 37. 相关系数r=1完全正相关 r=—1完全负相关