社会统计学总结

一、算数平均数:某一总体值总体单位平均所得的标志值的水平,是反映集中趋势最常用、最基本的平均指标。

二、中位数:把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值。

三、平均差:各变量值对其算术平均数(或中位数)离差绝对值的算术平均数。

四、标准差:各变量值对其算术平均数的离差平方的算数平均数的算数平方根,又称均方差。

五、方差:为标准差的平方。

六、众数:出现次数最多的变量值。用Mo表示。众数也是常用的反映现象集中趋势的代表性数值.

七、在社会统计中,表达相关关系的强弱,削减误差比例的概念是非常有价值的。削减误差比例的原理是,如果两变量间存在着一定的关联性,那么知道这种关联性,必然有助于我们通过一个变量去预测另一变量。其中关系密切者,在由一变量预测另一变量时,盲目性必然较关系不密切者为小。

八、皮尔逊相关系数:对于定距变量,根据其变量值的数学特征,我们自然可以引进更为精确的量化指标来反映它们之间的关程度。用来测量两个定距变量相关程度和方向的积差系数。它是由英国统计学家皮尔逊(Pearson)用积差方法推导出来,所以也称皮尔逊相关系数,用符号r表示。

九、一元回归分析:关于X为自变量、Y为不确定的因变量的变量关系,其中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示的回归分析。

十、中心极限定理:从任意一个总体中抽取样本量为n的样本,当n充分大时(在社会现象中,指n≥50),样本均值的抽样分布近似服从正态分布。

十一、P 值(显著度):1.是一个概率值

2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率

3.被称为观察到的(或实测的)显著性水平

H0 能被拒绝的最小值

十二、置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度 正态分布

1.由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出

2.描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述

3.可用于近似离散型随机变量的分布

例如: 二项分布

4.经典统计推断的基础

原假设: 待检验的假设,又称“0假设”

备择假设:与原假设对立的假设,又称研究假设

十三、否定域:不大可能出现的结果

十四、异众比率:非众数的频数与总体单位数的比值

十五、总体参数值:关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。

十六、样本统计值:关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表。

十七、Z分数:原始数据与均值之间的大小,实际表达变量值距算术平均数有几

个标准差。

十八、均值的标准误差:是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误) 越大,抽样误差就越大。所以用样本均值的标准误来衡量抽样误差的大小。

十九、斯皮尔曼相关系数:主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。

二十、置信水平与置信区间的关系:

置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度,或者说,总体参数值落在样本统计值某一区间的把握性程度。它反映的是绰约那个的可靠性程度。

置信区间:在一定的置信度下,样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。

二十一、区间估计与假设检验的关系:

1、 区间估计 立足于大概率,用已知样本统计量和标准误差,确定一个有概率意义的区间(置信区间),可理解为正向求解问题。

2、假设检验 立足于小概率,利用反证法原理,首先依据两种可能性建立两种假设,再从第一种假设出发,计算出特定统计量,判断该种假设是否成立。

3、联系:区间估计和假设检验可以看作同一个问题的不同表达方式。区间估计和假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,使用同一样本、同一统计量、同一分布,二者可以相互转换。

二十二、假设检验的理论基础: 采用逻辑上的反证法;依据统计上的小概率原理

假设检验的基本步骤:

(1)、建立虚无假设和研究假设,通常是将原假设作为

(2)、根据需要选择适当的显著性水平

(3)、根据样本数据计算出统计值,并根据显著性水平查处对应的临界值。

(4)、将临界值与统计值进行比较,若临界值大于统计值的绝对值,则接受虚无假设;反之,则接受研究假设。

二十三、中心极限定理的重要性:中心极限定理对大样本均值正态分布性质的揭示,为未知总体的研究奠定了理论基础。

二十四、标准差与标准误差的区别:1、标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;2、标准误差是样本均值的标准差,衡量的是样本均值的离散程度。

二十五、置信水平与置信区间的关系:1、置信水平表示总体参数值落在样本统计值某一区间的概率,也称置信度。用(1-α)表示。 2、置信区间指在一定的置信度下,样本值与总体值之间的误差范围,反映抽样的精确程度。

使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较小的置信水平则会得到一个较准确(较窄)的区间。

当置信水平1-α=0.90时,Zα/2=1.65;1-α=0.95时,Zα/2=1.96;1-α

=0.99,Zα/2=2.58

二十六、相关关系与因果关系的联系与区别:

区别:1、相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。2、因果关系是指两个或两个以上变量在行为机制上的依赖性,结果变量由原因变量决定,原因变量的变化会引起结果变量的变化。有单向因果关系和互为因果关系之分。

联系:具有因果关系的变量一定具有数学上的相关关系,而具有相关关系的变量不一定有因果关系。

二十七、公式:

1、皮尔逊相关系数

2、回归方程:

3、置信区间相关公式(双侧检验):

(1)、对于大样本的总体均值在1-α置信水平下的置信区间为:

σ为总体标准差,S为样本标准差,当σ未知,用S来替代。

(2)、对于小样本且σ未知时:

(3)、总体比例在1-α置信水平下的置信区间为

(4)、在抽样分布中:

1、Z作为检验大样本统计量,σ未知时

2、t作为小样本检验统计量时,σ未知:

当计算的Z值或t值等于或大于显著性水平下的Z值和t值,那么否定零假设。

一、算数平均数:某一总体值总体单位平均所得的标志值的水平,是反映集中趋势最常用、最基本的平均指标。

二、中位数:把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值。

三、平均差:各变量值对其算术平均数(或中位数)离差绝对值的算术平均数。

四、标准差:各变量值对其算术平均数的离差平方的算数平均数的算数平方根,又称均方差。

五、方差:为标准差的平方。

六、众数:出现次数最多的变量值。用Mo表示。众数也是常用的反映现象集中趋势的代表性数值.

七、在社会统计中,表达相关关系的强弱,削减误差比例的概念是非常有价值的。削减误差比例的原理是,如果两变量间存在着一定的关联性,那么知道这种关联性,必然有助于我们通过一个变量去预测另一变量。其中关系密切者,在由一变量预测另一变量时,盲目性必然较关系不密切者为小。

八、皮尔逊相关系数:对于定距变量,根据其变量值的数学特征,我们自然可以引进更为精确的量化指标来反映它们之间的关程度。用来测量两个定距变量相关程度和方向的积差系数。它是由英国统计学家皮尔逊(Pearson)用积差方法推导出来,所以也称皮尔逊相关系数,用符号r表示。

九、一元回归分析:关于X为自变量、Y为不确定的因变量的变量关系,其中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示的回归分析。

十、中心极限定理:从任意一个总体中抽取样本量为n的样本,当n充分大时(在社会现象中,指n≥50),样本均值的抽样分布近似服从正态分布。

十一、P 值(显著度):1.是一个概率值

2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率

3.被称为观察到的(或实测的)显著性水平

H0 能被拒绝的最小值

十二、置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度 正态分布

1.由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出

2.描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述

3.可用于近似离散型随机变量的分布

例如: 二项分布

4.经典统计推断的基础

原假设: 待检验的假设,又称“0假设”

备择假设:与原假设对立的假设,又称研究假设

十三、否定域:不大可能出现的结果

十四、异众比率:非众数的频数与总体单位数的比值

十五、总体参数值:关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。

十六、样本统计值:关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表。

十七、Z分数:原始数据与均值之间的大小,实际表达变量值距算术平均数有几

个标准差。

十八、均值的标准误差:是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误) 越大,抽样误差就越大。所以用样本均值的标准误来衡量抽样误差的大小。

十九、斯皮尔曼相关系数:主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。

二十、置信水平与置信区间的关系:

置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度,或者说,总体参数值落在样本统计值某一区间的把握性程度。它反映的是绰约那个的可靠性程度。

置信区间:在一定的置信度下,样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。

二十一、区间估计与假设检验的关系:

1、 区间估计 立足于大概率,用已知样本统计量和标准误差,确定一个有概率意义的区间(置信区间),可理解为正向求解问题。

2、假设检验 立足于小概率,利用反证法原理,首先依据两种可能性建立两种假设,再从第一种假设出发,计算出特定统计量,判断该种假设是否成立。

3、联系:区间估计和假设检验可以看作同一个问题的不同表达方式。区间估计和假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,使用同一样本、同一统计量、同一分布,二者可以相互转换。

二十二、假设检验的理论基础: 采用逻辑上的反证法;依据统计上的小概率原理

假设检验的基本步骤:

(1)、建立虚无假设和研究假设,通常是将原假设作为

(2)、根据需要选择适当的显著性水平

(3)、根据样本数据计算出统计值,并根据显著性水平查处对应的临界值。

(4)、将临界值与统计值进行比较,若临界值大于统计值的绝对值,则接受虚无假设;反之,则接受研究假设。

二十三、中心极限定理的重要性:中心极限定理对大样本均值正态分布性质的揭示,为未知总体的研究奠定了理论基础。

二十四、标准差与标准误差的区别:1、标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;2、标准误差是样本均值的标准差,衡量的是样本均值的离散程度。

二十五、置信水平与置信区间的关系:1、置信水平表示总体参数值落在样本统计值某一区间的概率,也称置信度。用(1-α)表示。 2、置信区间指在一定的置信度下,样本值与总体值之间的误差范围,反映抽样的精确程度。

使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较小的置信水平则会得到一个较准确(较窄)的区间。

当置信水平1-α=0.90时,Zα/2=1.65;1-α=0.95时,Zα/2=1.96;1-α

=0.99,Zα/2=2.58

二十六、相关关系与因果关系的联系与区别:

区别:1、相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。2、因果关系是指两个或两个以上变量在行为机制上的依赖性,结果变量由原因变量决定,原因变量的变化会引起结果变量的变化。有单向因果关系和互为因果关系之分。

联系:具有因果关系的变量一定具有数学上的相关关系,而具有相关关系的变量不一定有因果关系。

二十七、公式:

1、皮尔逊相关系数

2、回归方程:

3、置信区间相关公式(双侧检验):

(1)、对于大样本的总体均值在1-α置信水平下的置信区间为:

σ为总体标准差,S为样本标准差,当σ未知,用S来替代。

(2)、对于小样本且σ未知时:

(3)、总体比例在1-α置信水平下的置信区间为

(4)、在抽样分布中:

1、Z作为检验大样本统计量,σ未知时

2、t作为小样本检验统计量时,σ未知:

当计算的Z值或t值等于或大于显著性水平下的Z值和t值,那么否定零假设。


相关文章

  • 县市社会扶贫工作总结范文
  • 县市社会扶贫工作总结范文 单位工作总结 查阅次数:49次 发布人:范文网编辑 推荐阅读: 以下关于社会扶贫工作总结范文由查字典范文大全整理,希望对您有帮助. 关于报送20XX年社会扶贫工作总结和相关统计数据的通知 各... 以下关于社会扶贫 ...查看


  • 2011年统计局工作总结
  • 格尔木市统计局文件 格统字[2011]36号 格尔木市统计局 关于上报2011年工作总结的报告 市人民政府: 根据市政府办公室的安排,现将我局2011年工作总结随文呈 上,请审示. 二0一一年十一月十日 主题词: 工作总结 报告 抄报:市委 ...查看


  • 统计工作个人总结
  • 统计工作个人总结 统计工作>个人总结(一) 20**年以来,在领导以及同事的关心.帮助下,我爱岗敬业,尽职尽责,坚持务实的工作作风.坚定的思想信念和饱满的工作热情,较好地完成了自己的本职工作和领导交办的各项工作,工作能力.业务管理水平 ...查看


  • 统计局年度工作总结
  • 统计局2013年工作总结 2013年,在市委.市政府的正确领导和上级统计部门的指导下,我市统计工作以科学发展观为统领,以开展群众路线教育实践活动为契机,深入贯彻落实党的十八大.十八届三中全会.省委.市委全会及全国.全省统计工作会议精神,紧紧 ...查看


  • 计算机人事管理工作实习总结
  • 通过理论联系实际,巩固所学的知识,提高处理实际问题的能力,了解设计专题的主要内容,为毕业设计的顺利进行做好充分的准备,并为自己能顺利与社会环境接轨做准备. 对计算机在人事管理方面的应用进行归纳总结,并查阅资料为毕业设计作准备. 计算机在人事 ...查看


  • 计划生育统计员个人工作总结
  • 2013年个人总结 从2013年10月到普合苗族乡从事人口和计划生育工作以来,我努力工作,虚心向老同 学习,在乡党委.政府的支持与领导下,在乡计生办的指导下,按照"十八届三中全会"会 议精神要求,全面贯彻落实<决定 ...查看


  • 档案资料整理参考目录
  • 中小学学校管理档案资料整理参考目录 2010-03-16 15:42:42|  分类: 教育管理 |  标签: |字号大中小 订阅 中小学学校管理档案资料整理参考目录 各学校应根据36条标准和评估要求注释,结合学校工作实际,整理出全面.详实 ...查看


  • 县统计局2006年以来工作总结和今后5年工作打算
  • 某县统计局 2006年以来工作总结和今后5年工作打算 2011年主要工作概况 2011年开年以来,我局紧紧围绕县委.县府的中心工作和上级统计部门的工作重点,奋力拼搏,扎实工作,按时按质的完成了今年预计各项工作任务. 一.高质高效的完成全国第 ...查看


  • 销售统计员工作总结与计划范文
  • 最新销售统计员工作岗位 工作总结与计划 ==适合销售统计员工作述职.职称评审.工作总结报告== 个人原创销售统计员工作岗位总结与计划 有效防止雷同!简单修改即可使用! 目 录 前言······························ ...查看


  • 市统计局法制宣传月活动工作总结
  • 为认真学习贯彻党的十八届四中全会.省委十届五次全会精神和州市有关要求部署,大力弘扬社会正气和法治精神,扎实推进全民大普法,全面落实"六五"普法规划.决议,掀起新一轮学习宣传法律热潮.认真贯彻落实,充分发挥法制宣传教育在维 ...查看


热门内容