大数据:多重线性回归分析的四大纪律三项注意

鉴于多重线性回归已经到了滥用的程度,特总结一下在使用线性回归时需要注意的问题,总结为四大纪律加三项注意。

四大纪律

四大纪律之一:自变量与因变量之间要存在线性关系,可以通过绘制散点图矩阵来考察,若不符合,需要进行变量的变换予以修正。

四大纪律之二:各个观测值y1\y2\y3......要相互独立,可通过残差图或durbin-watson检验予以考察。

四大纪律之三:残差服从正态分布,可以通过标准化残差图考察

四大纪律之四:方差齐性,也可以通过标准化残差考察

三项注意

三项注意之一:样本量为自变量个数的5倍以上,要想效果好一些,最好20倍以上。

三项注意之二:判断有误强影响点,如有应该改正数据或者剔除或采用稳健回归。

三项注意之三:判断自变量之间有无强相关性,如有改用岭回归等方法。

例题说明:

某个公司计划在国内在开设几家分店,收集了目前分店的销售数据y以及分店所在城市的16岁以下人数x1,人均可支配收入x2,试进行分析(选自张文彤spss统计分析高级教程99页)

1.数据

两个自变量,21个样本含量,符合20倍原则

绘制散点图矩阵

从图中可以看出,因变量与每个自变量都有线性关系

上图分别检查共线性,独立性和异常点

做残差图,横坐标为因变量,纵坐标为标准化残差

调整r的平方越近与1,回归效果越好,0.907效果不错,durbin watson值在2左右说明残差独立性较好。

p=0.000小于0.05,线性回归为显著

回归方程为y=-6.886+0.009人均支配收入+1.455人数,vif为方差膨胀因子一般只要不超过10,认为不存在共线性

pp图,点在直线附近分布,近似一条直线,说明残差服从正态分布

残差图,三点在零的附近均匀分布,而且没有超过正负3,认为残差服从正态分布且方差齐,且没有强影响点。

作者:杨老师

鉴于多重线性回归已经到了滥用的程度,特总结一下在使用线性回归时需要注意的问题,总结为四大纪律加三项注意。

四大纪律

四大纪律之一:自变量与因变量之间要存在线性关系,可以通过绘制散点图矩阵来考察,若不符合,需要进行变量的变换予以修正。

四大纪律之二:各个观测值y1\y2\y3......要相互独立,可通过残差图或durbin-watson检验予以考察。

四大纪律之三:残差服从正态分布,可以通过标准化残差图考察

四大纪律之四:方差齐性,也可以通过标准化残差考察

三项注意

三项注意之一:样本量为自变量个数的5倍以上,要想效果好一些,最好20倍以上。

三项注意之二:判断有误强影响点,如有应该改正数据或者剔除或采用稳健回归。

三项注意之三:判断自变量之间有无强相关性,如有改用岭回归等方法。

例题说明:

某个公司计划在国内在开设几家分店,收集了目前分店的销售数据y以及分店所在城市的16岁以下人数x1,人均可支配收入x2,试进行分析(选自张文彤spss统计分析高级教程99页)

1.数据

两个自变量,21个样本含量,符合20倍原则

绘制散点图矩阵

从图中可以看出,因变量与每个自变量都有线性关系

上图分别检查共线性,独立性和异常点

做残差图,横坐标为因变量,纵坐标为标准化残差

调整r的平方越近与1,回归效果越好,0.907效果不错,durbin watson值在2左右说明残差独立性较好。

p=0.000小于0.05,线性回归为显著

回归方程为y=-6.886+0.009人均支配收入+1.455人数,vif为方差膨胀因子一般只要不超过10,认为不存在共线性

pp图,点在直线附近分布,近似一条直线,说明残差服从正态分布

残差图,三点在零的附近均匀分布,而且没有超过正负3,认为残差服从正态分布且方差齐,且没有强影响点。

作者:杨老师


相关文章

  • 计量经济学复习重点
  • 1 计量经济学复习重点 第一章 1. 计量经济学的性质 计量经济学是以经济理论和经济数据的事实为依据运用数学和统计学的方法 通过建立数学模型来研究经济数量关系和规律的一门经济学科. 研究的主体出发点.归宿.核心经济现象及数量变化规 ...查看


  • 第四版应用回归分析课后习题第八章
  • 第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式.如: αβε y =AK L e , ( ...查看


  • 计量经济学_庞皓_第二版_思考题_答案
  • 第一章 绪论 思考题 1.1答:计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客 观需要.计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大生产对 各种经济因素和经济活动进行数量分析的客观要求.经济学 ...查看


  • 多元回归分析作业(北航)
  • 单位代码 学 号 分 类 号 密 级 应用数理统计(第一个论文) 山东省旅游发展影响因素多元回归分析 院(系)名 称 材料科学与工程学院 专 业 名 学 生 姓 名任 课 教 师 冯伟 2014年12月 摘要 本文主要通过对山东省旅游收入的 ...查看


  • 金融计量经济学教学大纲
  • 金融计量经济学课程教学大纲 课程名称:金融计量经济学 课程编号: 英文名称:Financial Econometrics 课程属性:必修课 学 时:48 学 分:3 先修课程:经济学.概率论与数理统计 后续课程:无 适用专业:金融学专业 一 ...查看


  • 统计学专业学生成绩的相关性分析
  • 安徽建筑大学 业 设 计 (论 文) 统计学专业学生成绩的 题 目 相关性分析 专 业 统计学 姓 名 王志海 班 级 1班 学 号 [1**********] 指导教师 宫珊珊 提交时间 2016.6.6 毕 统计学专业学生成绩的相关性分 ...查看


  • 多重多元回归分析
  • 第十一章 多重多元回归分析 普通回归分析是大家比较熟悉的一种方法,这里将借助复习初等数量统计中多元回归分析的主要内容,相应给出多重多元回归分析的主要内容(包括回归模型.回归式的求法.回归系数的检验等).而不做复杂的数学推导,仅给出相应的结论 ...查看


  • 我国钢铁产量影响因素的计量分析
  • 我国钢铁产量影响因素的计量分析 [摘要]:钢铁工业是国民经济中最重要的基础原材料产业和重要支撑产业.本文根据我国钢铁产量及其影响因素的时间序列数据,利用计量经济模型,分析我国钢铁产量与影响因素之间的关系,并通过模型对钢铁产量进行预测.结果表 ...查看


  • 多元回归分析SPSS
  • 多元线性回归分析预测法 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于 ...查看


热门内容