汽车销量预测
摘要
汽车工业在我国已有50 多年的发展历史, 而汽车产业真正得到快速发展是从上世纪90 年代开始的。现在汽车工业在我国经济中已占有很重要的地位。预测汽车的销售量,无论是对于整体掌控汽车市场的发育与成长态势的政策制定者,还是对于研究市场行情以制定营销策略的汽车厂商而言,都具有极其重要的作用。我们通过网络搜索相关数据,然后运用线性回归及灰色预测对汽车销量进行数学建模分析预测,然后再对模型进行评估修改。
关键词:汽车销量 线性回归 灰色预测
一.问题重述
1.问题背景 近年来,随着国民经济和社会的进一步发展,汽车工业也逐步成为中国的支柱性产业之一,汽车市场表现出产销两旺的发展态势。而汽车市场是汽车工业的晴雨表,预测汽车的销售量,无论是对于整体掌控汽车市场的发育与成长态势的政策制定者而言,还是对于研究市场行情以制定营销策略的汽车厂商而言,都具有极其重要的作用。
2.需要解决的问题
问题一:影响汽车销量的因素有哪些?
问题二:通过数据建立数学模型并进行预测。 问题三:验证并修改数学模型。
二.问题分析
一.对问题一的分析
在这里我门选取了汽车产量、公路长度、城镇居民收入、GDP这样一些因素来考虑,当然影响汽车销售的因素远不止如此石油价格上涨,银行存款利率等都会对汽车销量有影响。并且这些因素也是相互影响的。这里为了简单考虑我们把每一个因素单独列出来,研究其余汽车销量的关系。我们通过互联网搜索获得以下数据:
二.对问题二的分析
对于问题二我们有两种思路,第一个是通过问题一得到的相关数据及结论运用线性回归的知识建立数学模型。但是通过线性回归得到的方程却还不够,因为线性方程故事汽车销量需要知道汽车产量、公路长度、GDP这样一些数据,但我们不知到以后的汽车产量、公路长度、GDP。这里吗有许多不确定因素所以我们采用灰色预测的方法来预测汽车销量。
三、模型假设与约定
国家经济处于一种正常平稳的发展趋势,不能有类似于08年的金融危机。
四、模型建立
模型一:各个因素对汽车销量的影响 年份 2004 2005 2006 汽车销
507 576 722
量
增长率 16% 14% 25%
2007 879 22%
2008 938 7%
2009 1364 46%
2010 1806 32.40%
年份
2003 2004 2005 2006 2007 2008 2009 2010
GDP(百亿) GDP增长率
135.82159.87184.93216.31265.81314.04340.90307.98
28 83 74 44 03 543 28 32 9.30% 9.40% 10.70% 12.00% 13.60%
9.10% 8.60%
年份 汽车增长率
GDP增长率
2004 16% 9.40%
2005 14% 10.70%
2006 25% 12.00%
2007 22% 13.60%
2008 7% 9.10%
2009 46% 8.60%
2008
2009
2010
年份 GDP(百亿) 公路里程 汽车销量
2005 2006 2007
159.8784 184.9374 216.3144 265.8103 314.0454 340.90281 334.52
576
345.7 722
358.37 879
373.02 938
386.08 1364
395 1806
由以上的图表可以看出,汽车的增长量和GDP增长成指数相关,和公路里程数指数性相切合,和人均支配资金数成指数关系,所以我们假设: 车辆销量为Y,GDP为x1,公路里程数为x2,人均支配金额为x3.存在Y=a+b*Inx1+c*Inx2+d*Inx3
模型二:灰色预测法预测汽车销量
1.选取的数据时从04年至10年的汽车销量,时间序列初始值为:
设原始数列为x(0)[x(0)(1),x(0)(2),,x(0)(7)]=[507,577,722,879,934,1364,1807] 2.生成累加序列
把数列各项(时刻)数据依次累加的过程称为累加生成过程。令
x(k)x(0)(i),k1,2,,n,
(1)
i1k
称所得到的新数列x(1)[x(1)(1),x(1)(2),,x(1)(n)]为数列x(0)的1次累加生成数列。有
x(1)=[507,1064,1786,2665,3599,4963,6670] 3.计算级比
x(1)(k1)
级比:(k)(1),k2,3,,n.
x(k)
(2)=0.477 (3)=0.596 (4)=0.670 (5)=0.740 (6)=0.725 (7)=0.744
如果所有的级比都落在可容覆盖区间
X(e
2n1
,e
2n1
)内,则数据列x(0)可
以建立GM(1,1)模型且可以进行灰色预测。
4.建立GM(1.1)模型
dx(t)
ax(1)(t)u
dt
(1)
解为
ua(t1)u
x(t)(x(1))e.
aa
(1)
(0)
五、模型求解
模型一的求解:
由mathmatic软件运行可知:
In[1]:=A={{Log[184.9374],Log[104.93],Log[334.52]},{Log[265.8103],Log[137.858],Log[358.37]},{Log[340.9028],Log[171.747],Log[386.08]}}
Out[1]:={{5.22002,4.65329,5.8127},{5.58278,4.92622,5.88157},{5.8316,5.14602,5.95604}}
In[2]:=b={576,879,1364} Out[2]:={576,879,1364} In[3]:=LinearSolve[A,b]
Out[3]:={-6598.29,10476.3,-2362.1} 及得到公式
Y=10476.3*Inx2-6598.29*x1-2362.1*x3
模型二求解 建立GM(1.1)模型
dx(t)
ax(1)(t)udt
(1)
a和u可以通过如下最小二乘法拟合得到
aT1T(BB)BY u
式中,
Y为列向量Y[x(0)(2),x(0)(3),…,x(0)(7)]T; Y=[557,722,879,934,1364,1807]T B为构造数据矩阵:
1/2x(1)(1)x(1)(2)
1/2x(1)(2)x(1)(3)
(1)(1)
1/2x(M1)x(M)
1785.5........1425..........12025.5.......1B=
3132.........14281.........1
.5.......15816
111
aT1T
(BB)BY u
通过matlab计算得出
a=-0.2376 u=355.4599
得到预测式子
uu
ˆ(1)(k)(x(0)(1))ea(k1)……………………….1式 x
aa
ˆ(1)(k1)=2073e0.2376k-1496 x
在利用累减 x
,(0)
(k)=x(k)—x(k1)
,(1),(1)
通过计算得到以下数据
ˆ(1)(0)=577 x
ˆ(1)(1)=1132 由模型的得到的05年汽车销量为 xˆ(0)(1)=555 x
ˆ(1)(2)=1838 由模型的得到的06年汽车销量为 xˆ(0)(2)=706 x
ˆ(0)(3)=894 ˆ(1)(3)=2732 由模型的得到的07年汽车销量为 xx
ˆ(0)(4)=1132 ˆ(1)(4)=3866 由模型的得到的08年汽车销量为 xx
ˆ(0)(5)=1439 ˆ(1)(5)=5305 由模型的得到的09年汽车销量为 xx
ˆ(1)(6)=7128 由模型的得到的10年汽车销量为 xˆ(0)(6)=1823 x
ˆ(1)(7)=9441 由模型的预测的11年汽车销量为 xˆ(0)(7)=2313 x
由于没有找到11年全年的汽车销量所以11年的作为一个预测值
ˆ(0)(8)=2934 ˆ(1)(8)=12375 由模型的预测的12年汽车销量为 xx
ˆ(1)(9)=16095 由模型的得到的13年汽车销量为 xˆ(\0)(9)=3720 x
ˆ(0)(10)=4718 ˆ(1)(10)=20813 由模型的得到的14年汽车销量为 xx
ˆ(1)(11)=26796 由模型的得到的05年汽车销量为 xˆ(0)(11)=5983 x
七、模型检验
模型二的检验:
(1) 残差检验:计算相对残差
ˆ(0)(k)x(0)(k)x
(k),k0,1,2...6 (0)
x(k)
通过计算得:=[0, 0.038, 0.022, -0.017 , -0.212, -0.055, -0.009] 如果对所有的|(k)|0.1,则认为达到较高的要求;否则,若对所有的
|(k)|0.2,则认为达到一般要求。
可以看到除了08年的数据外其余的都还算理想,由于08年出现金融危机,对汽车的销售有一定的影响,所以出现了误差较大的情况
六、模型评价
通过对该模型的检验,该模型能基本描述汽车市场的销量。不过该模型并未考虑经济市场的因素,尤其是类似08年金融危机那样的因素,所以也只能作为一个理想的模型考虑。
还有汽车是属于使用时间比较长的商品,随着社会经济的不断发展,汽车的保有量会趋向与一个较为稳定的数值。类似于人口增长模型。汽车的年销售量也不可能无限之上升,所以该模型也只适用于短时间内的预测。
七、参考文献
高等出版社 数学模型(第三版) 姜启源 谢金星 叶俊 编
我国汽车销量主要影响因素的分析 危高潮 西安财经学院学报
中国统计年鉴2011 http://www.stats.gov.cn/tjsj/ndsj/2011/indexch.htm 灰色系统模型-清华大学讲义
基于灰色时间序列预测中国汽车销量 杨月英,马 萍 湖州职业技术学院学报
八、附录
矩阵计算程序
>> B=[-785.5 1;-1425 1;-2025.5 1;-3132 1;-4281 1;-5816.5 1]
B =
1.0e+003 *
-0.7855 0.0010
-1.4250 0.0010
-2.0255 0.0010
-3.1320 0.0010
-4.2810 0.0010
-5.8165 0.0010
>> C=inv(B'*B)
C =
0.0000 0.0002
0.0002 0.6406
>> Y=[577;722;879;934;1364;1807]
Y =
577
722
879
934
1364
1807
>> D=C*B'*Y
D =
-0.2376
355.4599
线性拟合程序
In[1]:=A={{Log[184.9374],Log[104.93],Log[334.52]},{Log[265.8103],Log[137.858],Log[358.37]},{Log[340.9028],Log[171.747],Log[386.08]}}
Out[1]:={{5.22002,4.65329,5.8127},{5.58278,4.92622,5.88157},{5.8316,5.14602,5.95604}}
In[2]:=b={576,879,1364}
Out[2]:={576,879,1364}
In[3]:=LinearSolve[A,b]
Out[3]:={-6598.29,10476.3,-2362.1}
汽车销量预测
摘要
汽车工业在我国已有50 多年的发展历史, 而汽车产业真正得到快速发展是从上世纪90 年代开始的。现在汽车工业在我国经济中已占有很重要的地位。预测汽车的销售量,无论是对于整体掌控汽车市场的发育与成长态势的政策制定者,还是对于研究市场行情以制定营销策略的汽车厂商而言,都具有极其重要的作用。我们通过网络搜索相关数据,然后运用线性回归及灰色预测对汽车销量进行数学建模分析预测,然后再对模型进行评估修改。
关键词:汽车销量 线性回归 灰色预测
一.问题重述
1.问题背景 近年来,随着国民经济和社会的进一步发展,汽车工业也逐步成为中国的支柱性产业之一,汽车市场表现出产销两旺的发展态势。而汽车市场是汽车工业的晴雨表,预测汽车的销售量,无论是对于整体掌控汽车市场的发育与成长态势的政策制定者而言,还是对于研究市场行情以制定营销策略的汽车厂商而言,都具有极其重要的作用。
2.需要解决的问题
问题一:影响汽车销量的因素有哪些?
问题二:通过数据建立数学模型并进行预测。 问题三:验证并修改数学模型。
二.问题分析
一.对问题一的分析
在这里我门选取了汽车产量、公路长度、城镇居民收入、GDP这样一些因素来考虑,当然影响汽车销售的因素远不止如此石油价格上涨,银行存款利率等都会对汽车销量有影响。并且这些因素也是相互影响的。这里为了简单考虑我们把每一个因素单独列出来,研究其余汽车销量的关系。我们通过互联网搜索获得以下数据:
二.对问题二的分析
对于问题二我们有两种思路,第一个是通过问题一得到的相关数据及结论运用线性回归的知识建立数学模型。但是通过线性回归得到的方程却还不够,因为线性方程故事汽车销量需要知道汽车产量、公路长度、GDP这样一些数据,但我们不知到以后的汽车产量、公路长度、GDP。这里吗有许多不确定因素所以我们采用灰色预测的方法来预测汽车销量。
三、模型假设与约定
国家经济处于一种正常平稳的发展趋势,不能有类似于08年的金融危机。
四、模型建立
模型一:各个因素对汽车销量的影响 年份 2004 2005 2006 汽车销
507 576 722
量
增长率 16% 14% 25%
2007 879 22%
2008 938 7%
2009 1364 46%
2010 1806 32.40%
年份
2003 2004 2005 2006 2007 2008 2009 2010
GDP(百亿) GDP增长率
135.82159.87184.93216.31265.81314.04340.90307.98
28 83 74 44 03 543 28 32 9.30% 9.40% 10.70% 12.00% 13.60%
9.10% 8.60%
年份 汽车增长率
GDP增长率
2004 16% 9.40%
2005 14% 10.70%
2006 25% 12.00%
2007 22% 13.60%
2008 7% 9.10%
2009 46% 8.60%
2008
2009
2010
年份 GDP(百亿) 公路里程 汽车销量
2005 2006 2007
159.8784 184.9374 216.3144 265.8103 314.0454 340.90281 334.52
576
345.7 722
358.37 879
373.02 938
386.08 1364
395 1806
由以上的图表可以看出,汽车的增长量和GDP增长成指数相关,和公路里程数指数性相切合,和人均支配资金数成指数关系,所以我们假设: 车辆销量为Y,GDP为x1,公路里程数为x2,人均支配金额为x3.存在Y=a+b*Inx1+c*Inx2+d*Inx3
模型二:灰色预测法预测汽车销量
1.选取的数据时从04年至10年的汽车销量,时间序列初始值为:
设原始数列为x(0)[x(0)(1),x(0)(2),,x(0)(7)]=[507,577,722,879,934,1364,1807] 2.生成累加序列
把数列各项(时刻)数据依次累加的过程称为累加生成过程。令
x(k)x(0)(i),k1,2,,n,
(1)
i1k
称所得到的新数列x(1)[x(1)(1),x(1)(2),,x(1)(n)]为数列x(0)的1次累加生成数列。有
x(1)=[507,1064,1786,2665,3599,4963,6670] 3.计算级比
x(1)(k1)
级比:(k)(1),k2,3,,n.
x(k)
(2)=0.477 (3)=0.596 (4)=0.670 (5)=0.740 (6)=0.725 (7)=0.744
如果所有的级比都落在可容覆盖区间
X(e
2n1
,e
2n1
)内,则数据列x(0)可
以建立GM(1,1)模型且可以进行灰色预测。
4.建立GM(1.1)模型
dx(t)
ax(1)(t)u
dt
(1)
解为
ua(t1)u
x(t)(x(1))e.
aa
(1)
(0)
五、模型求解
模型一的求解:
由mathmatic软件运行可知:
In[1]:=A={{Log[184.9374],Log[104.93],Log[334.52]},{Log[265.8103],Log[137.858],Log[358.37]},{Log[340.9028],Log[171.747],Log[386.08]}}
Out[1]:={{5.22002,4.65329,5.8127},{5.58278,4.92622,5.88157},{5.8316,5.14602,5.95604}}
In[2]:=b={576,879,1364} Out[2]:={576,879,1364} In[3]:=LinearSolve[A,b]
Out[3]:={-6598.29,10476.3,-2362.1} 及得到公式
Y=10476.3*Inx2-6598.29*x1-2362.1*x3
模型二求解 建立GM(1.1)模型
dx(t)
ax(1)(t)udt
(1)
a和u可以通过如下最小二乘法拟合得到
aT1T(BB)BY u
式中,
Y为列向量Y[x(0)(2),x(0)(3),…,x(0)(7)]T; Y=[557,722,879,934,1364,1807]T B为构造数据矩阵:
1/2x(1)(1)x(1)(2)
1/2x(1)(2)x(1)(3)
(1)(1)
1/2x(M1)x(M)
1785.5........1425..........12025.5.......1B=
3132.........14281.........1
.5.......15816
111
aT1T
(BB)BY u
通过matlab计算得出
a=-0.2376 u=355.4599
得到预测式子
uu
ˆ(1)(k)(x(0)(1))ea(k1)……………………….1式 x
aa
ˆ(1)(k1)=2073e0.2376k-1496 x
在利用累减 x
,(0)
(k)=x(k)—x(k1)
,(1),(1)
通过计算得到以下数据
ˆ(1)(0)=577 x
ˆ(1)(1)=1132 由模型的得到的05年汽车销量为 xˆ(0)(1)=555 x
ˆ(1)(2)=1838 由模型的得到的06年汽车销量为 xˆ(0)(2)=706 x
ˆ(0)(3)=894 ˆ(1)(3)=2732 由模型的得到的07年汽车销量为 xx
ˆ(0)(4)=1132 ˆ(1)(4)=3866 由模型的得到的08年汽车销量为 xx
ˆ(0)(5)=1439 ˆ(1)(5)=5305 由模型的得到的09年汽车销量为 xx
ˆ(1)(6)=7128 由模型的得到的10年汽车销量为 xˆ(0)(6)=1823 x
ˆ(1)(7)=9441 由模型的预测的11年汽车销量为 xˆ(0)(7)=2313 x
由于没有找到11年全年的汽车销量所以11年的作为一个预测值
ˆ(0)(8)=2934 ˆ(1)(8)=12375 由模型的预测的12年汽车销量为 xx
ˆ(1)(9)=16095 由模型的得到的13年汽车销量为 xˆ(\0)(9)=3720 x
ˆ(0)(10)=4718 ˆ(1)(10)=20813 由模型的得到的14年汽车销量为 xx
ˆ(1)(11)=26796 由模型的得到的05年汽车销量为 xˆ(0)(11)=5983 x
七、模型检验
模型二的检验:
(1) 残差检验:计算相对残差
ˆ(0)(k)x(0)(k)x
(k),k0,1,2...6 (0)
x(k)
通过计算得:=[0, 0.038, 0.022, -0.017 , -0.212, -0.055, -0.009] 如果对所有的|(k)|0.1,则认为达到较高的要求;否则,若对所有的
|(k)|0.2,则认为达到一般要求。
可以看到除了08年的数据外其余的都还算理想,由于08年出现金融危机,对汽车的销售有一定的影响,所以出现了误差较大的情况
六、模型评价
通过对该模型的检验,该模型能基本描述汽车市场的销量。不过该模型并未考虑经济市场的因素,尤其是类似08年金融危机那样的因素,所以也只能作为一个理想的模型考虑。
还有汽车是属于使用时间比较长的商品,随着社会经济的不断发展,汽车的保有量会趋向与一个较为稳定的数值。类似于人口增长模型。汽车的年销售量也不可能无限之上升,所以该模型也只适用于短时间内的预测。
七、参考文献
高等出版社 数学模型(第三版) 姜启源 谢金星 叶俊 编
我国汽车销量主要影响因素的分析 危高潮 西安财经学院学报
中国统计年鉴2011 http://www.stats.gov.cn/tjsj/ndsj/2011/indexch.htm 灰色系统模型-清华大学讲义
基于灰色时间序列预测中国汽车销量 杨月英,马 萍 湖州职业技术学院学报
八、附录
矩阵计算程序
>> B=[-785.5 1;-1425 1;-2025.5 1;-3132 1;-4281 1;-5816.5 1]
B =
1.0e+003 *
-0.7855 0.0010
-1.4250 0.0010
-2.0255 0.0010
-3.1320 0.0010
-4.2810 0.0010
-5.8165 0.0010
>> C=inv(B'*B)
C =
0.0000 0.0002
0.0002 0.6406
>> Y=[577;722;879;934;1364;1807]
Y =
577
722
879
934
1364
1807
>> D=C*B'*Y
D =
-0.2376
355.4599
线性拟合程序
In[1]:=A={{Log[184.9374],Log[104.93],Log[334.52]},{Log[265.8103],Log[137.858],Log[358.37]},{Log[340.9028],Log[171.747],Log[386.08]}}
Out[1]:={{5.22002,4.65329,5.8127},{5.58278,4.92622,5.88157},{5.8316,5.14602,5.95604}}
In[2]:=b={576,879,1364}
Out[2]:={576,879,1364}
In[3]:=LinearSolve[A,b]
Out[3]:={-6598.29,10476.3,-2362.1}