1.回归模型 (含剔除)
5.2模型一的建立(含交叉项的多项式回归模型)
由以上分析可知,如果交易费用率y 与影响其变动的主要影响因素:x 1, , x 6
之间有很密切的关系,则应该有:
y =f (x 1, x 2, , x 6)+ε (5-1)
其中,y 和x 1,x 2, , x 6分别代表交易费用和影响其变动的主要因素。 经初步判断,y =f (x 1, x 2, , x 6)是多项式函数,其表达式为:
y =β0+β1x 1+ +β6x 6+β7x 12+ +β12x 62
+β13x 1x 2+β14x 1x 3+ +β27x 5x 6
+β28x 1x 2x 3+β29x 1x 2x 4+ +β47x 4x 5x 6+ε
(5-2)
其中,β0, β1, , β6分别为对应二级指标x 1,x 2, , x 6的系数;β7, , β12分别为对应x 12, , x 62的系数;β13, β14, , β27分别为对应6种二级指标x 1,x 2, , x 6两两组
2
合而成的C 6=15项交叉项的系数;β28, β29, , β47分别为对应6种二级指标3
(最多有三个之间的互相影x 1,x 2, , x 6三三组合而成的C 6=20项交叉项的系数。
响)因素不能超过8个
式(5-2)对应的数据矩阵X 和向量Y 分别为:
22
X =⎡P A F A F AB EF ABC DEF ⎤⎣⎦
⎛0.4860.1150.4860.4730.5130.421⎫ ⎪Y = ⎪
0.1030.2850.1190.1510.2270.121⎪⎝⎭6⨯47
其中,P 为一个30行1列的单位矩阵;X 为一个30行1列的矩阵,其A -F 列数据分别对应表3中第A -F 列中的数据;A 2-F 2列数据分别对应表3中第
A -F 列中的数据的平方;AB EF 列数据分别对应表3中第A -F 列中的数
2
据两两组合而成的C 6=15项交叉项的乘积;ABC DEF 列数据分别对应表33中第A -F 列中的数据三三组合而成的C 6=20项交叉项的乘积;Y 为一个6行
47列的矩阵,各行数据分别对应附录一中各国每年交易费用率的数据。
5.3模型一的求解
经MATLAB 编程计算得:
ττ-1ˆβ=(XX )XY =(467329.453293399, -146372.718111389, , 176911.874680070)
故得回归方程:
ˆ=467329.453293399+(-146372.718111389)x 1+ + (-21289.1321242021)x 6y
+343405.998478539x 12+ +153.[1**********]4x 62
+(-4867.[1**********])x 1x 2+ +(-350888.06218273)x 5x 6+826.[1**********]6x 1x 2x 3+ +176911.874680070x 4x 5x 6
(5-3)
5.4模型一的检验
5.4.1回归方程(5-3)的显著性检验(F 检验)
(1)提出假设:
H 0:β1=β2= =βp =0,线性关系不显著; H 0:β1, β2, , βp 至少有一个不等于0。 (2)计算检验统计量F :
SSR p
F ==
SSE n -p -1
ˆi -)∑(y
i =1i n
2
p
ˆ)∑(y -y
i
i =1
n
2
n -p -1
(3)确定显著性水平α和分子自由度p 、分母自由度n -p -1,找出临界值F α:
α=0.01, p =6, n =47,F α=1.40
(4)作出决策:
由查表可知,F ≥F α,拒绝H 0。
5.4.2回归方程(5-3)的复相关系数
对样本进行分析计算可得:
S T =∑(y i -)
i =1250
2
偏差平方和:
2
回归平方和:
ˆi -)S R =∑(y
i =1250i =1
250
2
残差平方和:
ˆi )S E =∑(y i -y
由此求得模型一中多项式回归方程(5-3)的复相关系数R 为:
R =
S R
S T
由计算结果可知,模型一的复相关系数较高,所给数据的拟合性较好,符合要求。所以用含交叉项的多项式回归模型去拟合所给的数据是合适的,所以我们接受交易费用率与二级指标数据的关系之间满足线性相关关系这一假设。 5.5模型一的评价与结论
我们对所选指标进行逐步回归分析,确定其是否为影响交易费用率的主要因素,下表(表8)为当分别剔除各一级指标时模型一中多项式回归方程(5-3)的复相关系数R 值的变化情况。
表8 当剔除各一级指标时模型一R 值的变化情况
据的拟合性有较大幅度下降,线性关系较原来差,所以各评价指标均不能剔除。
2. 模型检验
S
这S 个模型都通过统计检验,具有合理性,可靠性,则用线性回归组合预测模型
ˆt +1=b 0+∑b i y it +1 y
i =1
b i (i =0, 1, 2, , S )
B =x Tx
其中:
()
-1
x Ty
TT
B =(b 0, b 1, , b S ) Y =(y 1, y 2, , y t )
X =(y ij )S (i +1), y j 0=1 i =1, 2, , S ; j =0, 1, , t
若:
t -S -1
>F 2(t -S -1, S ) TTT
Y Y -B X Y
则检验通过说明不同模型得到的预测值整体与实际值线性关系显著
所谓多重线性组合预测是利用不同模型组得到的组合值,再进行组合预测,从而提高了预测精度。
F =B TX TY /S
()
根据上述方法的简述,我们建立最后将所得的模型进行了相应的改进,表达形式如下:
ˆ=136S i D l G m R n +3317y . 5P i D l G m R n
在此模型中,我们的S =1 商差平方和:
2
L =∑(y i -)
残差平方和:
ˆi )2 Q =∑(y i -y
回归标准差:
ˆi -)2 U =∑(y
R 为相关系数:(拟合优度)
R =
回归标准差:
L U
S =/n -2
另外,为了便于分析,我们引入下标符号
ˆ(i )-y i 预测误差e 1=y
预测相对误差:ee i =e 1/y (i ) (0≤ee i ≤1) 预测精度:A i =1-ee i
∑1-
综上所述:预测平均精度:1=
i =1
n
ˆ(i ) -y i y y i n
或者用:
运用相关系数衡量变量之间相关程度
r xy =
∑(x
i =1
n
i
-)(y i -)
n
∑(x
i =1
n
i
-) 2∑(y i -) 2
i =1
3 模糊聚类和综合评判(确定等级模型)
首先,列举出有可能影响各种指标的评价因素,具体如上表所示。之后,我
模糊权重值:U k =U k 1+U k 2+U k 3+ +U k t
()
A j 表示第j 项指标的信息 (j =1, 2, , 5) 我们利用模糊数学建立隶属函数即归一法则:
u A j (x )=e
n
⎛x -a j - b j ⎝⎫⎪⎪⎭
2
a j =
∑a
i =1
ij
n
1n
(a ij -a j )2 b j =∑n -1i =1
利用格贴近度来建立模糊相似矩阵:
2
r ij =e
⎛a j -a i
-
b i +b j ⎝⎫⎪⎪⎭
i , j 均为1, 2, , 5
即有模糊相似模型矩阵为:R =r ij 取λ=σ进行聚类:
()
5⨯5
得到R λ矩阵 既有分类为:{x 1, x 2} … {x 3, x 5}… 对同一类的数据进行删除,即留下剩余的影响指标为:
u 1, u 2, u 3, , u t
四个顶级经营:A 1, A 2, A 3, A 4,分别表示好,较好,一般,差
A 1=(A 11, A 12, A 13, , A 1t )
A 1t =
即得到多因素评判矩阵:
⎛A 11 A 21R =
A 31 A ⎝41
∑u (x )
Aj
1i
i =1
n 1
n 1
A 12A 22A 32A 42
A 1t ⎫
⎪
A 2t ⎪
A 3t ⎪
⎪
A 4t ⎪⎭
权的分配:
u 1=(u 11, u 12, , u 14)
欧几里得贴近度:
1
2
N (B , A )=1-
由贴近公式得到:
1⎡2⎤
(()())B u -A u i i ⎢∑⎥ n ⎣i =1⎦
t
N (B , A 1) N (B , A 2) N (B , A 3) N (B , A 4)
综上所述: B的贴近度
max {N (B , A 1), (B , A 2), N (B , A 3), N (B , A 4)}
程序
a=[276.2 324.5 158.6 412.5 292.8 258.4 334.1 303.2 292.9 243.2 159.7 331.2 251.5 287.3 349.5 297.4 227.8 453.6 321.5 451.0 466.2 307.5 421.1 455.1 192.7 433.2 289.9 366.3 466.2 239.1 357.4 219.7 245.7 411.1 357.0 353.2 246.2 232.4 243.7 372.5 460.4 158.9 298.7 314.5 256.6 327.0 296.5 423.0 291.7 311.0 502.4 254.0 245.6 324.8 401.0 266.5 251.3 289.9 255.4 362.1 466.5 158.9 223.5 425.1 251.4 321.0 315.4 317.4 246.2 277.5 304.2 410.7 258.6 327.4 432.1 403.9 256.6 282.9 389.7 413.2 466.5 199.3 282.1 387.6 453.4 365.5 357.6 258.1 278.8 467.2 355.2 228.5 453.6 315.6 456.3 407.2 158.2 271.0 410.2 344.2 250.0 360.7 376.4 179.4 159.2 342.4 331.2 377.7 324.8 406.5 235.7 288.8 192.6 284.9 290.5 343.7 283.4 281.2 243.7 411.1]; mu=mean(a),sigma=std(a) for i=1:12 for j=1:12
r(i,j)=exp(-(mu(j)-mu(i))^2/(sigma(i)+sigma(j))^2);
end end r
save data1 r a
%ii)矩阵合成的MATLAB 函数
function rhat=hecheng(r); n=length(r); for i=1:n for j=1:n
rhat(i,j)=max(min([r(i,:);r(:,j)'])); end end
%iii)求模糊等价矩阵和聚类的程序
load data1 r1=hecheng(r) r2=hecheng(r1) r3=hecheng(r2) bh=zeros(12); bh(find(r2>=0.998))=1
确定等级
例 12 现有五个等级的茶叶样品1 2 3 4 5 A , A , A , A , A ,待识别茶叶B 。反映茶叶质
量的因素有六项指标,构成论域U ,其中 U ={ x1, x2, x3, x4, x5, x6} ;p
x 1 条索x 2 色泽x 3 净度x 4 汤色x 5 香气x 6 滋味 设五个等级的样品对 6 项指标的数值为: A1=(0.5,0.4,0.3,0.6,0.5,0.4) A2=(0.3,0.2,0.2,0.1,0.2,0.2) A3=(0.2,0.2,0.2,0.1,0.1,0.2) A4=(0,0.1,0.2,0.1,0.1,0.1) A5=(0,0.1,0.1,0.1,0.1,0.1) 待识别茶叶的各项指标值为 B = (0.4,0.2,0.1,0.4,0.5,0.6) 确定 B 的属类。
解 利用格贴近度公式计算可得
N (B , I ) = 0.5,N (B , II ) = 0.3,N (B , III ) = 0.2, N (B , IV) = 0.2,N (B , V) = 0.1
按择近原则,可以将 B 定为一级茶叶(与1 A 同属一类)。 计算的 MATLAB 程序如下:
a=[0.5 0.4 0.3 0.6 0.5 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.2 0.2 0.2 0.1 0.1 0.2 0 0.1 0.2 0.1 0.1 0.1 0 0.1 0.1 0.1 0.1 0.1];
b=[0.4 0.2 0.1 0.4 0.5 0.6]; for i=1:5
x=[a(i,:);b];
t(i)=min([max(min(x)) 1-min(max(x))]); end t
*4.确定权重模型
一.方法一
运用方差除以平均值:
综上所述,得到问题三的单目标优化模型
∑(T
Q i =D i E i =
j =1
30
j
-E i )
j
2
∑T
j =1
30
30
⎧
⎪E i =∑T j
j =1⎪
⎨230
⎪D =
(T j -E i )⎪i ∑j =1⎩
⎧0≤T j
二.方法二
它们每个数都有一些相同数,表示为:k1,k2,k3…….kn; 加权平均的公式是
(k1p1+k2p2+k3p3+……knpn )/n
加权求和评分法选址实施步骤:
1、找到设施选择的各种影响因素:把有关的影响因素列成一个清单——只需要列出主要的、各店址方案有明显差异的影响因素
2、根据各因素的重要程度确定相应的权,确定每个影响因素的权重 3、对各因素由优到劣分成等级,并相应规定各等级的分数。
4、将每个因素中各方案的排队等级分数乘以该因素的相应权数,得到各候选方案的总得分
5、汇总各方案总分,并根据得分高低,评判方案的优劣,方便取舍。
三.方法三
熵权法
(具体见PPT )
四.方法四
模糊聚类和灰色关联度可以联合用 先聚类
(二) 运用模糊数学聚类分析剔除同类因素
1、我们利用模糊数学隶属函数来对上表数据进行归一:
⎛x -a 1⎫⎧⎪- ⎪⎝b 1⎭⎪u (x )=e
⎪A 1n ⎪a ij ∑⎪⎪i =1
⎨a j =
n ⎪
1n ⎪2
()b =a -a ∑ij j ⎪j
n -1i -1
⎪⎪⎩
2
2、利用格贴近度来建立模糊相似矩阵:
r ij =e
⎛a j -a i -
b i +b j ⎝⎫⎪⎪⎭
2
i , j 均为1, 2, , 12
即有模糊相似模型矩阵为:R =r ij 3、取λ=σ进行聚类:
()
12⨯12
A j 表示第j 项指标的信息 (j =1, 2, , 12)得到R λ矩阵 综上所诉:(目标函数)对R λ矩阵运用0-1判别:
r i =1⎧r 属于同一类;
J =⎨i
r =0⎩r i 不属于同一类;
既有分类为:
程度、管道、公路、铁路、民航);⎧(市场化水平、对外开放⎫
⎪⎪
国消费市场数);⎪(全国消费成品交额、全⎪
⎨⎬
度);⎪(非国有化程度、货币程⎪
⎪(教育毛收入、在校生/人口总数)⎪⎩⎭
4、用matlab 软件编程,对同一类的数据进行删除,即最终确定的主要因素为:
{市场化水平,全国消费} 成品交额,非国有化程度,教育毛收入
再进行灰色关联度分析;
7.2.1灰色系统理论关联分析:
①选取参数列;
x 0={x 0(k )|k =1, 2, , n }=(x 0(1), x 0(2), , x 0(n ))
(k =11表示年数、m =4表示影响因素个数)
假设有m 个比较数列
y i ={x i (k )|k =1, 2, , n }=(x i (1), x i (2), x i (n )), i =1, 2, , m
2规范数列x i =(x i (1), x i (2), , x i (n )),称 ○
⎛x i (2)x i (n )⎫
⎪x i = 1, , , x 1⎪ x 1i ⎝i ⎭
为原始数列x 的初始化数列。
3则有比较数列x i 对参考数列x 0在k 时刻的关联系数: ○
min min x (t )-x (t )+ρmax max x (t )-x (t )
ξ(k )=
x k -x k +ρx t -x t 0
s
s
s
t
s
t
i
i
s
s
t
(称上面式子中min
s
min x (t )-x (t )、m ax m ax x (t )-x (t )分别为两级最
s
0s
t s t
小差及两级最大差, 其中ρ∈[0, 1]为分辨系数)
综上所诉:(目标函数)数列x i 对参考数列x 0的关联度为
1n
r i =∑ξi (k )
n k =1
由上式易看出,关联度是各个时刻的关联系数集中为一个平均值,亦即把过于分散的信息集中处理,利用关联度这个概念,我们可以对各种问题进行因素分析。考虑下面的问题。
综上,最终建立模型为:
7.3模型的求解
这样,我们对收集数据进行处理。又利用了matlab 软件进行了相关的编程,最后计算的结果如下:
表6:r 数值的具体求解
(灰色关联度程序)
clc,clear
load x.txt %把原始数据存放在纯文本文件x.txt 中,其中把数据的" 替换替换成. for i=1:15
x(i,:)=x(i,:)/x(i,1); %标准化数据 end
for i=16:17
x(i,:)=x(i,1)./x(i,:); %标准化数据 end
data=x;
n=size(data,2); %求矩阵的列数,即观测时刻的个数 ck=data(1,:); %提出参考数列 bj=data(2:end,:); %提出比较数列 m2=size(bj,1); %求比较数列的个数 for j=1:m2 t(j,:)=bj(j,:)-ck; end
mn=min(min(abs(t'))); %求最小差 mx=max(max(abs(t'))); %求最大差 rho=0.5; %分辨系数设置
ksi=(mn+rho*mx)./(abs(t)+rho*mx); %求关联系数 r=sum(ksi')/n %求关联度
[rs,rind]=sort(r,'descend') %对关联度进行排序
五.
1、分层分析法示意图
A ;交易费用
B1
图1:分层分析法示意图
2、构造判断矩阵
设现在要比较N 个因子X ={x 1, x 2, x n }对某种因素Z 的影响大小,采取对
因子进行两两比较建立成对比较矩阵的办法。即每次取两个因子x i 和x j ,以a ij 表示x i 和x j 对Z 的影响大小之比,全部比较结果用矩阵D =a ij
()
n ⨯n
表示,称D 为
Z -X 之间的成对比较判断矩阵。容易看出,若x i 和x j 对Z 的影响之比为a ij ,
则有 a ij =
定义 若矩阵D =a ij
1
。 a
()
n ⨯n
满足
a ij >0;a ji =
1
(i , j =1, 2 n ) a ij
则称之为正互反矩阵(易见a ii =1, i =1, , n ) 3、层次排序及一致性检验
判断矩阵D 对应最大特征值λmax 的特征向量W ,经过化一后即为同一层次相应因素对于上一层次某种因素相对重要性的排序权值。其中矩阵D 还应满足:
a ij a jk =a ik , ∀i , j , k =1, 2, , n
矩阵满足以上条件,我们要对其进行一致性检验: (i )计算一致性指标CI
CI =
λmax -n
n -1
(ii )查找相应的平均随机一致性指标RI 。对n =1, , 9,Saaty 给出了RI 的值,如表一所示:
RI =
λ' max -n
n -1
m
(iii )计算一致性比例CR
∑CI (j )a
CR =
j =1m
j
j
∑RI (j )a
j =1
(当CR
当将层次总排序合成时,具体表格如下:
综上所诉:(目标函数)各因素的权重为
b =∑b ij a j , i =1, 2, , n
j =1
m
约束条件为
λmax -n ⎧
CI =⎪n -1⎪'
⎪RI =λmax -n ⎪n -1⎪⎪
m s . t ⎨ CI (j )a j ⎪∑⎪CR =j =1
≤0. 10m ⎪
RI (j )a j ⎪∑j =1⎪
⎪⎩
(层次分析程序)
clc,clear
fid=fopen('txt3.txt','r'); n1=6;n2=3; a=[];
for i=1:n1
tmp=str2num(fgetl(fid));
a=[a;tmp]; %读准则层判断矩阵 end
for i=1:n1
str1=char(['b',int2str(i),'=[];']);
str2=char(['b',int2str(i),'=[b',int2str(i),';tmp];']); eval(str1); for j=1:n2
tmp=str2num(fgetl(fid)); eval(str2); %读方案层的判断矩阵 end
-173-
end
ri=[0,0,0.58,0.90,1.12,1.24,1.32,1.41,1.45]; %一致性指标 [x,y]=eig(a);
lamda=max(diag(y));
num=find(diag(y)==lamda); w0=x(:,num)/sum(x(:,num)); cr0=(lamda-n1)/(n1-1)/ri(n1) for i=1:n1
[x,y]=eig(eval(char(['b',int2str(i)]))); lamda=max(diag(y));
num=find(diag(y)==lamda);
w1(:,i)=x(:,num)/sum(x(:,num)); cr1(i)=(lamda-n2)/(n2-1)/ri(n2); end
cr1, ts=w1*w0, cr=cr1*w0
纯文本文件txt3.txt 中的数据格式如下:
1 1 1 4 1 1/2 1 1 2 4 1 1/2 1 1/2 1 5 3 1/2 1/4 1/4 1/5 1 1/3 1/3 1 1 1/3 3 1 1 2 2 2 3 3 1 1 1/4 1/2 4 1 3 2 1/3 1 1 1/4 1/5 4 1 1/2 5 2 1 1 3 1/3 1/3 1 1/7 3 7 1 1 1/3 5 3 1 7
1/5 1/7 1 1 1 7 1 1 7 1/7 1/7 1 1 7 9 1/7 1 1
6. 3模型的求解
我们通过matlab 软件进行相关的编程,利用程序最后计算出的结果如下:
六.预测模型
方法一:时间预测
7.2.1.2模型一的建立 把初始数据定义为:x i (0)(j ) 第一次平移数据数列:
x i (1)(j )=
第二次平移数据数列:
∑x ()(j )
0i j
j +4
N
x i (2)(j )=
∑x ()(j )
1i j
j +4
N
综上所诉:(目标函数)建立预测线性模型:
Y i (j +τ)=a +b τ
(τ表示预测超前周期数)
约束条件:
⎧a =2x i (1) (j ) -x i (2) (j ) ⎪2⎪s . t ⎨b =(x i (1) (j ) -x i (2) (j ))
N -1⎪
N =5⎪⎩
方法二:灰色预测
7.2.2.1灰色预测模型的相关知识
GM (1, 1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模型,其离散时间响应函数近似呈指数规律。根据数据分析我们可以得出题目中给定的数据大体上符合该规律。 7.2.2.2模型的建立 原始非负时间序列:
(0)(0)(01)(1986), x 1(0)(1987), , x 2(1986), x 2(1987), , x 8(0)(1986), x 80(1987) x i (0)(t )=x 1
{}
x i (1)(t )为累加生成序列,即:
) x i (t )=∑x i 0(t )(t =1, 2, 3, . 2005
(1)
t =1
t
邻接方程:
Z i (t )=-
1(1)
x i (t -1)+x i (1)(t )(t =1, 2, 3, , 2005) 2
()
GM (1, 1)模型的白化微分方程:
dx i (1)(t )
+ax i (1)(t )=u dt
解决此微分方程得灰色预测的离散时间响应函数:
u ⎫u ⎛
x i 1(t +1)= x i 0(1)-⎪e -at +
a ⎭a ⎝
⎛a ⎫
ˆ= 设:a 为待定参数,u 为待辨识内生变量,则有待辨识向量:a u ⎪⎪按照最小二⎝⎭
ˆ=B TB 乘法得出:a
()
-1
B Ty ,其中:
Z i (2)Z (3)B =i
Z i (n )1x i 0(2)1x i 0(3) Y = 1x i 0(n )
综上所诉:(目标函数)灰色预测的响应函数为
u ⎫u ⎛
x i 1(t +1)= x i 0(1)-⎪e -at +
a ⎭a ⎝
ˆi -y i ) min S =∑(y
i =1
n
2
七:最小二乘法
8.2模型四的建立(最小二乘法)
(1)设定拟合曲线f (x )
寻找函数(曲线)y= f (x ), 使f (x )在某种准则下与所有数据点最接近,即曲线拟合的最好,其表达式为:
f (x )=a 1r 1(x )+a 2r 2(x )+ +a m r m (x )
其中,r k (x )为各相关国家历年人类发展指数,f (x )为各相关国家历年交易费用率,a k 是待定系数k =1,2, , m ; m
拟合准则是使y i (i =1,2, n )与f (x i )的距离δi 的平方和最小,称为最小二乘原则。
(2)确定系数a k 记
J (a 1, , a m )=∑δi 2=∑(f (x i )-y i )
i =1
i =1
n n
2
为求a 1, , a m 使J 达到最小,只需利用极值的必要条件到关于a 1, , a m 的线性方程组
∂J
(j =1, , m ),得∂a j
⎡m ⎤r x a r x -y ∑j (i )⎢∑k k (i )i ⎥=0, j =1, , m i =1⎣k =1⎦
n
当{r 1(x ), , r m (x )}线性无关时,上述方程有唯一解。 (3)选取函数r k (x )
综上所述:(目标函数)根据拟合图6,我们选取如下多项式函数(曲线)去拟合
f (x )=a 1x m +a 2x m -1+ +a m x +a m +1
约束条件
n
⎧2
min (f (x ) -y ) ∑i i ⎪⎪i =1
s . t ⎨n (i =1, 2 , n , j =1, 2, , m ) m
⎪∑r j (x i )[∑a k r k (x i ) -y i ]=0⎪k =1⎩i =1
将几个因素综合起来
可以把它们分别赋一个权,然后定义一个影响度的概念把他们写成一个模型,(模型一定要有最终的目标,可以是算法中自带的,没有的话一定要自己根据题目中的要求自定义一个,这样评卷老师一看就清晰明了)
像世博的影响力的那题:把影响力这样一个抽象的概念定义为:
总影响力的定义:各指标影响力与其权重乘积的和
八. 主层次分析法(聚类和层次分析) 通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n 个地理样本,每个样本共有p 个变量描述,这样就构成了一个n×p阶的地理数据矩阵:
如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为x 1,x 2,…,zm (m≤p)。则
系数l ij 由下列原则来决定:
(1)z i 与z j (i≠j;i ,j=1,2,…,m) 相互无关;
(2)z 1是x 1,x 2,…,x p 的一切线性组合中方差最大者;z 2是与z 1不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者;……;z m 是与z 1,z 2,……zm-1都不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者。
这样决定的新变量指标z 1,z 2,…,zm 分别称为原变量指标x ,x 2,…,x p
的第一,第二,…,第m 主成分。其中,z 1在总方差中占的比例最大,z 2,z 3,…,z m 的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
1
从以上分析可以看出,找主成分就是确定原来变量x j (j=1,2,…,p) 在诸主成分z i (i=1,2,…,m) 上的载荷l ij (i=1,2,…,m ;j=1,2,…,p) ,从数学上容易知道,它们分别是x 1,x 2,…,x p 的相关矩阵的m 个较大的特征值所对应的特征向量。
(1) 计算相关系数矩阵
在公式(3) 中,r ij (i ,j=1,2,…,p) 为原来变量x i 与x j 的相关系数,其计算公式为
因为R 是实对称矩阵(即r ij =rji ) ,所以只需计算其上三角元素或下三角元素即可。
(2) 计算特征值与特征向量
首先解特征方程|λI-R |=0求出特征值λ(i=1,2,…,p) ,并使其按大小顺序排列,即λ1≥λ2≥…,≥λp ≥0;然后分别求出对应于特征值λi 的特征向量e i (i=1,2,…,p) 。
i
(3) 计算主成分贡献率及累计贡献率
一般取累计贡献率达85-95%的特征值λ,λ2,…,λm 所对应的第一,第二,……,第m (m ≤p) 个主成分。
1
(4) 计算主成分载荷
由此可以进一步计算主成分得分:
九.0-1模型
一.指派问题
设变量为x ij , 当第i 个人作第j 项工作时,x ij =1 ,否则. x ij =0相应的线性规划问题为:
n
n
min ∑∑c ij x ij
i =1j =1 约束条件:
⎧n
⎪∑x ij =1, (i =1, 2 , n ) ⎪j =1 s . t
⎪
n ⎨∑x ij , (j =1, 2, , n ) ⎪i =1
⎪x ij ∈{1,0}(, i , j =1, 2, , n )⎪⎩
程序: model: sets:
people/1..6/; work/1..6/;
link(people,work):c,x; endsets data:
c= 20 15 16 5 4 7 17 15 33 12 8 6 9 12 18 16 30 13 12 8 11 27 19 14 -99 7 10 21 10 32 -99 -99 -99 6 11 13; enddata
max=@sum(link:c*x);
。因此,
@for(people(i):@sum(link(i,j):x(i,j))=1); @for(work(i):@sum(link(i,j):x(j,i))=1); End
二,背包问题
给定n 种物品和一背包。物品i 的重量是wi ,其价值为vi ,背包的容量为C 。问:应如何选择装入背包的物品,使得装入背包中物品的总价值最大?
max ∑v i x i
i =1n
n
⎧w i x i ≤C ⎪
s . t ⎨∑i =1
⎪⎩x i ∈{0, 1},1≤i ≤n
十 , 图论
[网络(赋权图)]
有向图 G=(V, A) 中,给每条边 a = 赋予一个实数权 w (vi , vj ) ,得到一个有向网络。通常情况下 w (vi , vj ) ≥ 0。(为简化问题的讨论,无特别声明情况下,我们都假定 w (vi , vj ) > 0。)
[距离矩阵] 对上述网络,定义其距离矩阵 D=(dij ) n ⨯n ,n =|V|
d i j =
{∞
w (v i , v j ) 当∈A
其它
带权路径长度]
设路径 v 1, v 2 , … ,vk 为上述网络的路径,其带权路径长度定义为
π(v 1, v k ) =∑w (v i , v i +1)
i =1
k -1
对上述网络,若路径 v 1, v 2 , … ,vk -1 , vk 是一条 v 1 到 vk 的最短路,则路径 v 1, v 2 , … ,vk -1 是 一 条 v 1 到 vk -1 的最短路。
[Dijkstra 算法] 求有向网络 G=(V, A) 中结点 u 到其它结点的最短距
离。
输入:有向网络 G=(V, A) 的距离矩阵 D。
思想:维护一个顶点集合S ,对任何 z ∈S ,d (u, z) 已获得确认为u 到 z 最短距离。目标是扩充 S,直到 S 包含了G 的所有顶点。为此对每个 z ∉S ,需要维持对 d (u,z ) 的一个试探值 t(z ) ,即当前找到的(局部)最小的 π(u,z ) 。
初始化:设 S={u },t (u )=0;对 z ≠u ,设 t (z ) = w (u,z ) 。
目标函数迭代:取 v ∉S 使得
\ t (v )=min {t (z )|z ∉S};S=S⋃{v }; 对 z ∉S 且∈A ,令
t (z )= min {t (z ), t (v )+w (v , z )}。
结束:S=V 或 对所有 z ∉S ,t (z )=∞。
此时对所有 v ∈V ,d (u, v)=t (v )
[Warshall 算法] (flody算法) 有向网络G=(V, A) 中任两点间最
短距离。
设 D 为 G 的距离矩阵,n =|V|。
1. 输入 D 矩阵 2. i ← 1 3. j ← 1
4. djk ← min {djk , dik + dkj },k =1 ... n
5. j ← j+1,若 j ≤n ,转 4 6. i ← i +1 ,若 i≤n ,转 3
7. Stop
目标:djk min{djk , dji + dik },k =1 ... n
1.回归模型 (含剔除)
5.2模型一的建立(含交叉项的多项式回归模型)
由以上分析可知,如果交易费用率y 与影响其变动的主要影响因素:x 1, , x 6
之间有很密切的关系,则应该有:
y =f (x 1, x 2, , x 6)+ε (5-1)
其中,y 和x 1,x 2, , x 6分别代表交易费用和影响其变动的主要因素。 经初步判断,y =f (x 1, x 2, , x 6)是多项式函数,其表达式为:
y =β0+β1x 1+ +β6x 6+β7x 12+ +β12x 62
+β13x 1x 2+β14x 1x 3+ +β27x 5x 6
+β28x 1x 2x 3+β29x 1x 2x 4+ +β47x 4x 5x 6+ε
(5-2)
其中,β0, β1, , β6分别为对应二级指标x 1,x 2, , x 6的系数;β7, , β12分别为对应x 12, , x 62的系数;β13, β14, , β27分别为对应6种二级指标x 1,x 2, , x 6两两组
2
合而成的C 6=15项交叉项的系数;β28, β29, , β47分别为对应6种二级指标3
(最多有三个之间的互相影x 1,x 2, , x 6三三组合而成的C 6=20项交叉项的系数。
响)因素不能超过8个
式(5-2)对应的数据矩阵X 和向量Y 分别为:
22
X =⎡P A F A F AB EF ABC DEF ⎤⎣⎦
⎛0.4860.1150.4860.4730.5130.421⎫ ⎪Y = ⎪
0.1030.2850.1190.1510.2270.121⎪⎝⎭6⨯47
其中,P 为一个30行1列的单位矩阵;X 为一个30行1列的矩阵,其A -F 列数据分别对应表3中第A -F 列中的数据;A 2-F 2列数据分别对应表3中第
A -F 列中的数据的平方;AB EF 列数据分别对应表3中第A -F 列中的数
2
据两两组合而成的C 6=15项交叉项的乘积;ABC DEF 列数据分别对应表33中第A -F 列中的数据三三组合而成的C 6=20项交叉项的乘积;Y 为一个6行
47列的矩阵,各行数据分别对应附录一中各国每年交易费用率的数据。
5.3模型一的求解
经MATLAB 编程计算得:
ττ-1ˆβ=(XX )XY =(467329.453293399, -146372.718111389, , 176911.874680070)
故得回归方程:
ˆ=467329.453293399+(-146372.718111389)x 1+ + (-21289.1321242021)x 6y
+343405.998478539x 12+ +153.[1**********]4x 62
+(-4867.[1**********])x 1x 2+ +(-350888.06218273)x 5x 6+826.[1**********]6x 1x 2x 3+ +176911.874680070x 4x 5x 6
(5-3)
5.4模型一的检验
5.4.1回归方程(5-3)的显著性检验(F 检验)
(1)提出假设:
H 0:β1=β2= =βp =0,线性关系不显著; H 0:β1, β2, , βp 至少有一个不等于0。 (2)计算检验统计量F :
SSR p
F ==
SSE n -p -1
ˆi -)∑(y
i =1i n
2
p
ˆ)∑(y -y
i
i =1
n
2
n -p -1
(3)确定显著性水平α和分子自由度p 、分母自由度n -p -1,找出临界值F α:
α=0.01, p =6, n =47,F α=1.40
(4)作出决策:
由查表可知,F ≥F α,拒绝H 0。
5.4.2回归方程(5-3)的复相关系数
对样本进行分析计算可得:
S T =∑(y i -)
i =1250
2
偏差平方和:
2
回归平方和:
ˆi -)S R =∑(y
i =1250i =1
250
2
残差平方和:
ˆi )S E =∑(y i -y
由此求得模型一中多项式回归方程(5-3)的复相关系数R 为:
R =
S R
S T
由计算结果可知,模型一的复相关系数较高,所给数据的拟合性较好,符合要求。所以用含交叉项的多项式回归模型去拟合所给的数据是合适的,所以我们接受交易费用率与二级指标数据的关系之间满足线性相关关系这一假设。 5.5模型一的评价与结论
我们对所选指标进行逐步回归分析,确定其是否为影响交易费用率的主要因素,下表(表8)为当分别剔除各一级指标时模型一中多项式回归方程(5-3)的复相关系数R 值的变化情况。
表8 当剔除各一级指标时模型一R 值的变化情况
据的拟合性有较大幅度下降,线性关系较原来差,所以各评价指标均不能剔除。
2. 模型检验
S
这S 个模型都通过统计检验,具有合理性,可靠性,则用线性回归组合预测模型
ˆt +1=b 0+∑b i y it +1 y
i =1
b i (i =0, 1, 2, , S )
B =x Tx
其中:
()
-1
x Ty
TT
B =(b 0, b 1, , b S ) Y =(y 1, y 2, , y t )
X =(y ij )S (i +1), y j 0=1 i =1, 2, , S ; j =0, 1, , t
若:
t -S -1
>F 2(t -S -1, S ) TTT
Y Y -B X Y
则检验通过说明不同模型得到的预测值整体与实际值线性关系显著
所谓多重线性组合预测是利用不同模型组得到的组合值,再进行组合预测,从而提高了预测精度。
F =B TX TY /S
()
根据上述方法的简述,我们建立最后将所得的模型进行了相应的改进,表达形式如下:
ˆ=136S i D l G m R n +3317y . 5P i D l G m R n
在此模型中,我们的S =1 商差平方和:
2
L =∑(y i -)
残差平方和:
ˆi )2 Q =∑(y i -y
回归标准差:
ˆi -)2 U =∑(y
R 为相关系数:(拟合优度)
R =
回归标准差:
L U
S =/n -2
另外,为了便于分析,我们引入下标符号
ˆ(i )-y i 预测误差e 1=y
预测相对误差:ee i =e 1/y (i ) (0≤ee i ≤1) 预测精度:A i =1-ee i
∑1-
综上所述:预测平均精度:1=
i =1
n
ˆ(i ) -y i y y i n
或者用:
运用相关系数衡量变量之间相关程度
r xy =
∑(x
i =1
n
i
-)(y i -)
n
∑(x
i =1
n
i
-) 2∑(y i -) 2
i =1
3 模糊聚类和综合评判(确定等级模型)
首先,列举出有可能影响各种指标的评价因素,具体如上表所示。之后,我
模糊权重值:U k =U k 1+U k 2+U k 3+ +U k t
()
A j 表示第j 项指标的信息 (j =1, 2, , 5) 我们利用模糊数学建立隶属函数即归一法则:
u A j (x )=e
n
⎛x -a j - b j ⎝⎫⎪⎪⎭
2
a j =
∑a
i =1
ij
n
1n
(a ij -a j )2 b j =∑n -1i =1
利用格贴近度来建立模糊相似矩阵:
2
r ij =e
⎛a j -a i
-
b i +b j ⎝⎫⎪⎪⎭
i , j 均为1, 2, , 5
即有模糊相似模型矩阵为:R =r ij 取λ=σ进行聚类:
()
5⨯5
得到R λ矩阵 既有分类为:{x 1, x 2} … {x 3, x 5}… 对同一类的数据进行删除,即留下剩余的影响指标为:
u 1, u 2, u 3, , u t
四个顶级经营:A 1, A 2, A 3, A 4,分别表示好,较好,一般,差
A 1=(A 11, A 12, A 13, , A 1t )
A 1t =
即得到多因素评判矩阵:
⎛A 11 A 21R =
A 31 A ⎝41
∑u (x )
Aj
1i
i =1
n 1
n 1
A 12A 22A 32A 42
A 1t ⎫
⎪
A 2t ⎪
A 3t ⎪
⎪
A 4t ⎪⎭
权的分配:
u 1=(u 11, u 12, , u 14)
欧几里得贴近度:
1
2
N (B , A )=1-
由贴近公式得到:
1⎡2⎤
(()())B u -A u i i ⎢∑⎥ n ⎣i =1⎦
t
N (B , A 1) N (B , A 2) N (B , A 3) N (B , A 4)
综上所述: B的贴近度
max {N (B , A 1), (B , A 2), N (B , A 3), N (B , A 4)}
程序
a=[276.2 324.5 158.6 412.5 292.8 258.4 334.1 303.2 292.9 243.2 159.7 331.2 251.5 287.3 349.5 297.4 227.8 453.6 321.5 451.0 466.2 307.5 421.1 455.1 192.7 433.2 289.9 366.3 466.2 239.1 357.4 219.7 245.7 411.1 357.0 353.2 246.2 232.4 243.7 372.5 460.4 158.9 298.7 314.5 256.6 327.0 296.5 423.0 291.7 311.0 502.4 254.0 245.6 324.8 401.0 266.5 251.3 289.9 255.4 362.1 466.5 158.9 223.5 425.1 251.4 321.0 315.4 317.4 246.2 277.5 304.2 410.7 258.6 327.4 432.1 403.9 256.6 282.9 389.7 413.2 466.5 199.3 282.1 387.6 453.4 365.5 357.6 258.1 278.8 467.2 355.2 228.5 453.6 315.6 456.3 407.2 158.2 271.0 410.2 344.2 250.0 360.7 376.4 179.4 159.2 342.4 331.2 377.7 324.8 406.5 235.7 288.8 192.6 284.9 290.5 343.7 283.4 281.2 243.7 411.1]; mu=mean(a),sigma=std(a) for i=1:12 for j=1:12
r(i,j)=exp(-(mu(j)-mu(i))^2/(sigma(i)+sigma(j))^2);
end end r
save data1 r a
%ii)矩阵合成的MATLAB 函数
function rhat=hecheng(r); n=length(r); for i=1:n for j=1:n
rhat(i,j)=max(min([r(i,:);r(:,j)'])); end end
%iii)求模糊等价矩阵和聚类的程序
load data1 r1=hecheng(r) r2=hecheng(r1) r3=hecheng(r2) bh=zeros(12); bh(find(r2>=0.998))=1
确定等级
例 12 现有五个等级的茶叶样品1 2 3 4 5 A , A , A , A , A ,待识别茶叶B 。反映茶叶质
量的因素有六项指标,构成论域U ,其中 U ={ x1, x2, x3, x4, x5, x6} ;p
x 1 条索x 2 色泽x 3 净度x 4 汤色x 5 香气x 6 滋味 设五个等级的样品对 6 项指标的数值为: A1=(0.5,0.4,0.3,0.6,0.5,0.4) A2=(0.3,0.2,0.2,0.1,0.2,0.2) A3=(0.2,0.2,0.2,0.1,0.1,0.2) A4=(0,0.1,0.2,0.1,0.1,0.1) A5=(0,0.1,0.1,0.1,0.1,0.1) 待识别茶叶的各项指标值为 B = (0.4,0.2,0.1,0.4,0.5,0.6) 确定 B 的属类。
解 利用格贴近度公式计算可得
N (B , I ) = 0.5,N (B , II ) = 0.3,N (B , III ) = 0.2, N (B , IV) = 0.2,N (B , V) = 0.1
按择近原则,可以将 B 定为一级茶叶(与1 A 同属一类)。 计算的 MATLAB 程序如下:
a=[0.5 0.4 0.3 0.6 0.5 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.2 0.2 0.2 0.1 0.1 0.2 0 0.1 0.2 0.1 0.1 0.1 0 0.1 0.1 0.1 0.1 0.1];
b=[0.4 0.2 0.1 0.4 0.5 0.6]; for i=1:5
x=[a(i,:);b];
t(i)=min([max(min(x)) 1-min(max(x))]); end t
*4.确定权重模型
一.方法一
运用方差除以平均值:
综上所述,得到问题三的单目标优化模型
∑(T
Q i =D i E i =
j =1
30
j
-E i )
j
2
∑T
j =1
30
30
⎧
⎪E i =∑T j
j =1⎪
⎨230
⎪D =
(T j -E i )⎪i ∑j =1⎩
⎧0≤T j
二.方法二
它们每个数都有一些相同数,表示为:k1,k2,k3…….kn; 加权平均的公式是
(k1p1+k2p2+k3p3+……knpn )/n
加权求和评分法选址实施步骤:
1、找到设施选择的各种影响因素:把有关的影响因素列成一个清单——只需要列出主要的、各店址方案有明显差异的影响因素
2、根据各因素的重要程度确定相应的权,确定每个影响因素的权重 3、对各因素由优到劣分成等级,并相应规定各等级的分数。
4、将每个因素中各方案的排队等级分数乘以该因素的相应权数,得到各候选方案的总得分
5、汇总各方案总分,并根据得分高低,评判方案的优劣,方便取舍。
三.方法三
熵权法
(具体见PPT )
四.方法四
模糊聚类和灰色关联度可以联合用 先聚类
(二) 运用模糊数学聚类分析剔除同类因素
1、我们利用模糊数学隶属函数来对上表数据进行归一:
⎛x -a 1⎫⎧⎪- ⎪⎝b 1⎭⎪u (x )=e
⎪A 1n ⎪a ij ∑⎪⎪i =1
⎨a j =
n ⎪
1n ⎪2
()b =a -a ∑ij j ⎪j
n -1i -1
⎪⎪⎩
2
2、利用格贴近度来建立模糊相似矩阵:
r ij =e
⎛a j -a i -
b i +b j ⎝⎫⎪⎪⎭
2
i , j 均为1, 2, , 12
即有模糊相似模型矩阵为:R =r ij 3、取λ=σ进行聚类:
()
12⨯12
A j 表示第j 项指标的信息 (j =1, 2, , 12)得到R λ矩阵 综上所诉:(目标函数)对R λ矩阵运用0-1判别:
r i =1⎧r 属于同一类;
J =⎨i
r =0⎩r i 不属于同一类;
既有分类为:
程度、管道、公路、铁路、民航);⎧(市场化水平、对外开放⎫
⎪⎪
国消费市场数);⎪(全国消费成品交额、全⎪
⎨⎬
度);⎪(非国有化程度、货币程⎪
⎪(教育毛收入、在校生/人口总数)⎪⎩⎭
4、用matlab 软件编程,对同一类的数据进行删除,即最终确定的主要因素为:
{市场化水平,全国消费} 成品交额,非国有化程度,教育毛收入
再进行灰色关联度分析;
7.2.1灰色系统理论关联分析:
①选取参数列;
x 0={x 0(k )|k =1, 2, , n }=(x 0(1), x 0(2), , x 0(n ))
(k =11表示年数、m =4表示影响因素个数)
假设有m 个比较数列
y i ={x i (k )|k =1, 2, , n }=(x i (1), x i (2), x i (n )), i =1, 2, , m
2规范数列x i =(x i (1), x i (2), , x i (n )),称 ○
⎛x i (2)x i (n )⎫
⎪x i = 1, , , x 1⎪ x 1i ⎝i ⎭
为原始数列x 的初始化数列。
3则有比较数列x i 对参考数列x 0在k 时刻的关联系数: ○
min min x (t )-x (t )+ρmax max x (t )-x (t )
ξ(k )=
x k -x k +ρx t -x t 0
s
s
s
t
s
t
i
i
s
s
t
(称上面式子中min
s
min x (t )-x (t )、m ax m ax x (t )-x (t )分别为两级最
s
0s
t s t
小差及两级最大差, 其中ρ∈[0, 1]为分辨系数)
综上所诉:(目标函数)数列x i 对参考数列x 0的关联度为
1n
r i =∑ξi (k )
n k =1
由上式易看出,关联度是各个时刻的关联系数集中为一个平均值,亦即把过于分散的信息集中处理,利用关联度这个概念,我们可以对各种问题进行因素分析。考虑下面的问题。
综上,最终建立模型为:
7.3模型的求解
这样,我们对收集数据进行处理。又利用了matlab 软件进行了相关的编程,最后计算的结果如下:
表6:r 数值的具体求解
(灰色关联度程序)
clc,clear
load x.txt %把原始数据存放在纯文本文件x.txt 中,其中把数据的" 替换替换成. for i=1:15
x(i,:)=x(i,:)/x(i,1); %标准化数据 end
for i=16:17
x(i,:)=x(i,1)./x(i,:); %标准化数据 end
data=x;
n=size(data,2); %求矩阵的列数,即观测时刻的个数 ck=data(1,:); %提出参考数列 bj=data(2:end,:); %提出比较数列 m2=size(bj,1); %求比较数列的个数 for j=1:m2 t(j,:)=bj(j,:)-ck; end
mn=min(min(abs(t'))); %求最小差 mx=max(max(abs(t'))); %求最大差 rho=0.5; %分辨系数设置
ksi=(mn+rho*mx)./(abs(t)+rho*mx); %求关联系数 r=sum(ksi')/n %求关联度
[rs,rind]=sort(r,'descend') %对关联度进行排序
五.
1、分层分析法示意图
A ;交易费用
B1
图1:分层分析法示意图
2、构造判断矩阵
设现在要比较N 个因子X ={x 1, x 2, x n }对某种因素Z 的影响大小,采取对
因子进行两两比较建立成对比较矩阵的办法。即每次取两个因子x i 和x j ,以a ij 表示x i 和x j 对Z 的影响大小之比,全部比较结果用矩阵D =a ij
()
n ⨯n
表示,称D 为
Z -X 之间的成对比较判断矩阵。容易看出,若x i 和x j 对Z 的影响之比为a ij ,
则有 a ij =
定义 若矩阵D =a ij
1
。 a
()
n ⨯n
满足
a ij >0;a ji =
1
(i , j =1, 2 n ) a ij
则称之为正互反矩阵(易见a ii =1, i =1, , n ) 3、层次排序及一致性检验
判断矩阵D 对应最大特征值λmax 的特征向量W ,经过化一后即为同一层次相应因素对于上一层次某种因素相对重要性的排序权值。其中矩阵D 还应满足:
a ij a jk =a ik , ∀i , j , k =1, 2, , n
矩阵满足以上条件,我们要对其进行一致性检验: (i )计算一致性指标CI
CI =
λmax -n
n -1
(ii )查找相应的平均随机一致性指标RI 。对n =1, , 9,Saaty 给出了RI 的值,如表一所示:
RI =
λ' max -n
n -1
m
(iii )计算一致性比例CR
∑CI (j )a
CR =
j =1m
j
j
∑RI (j )a
j =1
(当CR
当将层次总排序合成时,具体表格如下:
综上所诉:(目标函数)各因素的权重为
b =∑b ij a j , i =1, 2, , n
j =1
m
约束条件为
λmax -n ⎧
CI =⎪n -1⎪'
⎪RI =λmax -n ⎪n -1⎪⎪
m s . t ⎨ CI (j )a j ⎪∑⎪CR =j =1
≤0. 10m ⎪
RI (j )a j ⎪∑j =1⎪
⎪⎩
(层次分析程序)
clc,clear
fid=fopen('txt3.txt','r'); n1=6;n2=3; a=[];
for i=1:n1
tmp=str2num(fgetl(fid));
a=[a;tmp]; %读准则层判断矩阵 end
for i=1:n1
str1=char(['b',int2str(i),'=[];']);
str2=char(['b',int2str(i),'=[b',int2str(i),';tmp];']); eval(str1); for j=1:n2
tmp=str2num(fgetl(fid)); eval(str2); %读方案层的判断矩阵 end
-173-
end
ri=[0,0,0.58,0.90,1.12,1.24,1.32,1.41,1.45]; %一致性指标 [x,y]=eig(a);
lamda=max(diag(y));
num=find(diag(y)==lamda); w0=x(:,num)/sum(x(:,num)); cr0=(lamda-n1)/(n1-1)/ri(n1) for i=1:n1
[x,y]=eig(eval(char(['b',int2str(i)]))); lamda=max(diag(y));
num=find(diag(y)==lamda);
w1(:,i)=x(:,num)/sum(x(:,num)); cr1(i)=(lamda-n2)/(n2-1)/ri(n2); end
cr1, ts=w1*w0, cr=cr1*w0
纯文本文件txt3.txt 中的数据格式如下:
1 1 1 4 1 1/2 1 1 2 4 1 1/2 1 1/2 1 5 3 1/2 1/4 1/4 1/5 1 1/3 1/3 1 1 1/3 3 1 1 2 2 2 3 3 1 1 1/4 1/2 4 1 3 2 1/3 1 1 1/4 1/5 4 1 1/2 5 2 1 1 3 1/3 1/3 1 1/7 3 7 1 1 1/3 5 3 1 7
1/5 1/7 1 1 1 7 1 1 7 1/7 1/7 1 1 7 9 1/7 1 1
6. 3模型的求解
我们通过matlab 软件进行相关的编程,利用程序最后计算出的结果如下:
六.预测模型
方法一:时间预测
7.2.1.2模型一的建立 把初始数据定义为:x i (0)(j ) 第一次平移数据数列:
x i (1)(j )=
第二次平移数据数列:
∑x ()(j )
0i j
j +4
N
x i (2)(j )=
∑x ()(j )
1i j
j +4
N
综上所诉:(目标函数)建立预测线性模型:
Y i (j +τ)=a +b τ
(τ表示预测超前周期数)
约束条件:
⎧a =2x i (1) (j ) -x i (2) (j ) ⎪2⎪s . t ⎨b =(x i (1) (j ) -x i (2) (j ))
N -1⎪
N =5⎪⎩
方法二:灰色预测
7.2.2.1灰色预测模型的相关知识
GM (1, 1)模型是灰色预测的核心,它是一个单个变量预测的一阶微分方程模型,其离散时间响应函数近似呈指数规律。根据数据分析我们可以得出题目中给定的数据大体上符合该规律。 7.2.2.2模型的建立 原始非负时间序列:
(0)(0)(01)(1986), x 1(0)(1987), , x 2(1986), x 2(1987), , x 8(0)(1986), x 80(1987) x i (0)(t )=x 1
{}
x i (1)(t )为累加生成序列,即:
) x i (t )=∑x i 0(t )(t =1, 2, 3, . 2005
(1)
t =1
t
邻接方程:
Z i (t )=-
1(1)
x i (t -1)+x i (1)(t )(t =1, 2, 3, , 2005) 2
()
GM (1, 1)模型的白化微分方程:
dx i (1)(t )
+ax i (1)(t )=u dt
解决此微分方程得灰色预测的离散时间响应函数:
u ⎫u ⎛
x i 1(t +1)= x i 0(1)-⎪e -at +
a ⎭a ⎝
⎛a ⎫
ˆ= 设:a 为待定参数,u 为待辨识内生变量,则有待辨识向量:a u ⎪⎪按照最小二⎝⎭
ˆ=B TB 乘法得出:a
()
-1
B Ty ,其中:
Z i (2)Z (3)B =i
Z i (n )1x i 0(2)1x i 0(3) Y = 1x i 0(n )
综上所诉:(目标函数)灰色预测的响应函数为
u ⎫u ⎛
x i 1(t +1)= x i 0(1)-⎪e -at +
a ⎭a ⎝
ˆi -y i ) min S =∑(y
i =1
n
2
七:最小二乘法
8.2模型四的建立(最小二乘法)
(1)设定拟合曲线f (x )
寻找函数(曲线)y= f (x ), 使f (x )在某种准则下与所有数据点最接近,即曲线拟合的最好,其表达式为:
f (x )=a 1r 1(x )+a 2r 2(x )+ +a m r m (x )
其中,r k (x )为各相关国家历年人类发展指数,f (x )为各相关国家历年交易费用率,a k 是待定系数k =1,2, , m ; m
拟合准则是使y i (i =1,2, n )与f (x i )的距离δi 的平方和最小,称为最小二乘原则。
(2)确定系数a k 记
J (a 1, , a m )=∑δi 2=∑(f (x i )-y i )
i =1
i =1
n n
2
为求a 1, , a m 使J 达到最小,只需利用极值的必要条件到关于a 1, , a m 的线性方程组
∂J
(j =1, , m ),得∂a j
⎡m ⎤r x a r x -y ∑j (i )⎢∑k k (i )i ⎥=0, j =1, , m i =1⎣k =1⎦
n
当{r 1(x ), , r m (x )}线性无关时,上述方程有唯一解。 (3)选取函数r k (x )
综上所述:(目标函数)根据拟合图6,我们选取如下多项式函数(曲线)去拟合
f (x )=a 1x m +a 2x m -1+ +a m x +a m +1
约束条件
n
⎧2
min (f (x ) -y ) ∑i i ⎪⎪i =1
s . t ⎨n (i =1, 2 , n , j =1, 2, , m ) m
⎪∑r j (x i )[∑a k r k (x i ) -y i ]=0⎪k =1⎩i =1
将几个因素综合起来
可以把它们分别赋一个权,然后定义一个影响度的概念把他们写成一个模型,(模型一定要有最终的目标,可以是算法中自带的,没有的话一定要自己根据题目中的要求自定义一个,这样评卷老师一看就清晰明了)
像世博的影响力的那题:把影响力这样一个抽象的概念定义为:
总影响力的定义:各指标影响力与其权重乘积的和
八. 主层次分析法(聚类和层次分析) 通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n 个地理样本,每个样本共有p 个变量描述,这样就构成了一个n×p阶的地理数据矩阵:
如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为x 1,x 2,…,zm (m≤p)。则
系数l ij 由下列原则来决定:
(1)z i 与z j (i≠j;i ,j=1,2,…,m) 相互无关;
(2)z 1是x 1,x 2,…,x p 的一切线性组合中方差最大者;z 2是与z 1不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者;……;z m 是与z 1,z 2,……zm-1都不相关的x 1,x 2,…,x p 的所有线性组合中方差最大者。
这样决定的新变量指标z 1,z 2,…,zm 分别称为原变量指标x ,x 2,…,x p
的第一,第二,…,第m 主成分。其中,z 1在总方差中占的比例最大,z 2,z 3,…,z m 的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
1
从以上分析可以看出,找主成分就是确定原来变量x j (j=1,2,…,p) 在诸主成分z i (i=1,2,…,m) 上的载荷l ij (i=1,2,…,m ;j=1,2,…,p) ,从数学上容易知道,它们分别是x 1,x 2,…,x p 的相关矩阵的m 个较大的特征值所对应的特征向量。
(1) 计算相关系数矩阵
在公式(3) 中,r ij (i ,j=1,2,…,p) 为原来变量x i 与x j 的相关系数,其计算公式为
因为R 是实对称矩阵(即r ij =rji ) ,所以只需计算其上三角元素或下三角元素即可。
(2) 计算特征值与特征向量
首先解特征方程|λI-R |=0求出特征值λ(i=1,2,…,p) ,并使其按大小顺序排列,即λ1≥λ2≥…,≥λp ≥0;然后分别求出对应于特征值λi 的特征向量e i (i=1,2,…,p) 。
i
(3) 计算主成分贡献率及累计贡献率
一般取累计贡献率达85-95%的特征值λ,λ2,…,λm 所对应的第一,第二,……,第m (m ≤p) 个主成分。
1
(4) 计算主成分载荷
由此可以进一步计算主成分得分:
九.0-1模型
一.指派问题
设变量为x ij , 当第i 个人作第j 项工作时,x ij =1 ,否则. x ij =0相应的线性规划问题为:
n
n
min ∑∑c ij x ij
i =1j =1 约束条件:
⎧n
⎪∑x ij =1, (i =1, 2 , n ) ⎪j =1 s . t
⎪
n ⎨∑x ij , (j =1, 2, , n ) ⎪i =1
⎪x ij ∈{1,0}(, i , j =1, 2, , n )⎪⎩
程序: model: sets:
people/1..6/; work/1..6/;
link(people,work):c,x; endsets data:
c= 20 15 16 5 4 7 17 15 33 12 8 6 9 12 18 16 30 13 12 8 11 27 19 14 -99 7 10 21 10 32 -99 -99 -99 6 11 13; enddata
max=@sum(link:c*x);
。因此,
@for(people(i):@sum(link(i,j):x(i,j))=1); @for(work(i):@sum(link(i,j):x(j,i))=1); End
二,背包问题
给定n 种物品和一背包。物品i 的重量是wi ,其价值为vi ,背包的容量为C 。问:应如何选择装入背包的物品,使得装入背包中物品的总价值最大?
max ∑v i x i
i =1n
n
⎧w i x i ≤C ⎪
s . t ⎨∑i =1
⎪⎩x i ∈{0, 1},1≤i ≤n
十 , 图论
[网络(赋权图)]
有向图 G=(V, A) 中,给每条边 a = 赋予一个实数权 w (vi , vj ) ,得到一个有向网络。通常情况下 w (vi , vj ) ≥ 0。(为简化问题的讨论,无特别声明情况下,我们都假定 w (vi , vj ) > 0。)
[距离矩阵] 对上述网络,定义其距离矩阵 D=(dij ) n ⨯n ,n =|V|
d i j =
{∞
w (v i , v j ) 当∈A
其它
带权路径长度]
设路径 v 1, v 2 , … ,vk 为上述网络的路径,其带权路径长度定义为
π(v 1, v k ) =∑w (v i , v i +1)
i =1
k -1
对上述网络,若路径 v 1, v 2 , … ,vk -1 , vk 是一条 v 1 到 vk 的最短路,则路径 v 1, v 2 , … ,vk -1 是 一 条 v 1 到 vk -1 的最短路。
[Dijkstra 算法] 求有向网络 G=(V, A) 中结点 u 到其它结点的最短距
离。
输入:有向网络 G=(V, A) 的距离矩阵 D。
思想:维护一个顶点集合S ,对任何 z ∈S ,d (u, z) 已获得确认为u 到 z 最短距离。目标是扩充 S,直到 S 包含了G 的所有顶点。为此对每个 z ∉S ,需要维持对 d (u,z ) 的一个试探值 t(z ) ,即当前找到的(局部)最小的 π(u,z ) 。
初始化:设 S={u },t (u )=0;对 z ≠u ,设 t (z ) = w (u,z ) 。
目标函数迭代:取 v ∉S 使得
\ t (v )=min {t (z )|z ∉S};S=S⋃{v }; 对 z ∉S 且∈A ,令
t (z )= min {t (z ), t (v )+w (v , z )}。
结束:S=V 或 对所有 z ∉S ,t (z )=∞。
此时对所有 v ∈V ,d (u, v)=t (v )
[Warshall 算法] (flody算法) 有向网络G=(V, A) 中任两点间最
短距离。
设 D 为 G 的距离矩阵,n =|V|。
1. 输入 D 矩阵 2. i ← 1 3. j ← 1
4. djk ← min {djk , dik + dkj },k =1 ... n
5. j ← j+1,若 j ≤n ,转 4 6. i ← i +1 ,若 i≤n ,转 3
7. Stop
目标:djk min{djk , dji + dik },k =1 ... n