聚类分析法

应用统计学课程论文:

浅析聚类分析法在碎纸拼接复原中的

应用

系别:工程管理 学号:B11080111 姓名:贾晓婷 指导老师:张亚峰

浅析聚类分析法在碎纸拼接复原中的应用

系别:工程管理 学号:B11080111 姓名:贾晓婷 指导教师:张亚峰 摘要:应用统计学是一门以收集数据分析数据为研究对象的学科,聚类分析法作为数据分类的一种典型方法,也是应用统计学一种基本的方法。破碎文件的拼接复原以其在司法物证复原、历史文献修复以及军事情报等方面的突出作用,一直是人们的研究热点。本文以其在上述应用领域的重要性为背景,以2013年大学生数学建模竞赛B题中问题1为例,针对典型的碎纸机破碎纸片的拼接复原问题建立了聚类分析的模型,具体介绍了聚类分析法的原理以及在碎纸复原中的应用。

针对所选问题,我们建立了基于聚类分析的碎纸片复原模型。首先分析中文碎纸片。对题目所给图像数据进行初步处理,将图片用Matlab函数读入Matlab,把图片信息转换为数字矩阵。再提取每一个数字矩阵的首列和尾列作为每一个碎纸片的特征边,将所有特征边组合成一个新的矩阵,然后筛选出起点纸片和终点纸片,结果分别为008和006。接着对该矩阵的每一列进行R型聚类分析,分析结果见正文,进而得到聚类图见正文图5-1,复原结果见正文表5-1。英文碎纸片的复原过程与中文碎纸片一致,起点纸片003,终点纸片004,聚类图见正文图5-2,复原结果见正文表5-2. 关键字:聚类分析法 碎纸拼接复原

一、 问题背景及分析

所选问题要求对给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)进行拼接复原,根据所给附件我们可以了解到,所有的碎纸片规格相同,这样我们就不能用基于轮廓的复原方法,采用基于内容的匹配复原法。由于聚类分析即可以对样本进行分类,也可以对变量进行分类,分类的依据是样本或变量间的相近程度。由切割的性质可以得到相邻的碎纸片的公共边必然具有完全相同的特征,于是根据每一条碎纸片边缘不同的文字特征对其进行聚类分析具有合理性,只需令所分的组数等于需要重组的边数即可得到得到较理想的匹配结果。分类结果以组为单位,以起点纸片标号为开头,依次向下寻找特征边数字矩阵距离最近的纸片,查找原则是奇偶相间。

考虑到结果可能具有的不唯一性,因为数据量不是很大,我们选择将所有连续的序列链列举出来,然后人工筛选出理想解。

二、 模型的建立与求解

2.1 模型假设

假设所有的碎纸片在切割过程中没有任何缺损,即可以被完整复原; 2.2 符号约定

2.3 模型建立与求解 2.3.1 中文碎纸片复原

注:若解题过程中出现重复变量或新的变量,按当前变量含义为准。

由于被切割的碎纸片的相邻边具有唯一匹配性,本问选择R型聚类分析法对碎纸片进行复原。

所谓聚类分析,是按照一定的标准对研究对象进行分类的数学方法,聚类分析又称群分析,是对多个样本或指标进行定量分类的一种多元统计分析方法。对样本进行分类成为Q型聚类分析,对指标进行分类称为R型聚类分析。聚类分析的方法有很多种,如最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、利差平方和法等等。本文使用的是R型的最短距离法对碎纸片进行分类。

第一步,数据的预处理。

将图片读入Matlab,把图像信息转换为数字信息,提取每一个图像转换后的数字矩阵的第一列和最后一列,认为它们是碎纸片的特征边,依次按顺序重新组合并转置成为一个新的矩阵。每一个图像转换后的数字矩阵都是1980*72的矩阵,故新矩阵应为38*1980的矩阵。新矩阵如下(仅显示部分结果,所有元素不全为255):

第二步,首尾碎纸条的筛选。

由观察结果可知,起点纸片为008,终点纸片为004. 第三步,使用Matlab进行聚类分析并作出聚类图。 对记每一行(周期)的指数为:wi

来测量点与点之间的距离,即

d

(vi1,vi2,,vi240),i1,2,

,97

。使用绝对值距离

w,wvv

i

j

k1

ik

240

jk

,D

G,Gmindw,w.

p

q

wiGp

wjGq

ij

由以上距离公式,可以算出距离矩阵:

a11D

ai1

其中ij38。

620190

a1j203490aij2552061355

2957459828

3576543802

2991032386



035599316160

使用Matlab进行聚类分析,得到如下结果(分析结果中的数字代表矩阵的相应列):

第1次合成,平台高度为5649时的分类结果为:5 22 第2次合成,平台高度为6328时的分类结果为:23 38 第3次合成,平台高度为6856时的分类结果为:2 13 第4次合成,平台高度为7503时的分类结果为:26 31 第5次合成,平台高度为8011时的分类结果为:6 33 第6次合成,平台高度为9948时的分类结果为:28 37 第7次合成,平台高度为10835时的分类结果为:1 36 第8次合成,平台高度为10955时的分类结果为:15 24 第9次合成,平台高度为11274时的分类结果为:3 34 第10次合成,平台高度为12842时的分类结果为:12 19 …… ……

第30次合成,平台高度为22198时的分类结果为:26 34 第31次合成,平台高度为22325时的分类结果为:26 27 第32次合成,平台高度为22379时的分类结果为:11 34 第33次合成,平台高度为23296时的分类结果为:30 35 第34次合成,平台高度为23444时的分类结果为:31 37 第35次合成,平台高度为23884时的分类结果为:26 28 第36次合成,平台高度为25181时的分类结果为:11 32 第37次合成,平台高度为26499时的分类结果为:26 37 使用Matlab统计工具箱的相关命令画出聚类图如下:

4

图1 中文碎纸片特征边聚类图

相应分类结果为: 第1类的有4 第2类的有9 第3类的有25 30

第4类的有14 17 26 31 第5类的有10 11 第6类的有18 29 第7类的有23 38 第8类的有15 24 第9类的有28 37 第10类的有5 22 第11类的有8 21 第12类的有12 19 第13类的有6 33 第14类的有16 35 第15类的有1 36 第16类的有20 27

第17类的有2 13 第18类的有7 32 第19类的有3 34 第四步,碎纸片拼接复原。

根据第三步的结果人工筛选出可以唯一组成完整图像的两条序列如下:

(1) 008(17、18)→014(29、30)→012(25、26)→015(31、32)→003(7、8)→010(21、22)→002(5、6)→016(33、34)→001(3、4);

(2) 004(9、10)→005(11、22)→009(19、20)→013(27、28)→018(37、38)→011(23、24)→007(15、16)→017(35、36)→000(1、2)→006(13、14)。

由第二步可知,起点纸片为008,终点纸片为006,可直接将两条序列链连接为一条,最终复原结果如下表:

表1 附件1中文碎纸片复原结果

运用Matlab按以上顺序重组复原图数字矩阵,得到中文复原结果见下图中文复原图:

图2 中文复原图

2.3.2 英文碎纸片复原

英文碎纸片的复原过程与中文碎纸片复原过程相似,参考中文碎纸片的复原过程,得到英文碎纸片重要过程的结果如下:

经筛选,得起点纸片为003,重点纸片为004。 Matlab进行聚类分析结果为:

第1次合成,平台高度为5671时的分类结果为:8 13

第2次合成,平台高度为6180时的分类结果为:33 36 第3次合成,平台高度为6756时的分类结果为:3 12 第4次合成,平台高度为6953时的分类结果为:6 15 第5次合成,平台高度为7007时的分类结果为:18 33 第6次合成,平台高度为7747时的分类结果为:32 37 第7次合成,平台高度为8941时的分类结果为:2 11 第8次合成,平台高度为9572时的分类结果为:4 19 第9次合成,平台高度为9898时的分类结果为:9 34 第10次合成,平台高度为10076时的分类结果为:1 24 …… ……

第30次合成,平台高度为23932时的分类结果为:3 19 第31次合成,平台高度为23955时的分类结果为:1 17 第32次合成,平台高度为24111时的分类结果为:1 28 第33次合成,平台高度为24121时的分类结果为:1 31 第34次合成,平台高度为24172时的分类结果为:1 30 第35次合成,平台高度为24264时的分类结果为:1 21 第36次合成,平台高度为24314时的分类结果为:1 13 第37次合成,平台高度为24416时的分类结果为:1 34 聚类图为:

35

4

图3 英文碎纸片特征边聚类图

分类结果为:

第1类的有5 7 10 第2类的有1 24 第3类的有3 12 第4类的有6 15 第5类的有16 31 第6类的有18 33 36 第7类的有32 37 第8类的有21 28 第9类的有25 第10类的有8 13 第11类的有20 27 第12类的有17 30 35 第13类的有23 38 第14类的有4 19

第15类的有9 34 第16类的有14 第17类的有22 第18类的有26 29 第19类的有2 11

根据分类结果人工筛选出唯一可以组成完整图像的三条序列如下: (1)003(7、8)→006(13、14);

(2)002(5、6)→007(15、16)→015(31、32)→018(37、38)→011(23、24)→000(1、2)→005(11、12)→001(3、4)→009(19、20)→013(27、28)→010(21、22);

(3)008(17、18)→012(25、26)→014(29、30)→017(35、36)→016(33、34)→004(9、10)。

由于起点纸片为003,终点纸片为004,直接将三条序列链按(1)→(2)→(3)连接为一条,最终复原结果如下表:

表5-2 附件1英文碎纸片复原结果表

再次运用Matlab按以上顺序重组复原图数字矩阵,得到英文复原结果见下图英文复原图:

图2 中文复原图:

三、 模型评价

所选问题要求对给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)进

行拼接复原,根据所给附件了解到,所有的碎纸片规格相同,由于聚类分析即可以对样本进行分类,也可以对变量进行分类,分类的依据是样本或变量间的相近程度。由切割的性质可以得到相邻的碎纸片的公共边必然具有完全相同的特征,于是根据每一条碎纸片边缘不同的文字特征对其进行聚类分析具有合理性,只需令所分的组数等于需要重组的边数即可得到得到较理想的匹配结果。由问题一的聚类分析结果可知,聚类分析法在此处的运用效果较好。

四、 参考文献

[1]卓金武等,《MATLAB在数学建模中的应用》,北京航空航天大学出版社,2013年1月第1次印刷

[2]司守奎等,《数学建模算法与应用》,国防工业出版社,2011年8月第1版

[3]张德丰等,《Mtalab程序设计与综合应用》,清华大学出版社,2012年1月第1版

[4]姜启源等,《大学数学实验》,清华大学出版社,2005年2月第1版

[5]冯 杰等,《数学建模原理与案例》,科学出版社,2007年1月第1版

附录:

1 数据预处理程序

a=imread ('000.bmp');%将默认位置设为目标碎纸片所在的附件

b=imread ('001.bmp');

c=imread ('002.bmp');

d=imread ('003.bmp');

e=imread ('004.bmp');

f=imread ('005.bmp');

g=imread ('006.bmp');

h=imread ('007.bmp');

i=imread ('008.bmp');

j=imread ('009.bmp');

k=imread ('010.bmp');

l=imread ('011.bmp');

m=imread ('012.bmp');

n=imread ('013.bmp');

o=imread ('014.bmp');

p=imread ('015.bmp');

q=imread ('016.bmp');

r=imread ('017.bmp');

s=imread ('018.bmp');

aa=[a(:,1),a(:,72),b(:,1),b(:,72),c(:,1),c(:,72),d(:,1),d(:,72),e(:,1),e(:,

72),f(:,1),f(:,72),g(:,1),g(:,72),h(1,:),h(72,:),i(1,:),i(72,:),j(1,:),j(72,:),k(1,:),a(:,72),l(:,1),l(:,72),m(:,1),m(:,72),n(:,1),n(:,72),o(:,1),o(:,

72),p(:,1),p(:,72),q(:,1),q(:,72),r(:,1),r(:,72),s(:,1),s(:,72)];

2 聚类分析法程序

clc

Clear

A=[];

a=[A’];%a为特征边数字矩阵的转置矩阵

[m,n]=size(a);

d=zeros(m);

d=mandist(a');%mandist求矩阵行向量之间的两两绝对值距离

d=tril(d);%截取下三角

nd=nonzeros(d);

nd=union(nd,nd);

for i=1:m-1

nd_min=min(nd);

[row,col]=find(d==nd_min);tm=union(row,col);

tm=reshape(tm,1,length(tm));

fprintf('第%d次合成,平台高度为%d时的分类结果为:%s\n',i,nd_min,int2str(tm)); nd(find(nd==nd_min))=[];

if length(nd)==0

break

end

end

3 聚类图画法

clc

clear

a=[];%a为特征边数字矩阵的转置矩阵

y=pdist(a,'cityblock');

yc=squareform(y)

z=linkage(y)

[h,t]=dendrogram(z)

T=cluster(z,'maxclust',19)%数字表示所分成的组数

for i=1:19

tm=find(T==i);

tm=reshape(tm,1,length(tm));

fprintf('第%d类的有%s\n',i,int2str(tm));

end

4 复原图做法

a=imread ('000.bmp');%需将默认位置设为目标碎纸片所在的附件

b=imread ('001.bmp');

c=imread ('002.bmp');

d=imread ('003.bmp');

e=imread ('004.bmp');

f=imread ('005.bmp');

g=imread ('006.bmp');

h=imread ('007.bmp');

i=imread ('008.bmp');

j=imread ('009.bmp');

k=imread ('010.bmp');

l=imread ('011.bmp');

m=imread ('012.bmp');

n=imread ('013.bmp');

o=imread ('014.bmp');

p=imread ('015.bmp');

q=imread ('016.bmp');

r=imread ('017.bmp');

s=imread ('018.bmp');

C=[i o m p d k c q b e f j n s l h r a g];%求解英文复原图时C替换为D=[d g c h p s l b j n k i m o r q e];

imwrite(C,'ͼһ.bmp','bmp');%求解英文复原图时C替换为D,'ͼһ.bmp'为'文件名

应用统计学课程论文:

浅析聚类分析法在碎纸拼接复原中的

应用

系别:工程管理 学号:B11080111 姓名:贾晓婷 指导老师:张亚峰

浅析聚类分析法在碎纸拼接复原中的应用

系别:工程管理 学号:B11080111 姓名:贾晓婷 指导教师:张亚峰 摘要:应用统计学是一门以收集数据分析数据为研究对象的学科,聚类分析法作为数据分类的一种典型方法,也是应用统计学一种基本的方法。破碎文件的拼接复原以其在司法物证复原、历史文献修复以及军事情报等方面的突出作用,一直是人们的研究热点。本文以其在上述应用领域的重要性为背景,以2013年大学生数学建模竞赛B题中问题1为例,针对典型的碎纸机破碎纸片的拼接复原问题建立了聚类分析的模型,具体介绍了聚类分析法的原理以及在碎纸复原中的应用。

针对所选问题,我们建立了基于聚类分析的碎纸片复原模型。首先分析中文碎纸片。对题目所给图像数据进行初步处理,将图片用Matlab函数读入Matlab,把图片信息转换为数字矩阵。再提取每一个数字矩阵的首列和尾列作为每一个碎纸片的特征边,将所有特征边组合成一个新的矩阵,然后筛选出起点纸片和终点纸片,结果分别为008和006。接着对该矩阵的每一列进行R型聚类分析,分析结果见正文,进而得到聚类图见正文图5-1,复原结果见正文表5-1。英文碎纸片的复原过程与中文碎纸片一致,起点纸片003,终点纸片004,聚类图见正文图5-2,复原结果见正文表5-2. 关键字:聚类分析法 碎纸拼接复原

一、 问题背景及分析

所选问题要求对给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)进行拼接复原,根据所给附件我们可以了解到,所有的碎纸片规格相同,这样我们就不能用基于轮廓的复原方法,采用基于内容的匹配复原法。由于聚类分析即可以对样本进行分类,也可以对变量进行分类,分类的依据是样本或变量间的相近程度。由切割的性质可以得到相邻的碎纸片的公共边必然具有完全相同的特征,于是根据每一条碎纸片边缘不同的文字特征对其进行聚类分析具有合理性,只需令所分的组数等于需要重组的边数即可得到得到较理想的匹配结果。分类结果以组为单位,以起点纸片标号为开头,依次向下寻找特征边数字矩阵距离最近的纸片,查找原则是奇偶相间。

考虑到结果可能具有的不唯一性,因为数据量不是很大,我们选择将所有连续的序列链列举出来,然后人工筛选出理想解。

二、 模型的建立与求解

2.1 模型假设

假设所有的碎纸片在切割过程中没有任何缺损,即可以被完整复原; 2.2 符号约定

2.3 模型建立与求解 2.3.1 中文碎纸片复原

注:若解题过程中出现重复变量或新的变量,按当前变量含义为准。

由于被切割的碎纸片的相邻边具有唯一匹配性,本问选择R型聚类分析法对碎纸片进行复原。

所谓聚类分析,是按照一定的标准对研究对象进行分类的数学方法,聚类分析又称群分析,是对多个样本或指标进行定量分类的一种多元统计分析方法。对样本进行分类成为Q型聚类分析,对指标进行分类称为R型聚类分析。聚类分析的方法有很多种,如最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、利差平方和法等等。本文使用的是R型的最短距离法对碎纸片进行分类。

第一步,数据的预处理。

将图片读入Matlab,把图像信息转换为数字信息,提取每一个图像转换后的数字矩阵的第一列和最后一列,认为它们是碎纸片的特征边,依次按顺序重新组合并转置成为一个新的矩阵。每一个图像转换后的数字矩阵都是1980*72的矩阵,故新矩阵应为38*1980的矩阵。新矩阵如下(仅显示部分结果,所有元素不全为255):

第二步,首尾碎纸条的筛选。

由观察结果可知,起点纸片为008,终点纸片为004. 第三步,使用Matlab进行聚类分析并作出聚类图。 对记每一行(周期)的指数为:wi

来测量点与点之间的距离,即

d

(vi1,vi2,,vi240),i1,2,

,97

。使用绝对值距离

w,wvv

i

j

k1

ik

240

jk

,D

G,Gmindw,w.

p

q

wiGp

wjGq

ij

由以上距离公式,可以算出距离矩阵:

a11D

ai1

其中ij38。

620190

a1j203490aij2552061355

2957459828

3576543802

2991032386



035599316160

使用Matlab进行聚类分析,得到如下结果(分析结果中的数字代表矩阵的相应列):

第1次合成,平台高度为5649时的分类结果为:5 22 第2次合成,平台高度为6328时的分类结果为:23 38 第3次合成,平台高度为6856时的分类结果为:2 13 第4次合成,平台高度为7503时的分类结果为:26 31 第5次合成,平台高度为8011时的分类结果为:6 33 第6次合成,平台高度为9948时的分类结果为:28 37 第7次合成,平台高度为10835时的分类结果为:1 36 第8次合成,平台高度为10955时的分类结果为:15 24 第9次合成,平台高度为11274时的分类结果为:3 34 第10次合成,平台高度为12842时的分类结果为:12 19 …… ……

第30次合成,平台高度为22198时的分类结果为:26 34 第31次合成,平台高度为22325时的分类结果为:26 27 第32次合成,平台高度为22379时的分类结果为:11 34 第33次合成,平台高度为23296时的分类结果为:30 35 第34次合成,平台高度为23444时的分类结果为:31 37 第35次合成,平台高度为23884时的分类结果为:26 28 第36次合成,平台高度为25181时的分类结果为:11 32 第37次合成,平台高度为26499时的分类结果为:26 37 使用Matlab统计工具箱的相关命令画出聚类图如下:

4

图1 中文碎纸片特征边聚类图

相应分类结果为: 第1类的有4 第2类的有9 第3类的有25 30

第4类的有14 17 26 31 第5类的有10 11 第6类的有18 29 第7类的有23 38 第8类的有15 24 第9类的有28 37 第10类的有5 22 第11类的有8 21 第12类的有12 19 第13类的有6 33 第14类的有16 35 第15类的有1 36 第16类的有20 27

第17类的有2 13 第18类的有7 32 第19类的有3 34 第四步,碎纸片拼接复原。

根据第三步的结果人工筛选出可以唯一组成完整图像的两条序列如下:

(1) 008(17、18)→014(29、30)→012(25、26)→015(31、32)→003(7、8)→010(21、22)→002(5、6)→016(33、34)→001(3、4);

(2) 004(9、10)→005(11、22)→009(19、20)→013(27、28)→018(37、38)→011(23、24)→007(15、16)→017(35、36)→000(1、2)→006(13、14)。

由第二步可知,起点纸片为008,终点纸片为006,可直接将两条序列链连接为一条,最终复原结果如下表:

表1 附件1中文碎纸片复原结果

运用Matlab按以上顺序重组复原图数字矩阵,得到中文复原结果见下图中文复原图:

图2 中文复原图

2.3.2 英文碎纸片复原

英文碎纸片的复原过程与中文碎纸片复原过程相似,参考中文碎纸片的复原过程,得到英文碎纸片重要过程的结果如下:

经筛选,得起点纸片为003,重点纸片为004。 Matlab进行聚类分析结果为:

第1次合成,平台高度为5671时的分类结果为:8 13

第2次合成,平台高度为6180时的分类结果为:33 36 第3次合成,平台高度为6756时的分类结果为:3 12 第4次合成,平台高度为6953时的分类结果为:6 15 第5次合成,平台高度为7007时的分类结果为:18 33 第6次合成,平台高度为7747时的分类结果为:32 37 第7次合成,平台高度为8941时的分类结果为:2 11 第8次合成,平台高度为9572时的分类结果为:4 19 第9次合成,平台高度为9898时的分类结果为:9 34 第10次合成,平台高度为10076时的分类结果为:1 24 …… ……

第30次合成,平台高度为23932时的分类结果为:3 19 第31次合成,平台高度为23955时的分类结果为:1 17 第32次合成,平台高度为24111时的分类结果为:1 28 第33次合成,平台高度为24121时的分类结果为:1 31 第34次合成,平台高度为24172时的分类结果为:1 30 第35次合成,平台高度为24264时的分类结果为:1 21 第36次合成,平台高度为24314时的分类结果为:1 13 第37次合成,平台高度为24416时的分类结果为:1 34 聚类图为:

35

4

图3 英文碎纸片特征边聚类图

分类结果为:

第1类的有5 7 10 第2类的有1 24 第3类的有3 12 第4类的有6 15 第5类的有16 31 第6类的有18 33 36 第7类的有32 37 第8类的有21 28 第9类的有25 第10类的有8 13 第11类的有20 27 第12类的有17 30 35 第13类的有23 38 第14类的有4 19

第15类的有9 34 第16类的有14 第17类的有22 第18类的有26 29 第19类的有2 11

根据分类结果人工筛选出唯一可以组成完整图像的三条序列如下: (1)003(7、8)→006(13、14);

(2)002(5、6)→007(15、16)→015(31、32)→018(37、38)→011(23、24)→000(1、2)→005(11、12)→001(3、4)→009(19、20)→013(27、28)→010(21、22);

(3)008(17、18)→012(25、26)→014(29、30)→017(35、36)→016(33、34)→004(9、10)。

由于起点纸片为003,终点纸片为004,直接将三条序列链按(1)→(2)→(3)连接为一条,最终复原结果如下表:

表5-2 附件1英文碎纸片复原结果表

再次运用Matlab按以上顺序重组复原图数字矩阵,得到英文复原结果见下图英文复原图:

图2 中文复原图:

三、 模型评价

所选问题要求对给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切)进

行拼接复原,根据所给附件了解到,所有的碎纸片规格相同,由于聚类分析即可以对样本进行分类,也可以对变量进行分类,分类的依据是样本或变量间的相近程度。由切割的性质可以得到相邻的碎纸片的公共边必然具有完全相同的特征,于是根据每一条碎纸片边缘不同的文字特征对其进行聚类分析具有合理性,只需令所分的组数等于需要重组的边数即可得到得到较理想的匹配结果。由问题一的聚类分析结果可知,聚类分析法在此处的运用效果较好。

四、 参考文献

[1]卓金武等,《MATLAB在数学建模中的应用》,北京航空航天大学出版社,2013年1月第1次印刷

[2]司守奎等,《数学建模算法与应用》,国防工业出版社,2011年8月第1版

[3]张德丰等,《Mtalab程序设计与综合应用》,清华大学出版社,2012年1月第1版

[4]姜启源等,《大学数学实验》,清华大学出版社,2005年2月第1版

[5]冯 杰等,《数学建模原理与案例》,科学出版社,2007年1月第1版

附录:

1 数据预处理程序

a=imread ('000.bmp');%将默认位置设为目标碎纸片所在的附件

b=imread ('001.bmp');

c=imread ('002.bmp');

d=imread ('003.bmp');

e=imread ('004.bmp');

f=imread ('005.bmp');

g=imread ('006.bmp');

h=imread ('007.bmp');

i=imread ('008.bmp');

j=imread ('009.bmp');

k=imread ('010.bmp');

l=imread ('011.bmp');

m=imread ('012.bmp');

n=imread ('013.bmp');

o=imread ('014.bmp');

p=imread ('015.bmp');

q=imread ('016.bmp');

r=imread ('017.bmp');

s=imread ('018.bmp');

aa=[a(:,1),a(:,72),b(:,1),b(:,72),c(:,1),c(:,72),d(:,1),d(:,72),e(:,1),e(:,

72),f(:,1),f(:,72),g(:,1),g(:,72),h(1,:),h(72,:),i(1,:),i(72,:),j(1,:),j(72,:),k(1,:),a(:,72),l(:,1),l(:,72),m(:,1),m(:,72),n(:,1),n(:,72),o(:,1),o(:,

72),p(:,1),p(:,72),q(:,1),q(:,72),r(:,1),r(:,72),s(:,1),s(:,72)];

2 聚类分析法程序

clc

Clear

A=[];

a=[A’];%a为特征边数字矩阵的转置矩阵

[m,n]=size(a);

d=zeros(m);

d=mandist(a');%mandist求矩阵行向量之间的两两绝对值距离

d=tril(d);%截取下三角

nd=nonzeros(d);

nd=union(nd,nd);

for i=1:m-1

nd_min=min(nd);

[row,col]=find(d==nd_min);tm=union(row,col);

tm=reshape(tm,1,length(tm));

fprintf('第%d次合成,平台高度为%d时的分类结果为:%s\n',i,nd_min,int2str(tm)); nd(find(nd==nd_min))=[];

if length(nd)==0

break

end

end

3 聚类图画法

clc

clear

a=[];%a为特征边数字矩阵的转置矩阵

y=pdist(a,'cityblock');

yc=squareform(y)

z=linkage(y)

[h,t]=dendrogram(z)

T=cluster(z,'maxclust',19)%数字表示所分成的组数

for i=1:19

tm=find(T==i);

tm=reshape(tm,1,length(tm));

fprintf('第%d类的有%s\n',i,int2str(tm));

end

4 复原图做法

a=imread ('000.bmp');%需将默认位置设为目标碎纸片所在的附件

b=imread ('001.bmp');

c=imread ('002.bmp');

d=imread ('003.bmp');

e=imread ('004.bmp');

f=imread ('005.bmp');

g=imread ('006.bmp');

h=imread ('007.bmp');

i=imread ('008.bmp');

j=imread ('009.bmp');

k=imread ('010.bmp');

l=imread ('011.bmp');

m=imread ('012.bmp');

n=imread ('013.bmp');

o=imread ('014.bmp');

p=imread ('015.bmp');

q=imread ('016.bmp');

r=imread ('017.bmp');

s=imread ('018.bmp');

C=[i o m p d k c q b e f j n s l h r a g];%求解英文复原图时C替换为D=[d g c h p s l b j n k i m o r q e];

imwrite(C,'ͼһ.bmp','bmp');%求解英文复原图时C替换为D,'ͼһ.bmp'为'文件名


相关文章

  • 微量硫分析仪市场前景预测及投资规划分析报告(目录)
  • 深圳中企智业投资咨询有限公司 报告属性 [报告名称] 微量硫分析仪市场前景预测及投资规划分析报告 [服务方式] 电子版(Word/PDF)+ 彩封软精装印刷版 + 正规机打发票 [交付方式] 邮件发送电子版,特快专递纸介版(2-3天送达) ...查看


  • 药物分析毕业论文题目(731个)
  • 毕业论文(设计) 题 目 学 院 学 院 专 业 学生姓名 学 号 年级 级 指导教师 毕业教务处制表 毕业 毕业二〇一五年 三月二十 日 毕业 药物分析毕业论文题目 一.论文说明 本团队长期从事论文写作与论文发表服务,擅长案例分析.编程仿 ...查看


  • 中国休闲食品行业调研报告目录
  • 中国市场调研在线 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业或投资者提供方向性 ...查看


  • 现代汉语层次分析法
  • 目 录 一.层次分析法及与层次分析法相关的几点说明············2 二.层次分析法的分析步骤······························4 三.层次分析法的原则··························· ...查看


  • 2016-2022年中国特种金属功能材料行业现状研究分析与市场前景预测报告
  • 2016-2022年中国特种金属功能材料行业现 状研究分析与市场前景预测报告 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该 ...查看


  • 中国旅游电子商务市场调查研究报告
  • 中国市场调研在线 行业市场研究属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果以报告形式呈现,通常包含以下内容: 一份专业的行业研究报告,注重指导企业或投资者了解该行业整体发展态势及经济运行状况,旨在为企业或投资者提供方向性 ...查看


  • 内容分析法的理论与实践研究_邹菲
  • 第4期2006年12月 V ol. 4N o. 4评 价 与 管 理 Evaluation &M anagement Dec. 2006 内容分析法的理论与实践研究 邹 菲 (武汉市邮电科学研究院, 武汉 430074) * 摘 要 ...查看


  • 中国激光粒度分析仪市场分析与发展趋势研究报告-灵核网
  • 中国行业研究门户 [灵动核心产业研究院] 2015-2020中国激光粒度分析仪行业运行现 状与投资分析报告 报告编号: A00031664 行业研究是进行资源整合的前提和基础,属于企业战略研究范畴,作为当前应用最为广泛的咨询服务,其研究成果 ...查看


  • 工程技术研究中心
  • 2016-2020年中国工程技术研究中心发展模式调查及投资前景研究报告 Special Statenent特别声明 本报告由华经视点独家撰写并出版发行,报告版权归华经视点所有.本报告是华经视点专家.分析师调研.统计.分析整理而得,具有独立自 ...查看


  • 2014-2019年中国全自动荧光免疫分析仪市场竞争格局与投资战略研究报告
  • ____________________________________________________________________________________________ 2014-2019年中国全自动荧光免疫分析仪市 场竞争 ...查看


热门内容