葡萄酒_数学建模.

西 安 邮 电 大 学

(理学院)

数学建模报告

葡萄酒的评价

班 学号(8位)

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒

员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

二、问题分析

这是一个关于大型数据处理和分析的问题。问题1要求我们分析两组评酒员评价结果有无显著差异。利用多元统计分析的相关知识,先对原始评分数据进行了检验,进而通过差异性检验得出两组评论结果具有显著性差异。利用SPSS 软件绘制出第一组红、白葡萄酒以及第二组红、白葡萄酒在评酒员评价结果下的评分分布直方图,得出数据基本服从正态分布,利用Q-Q 图对其进行正态性分布检验,得出有无显著性差异

关于问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。综合考虑葡萄酒质量和葡萄理化指标与葡萄质量的相关性,以品酒员的感官评价为主,葡萄理化指标为辅,采用逐步回归分析、聚类分析、判别分析的数学方法,建立了葡萄分级模型,利用此模型对酿酒红、白葡萄进行分类,得出可靠结果。

三、基本假设

1、假设品酒员给出的葡萄酒评价能够准确反映葡萄酒的质量; 2、假设附件三数据中芳香物质数据的单位不一定相同; 3、假设现有的评价体系能够准确的反映葡萄酒的质量。

四、符号说明

1、2、3、

P i , j 表示第j 号品酒员对第i 号酒样的评分;

y 表示葡萄酒各个理化指标(一级);

x 表示酿酒葡萄各个理化指标(一级);

4、S 表示品酒员对葡萄或葡萄酒的综合评分; 5、d 表示度量酿酒葡萄与分级标准的“距离”; 6、

表示葡萄或葡萄酒的芳香物质。

五.模型建立、求解与结果分析

1、问题1的求解 先进行分布检验,选择合适的检验的方式对差异性进行检验,否则进行非参数检验。评价可信程度,选用离差平方和。通过对附件1 数据的观察,可知葡萄酒样品的评价项目满分为100,葡萄酒外观、香气、口感以及平衡、整体评价等指标在其中占有一定比例。仔细观察数据可得部分数据有错误,为了减少其对结果分析的影响,我们取均值代替异常数据。

将每个表格中10个品酒员对某一种酒打分求其平均作为该酒的最终得分,绘制出频数分布图进行初步分析,再通过SPSS 软件绘制出红、白葡萄酒在两组评酒员评价结果下的评分分布直方图:(左图为样酒真实得分所得直方图和正态曲线,右图为取整后所得的直方图图)

第一组红葡萄酒:

第一组白葡萄酒

第二组红葡萄酒:

第二组白葡萄酒:

结论:通过对图像的观察分析,可以大致预科葡萄酒样品质量及其对应的数量分布呈正态分布。接下来进行数据分布的正态性检验。为了对这一预测进行更精确的验证,下面分别使用统计软件SPSS 中提供的Q-Q 图检验对数据进行正态性分布检验。 Q-Q 图检验:

第一组红葡萄酒:

第一组白葡萄酒:

由Q-Q 图得,第一组图离散情况较为一般,并不严格离散在分布线上,第二组图大量数据集中在0.5-1.0之间,虽无数据超过1.0,单集中在0.5之内的数据同样不足。于是得出结论:葡萄酒的样感官分析评价不符合正态分布,但是将数据取整之后画出直方图较之前的数据得图部分可近似认为服从正态分布。所以接下来使用非参数检验来确定是否有显著性差异。

非参数检验:秩和检验

基本步骤为:(1)建立假设:H 0:差值的总体中位数为0,H 1:差值的总体中位数部位0,检验水准为0.05; (2)算相各对值的代数差;

(3)根据差值的绝对值大小编秩;

(4)将秩次冠以正负号,计算正、负秩和;

(5)用不为“0”的对子数n 及T (任取T+或T-)查检验界值表得到P 值。 得红葡萄酒秩和检验结果:

得白葡萄酒秩和检验结果:

由上述秩和检验结果可得出,红葡萄酒和白葡萄酒的两组评价具有显著性差异。进一步我们判断这两组数据的可靠性。

我们假设P 则每一酒样的评分误ij 为第j 号评酒员对第i 号酒样的评价分数,差程度为:

2

110

ε1i =∑P ij -P i

10j =1

() i =1, 2 27

此处ε1i 为10名品酒员对第i 号酒样评价离散程度的衡量指标。

ε2j

2127

=P ij -P j j =1, 2 10 ∑27i =1

()

此处ε2j 为第j 名品酒员对1~10号酒样评价的离散程度的衡量指标。

我们认为,不同专家对同一酒样的评分差距越小时,说明该评分越是能被大

多数人接受。当一名专家对不同酒样给出的评分差异比较明显时,该评分也能被大多数人接受。综上所述我们建立可靠性指标: (1)同一样品酒的得分离散度ε1i 越小越好;

(2)同一品酒员对不同品质的酒评分离散度ε2j 越大越好。

127

ε1i

∑可得到: ε1=

27i =1

结论:第二组的样品酒的离散程度更小,第二组对样品酒一致性更高。

110

ε2=∑ε2j

10j =1

结论:第一组的品酒员分数离散度更大。

综上所述,两组在可靠评价指标上各具有一定优势。故考虑权重,我们比较查阅相关饲料得出,同一样品酒的得分离散度ε1i 越小越好这一指标所占权重较第二个条件更大,因此选取第二组数据可信度更高。 5.2问题2的求解

问题2要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,葡萄酒的质量很大程度上取决于酿酒葡萄的质量,但也与酿酒葡萄的的理化指标有关,所以这些因素都要考虑进去。

我们先对理化指标数据进行标准化处理,公式如下:x i =

'

x i -x

σx

x 为某种理化指标原始数据,σx 为该理化指标标准差。利用多元统计分析中逐

步回归的思想,把葡萄酒评分作为因变量,对应的酿酒葡萄理化指标作为自变量,将酿酒葡萄的理化指标逐个加入到函数中进行拟合,若相应的统计量是检验显著的则保留该变量,检验不显著则剔除该变量。

y 为标准化处理后的葡萄酒评分,x 1, x 2 x 30分别对应酿酒葡萄的30

种理化指标(一级),建立如下形式的函数:

y =B 0+B 1x 1+B 2x 2+ +B p x p +ε

其中B 0, B 1, B 2和B p 为待估参数,ε为残差。 由x 对

y 进行逐步回归,得出函数,再利用函数关系可获得各个酿酒葡萄样本

所酿葡萄的预期评分。接下来对各葡萄酒的得分进行聚类分析,我们采用对样本进行聚类的Q 型聚类,利用SPSS 进行聚类分析,再根据各类平均得分的高低进行分级,得出初步结果,考虑到分级的合理性,我们将红、白葡萄酒各分为四级(一级最优,四级最劣),在各级别内,对各葡萄酒样品的评分求均值得到该评级葡萄酒的基准分。结果如下: 葡萄酒的分类标准:

通过文建立酿酒葡萄理化指标和葡萄酒评分的函数关系,得到各个葡萄样本所酿

葡萄酒的预期评分,我们参考欧式空间距离的概念,利用预期评分与葡萄酒各评级基准分之间的“距离”来判断酿酒葡萄与各个等级之间的“远近关系”,进而实现对酿酒葡萄的分级公式如下:d i , j =

y (i ) -y (j ) 2,经判别,分级结果如下表:

红葡萄样本分级:

白葡萄样本分级:

六、实验心得

在这个模型的建立中用到很多的数学软件,有的我还不是很熟悉,但是它有很重要,需要用这些软件去对数据处理,计算等,还需要去绘图来对比说明。运用到数据分析与处理,要求我们熟悉掌握各种模型的建立及其求解过程。在判断第一组和第二组数据是否具有显著性差异的是时候,我们运用非参数检验得出不同结论,这时就要查阅相关资料整理各自所占权重得出最终结论。重点难点是对问题的思考分析得出最可靠的方法进行求解,因此需要我们动手实践类比查阅资料,询问老师,不断努力完成实验。

西 安 邮 电 大 学

(理学院)

数学建模报告

葡萄酒的评价

班 学号(8位)

一、问题重述

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒

员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:

1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

二、问题分析

这是一个关于大型数据处理和分析的问题。问题1要求我们分析两组评酒员评价结果有无显著差异。利用多元统计分析的相关知识,先对原始评分数据进行了检验,进而通过差异性检验得出两组评论结果具有显著性差异。利用SPSS 软件绘制出第一组红、白葡萄酒以及第二组红、白葡萄酒在评酒员评价结果下的评分分布直方图,得出数据基本服从正态分布,利用Q-Q 图对其进行正态性分布检验,得出有无显著性差异

关于问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。综合考虑葡萄酒质量和葡萄理化指标与葡萄质量的相关性,以品酒员的感官评价为主,葡萄理化指标为辅,采用逐步回归分析、聚类分析、判别分析的数学方法,建立了葡萄分级模型,利用此模型对酿酒红、白葡萄进行分类,得出可靠结果。

三、基本假设

1、假设品酒员给出的葡萄酒评价能够准确反映葡萄酒的质量; 2、假设附件三数据中芳香物质数据的单位不一定相同; 3、假设现有的评价体系能够准确的反映葡萄酒的质量。

四、符号说明

1、2、3、

P i , j 表示第j 号品酒员对第i 号酒样的评分;

y 表示葡萄酒各个理化指标(一级);

x 表示酿酒葡萄各个理化指标(一级);

4、S 表示品酒员对葡萄或葡萄酒的综合评分; 5、d 表示度量酿酒葡萄与分级标准的“距离”; 6、

表示葡萄或葡萄酒的芳香物质。

五.模型建立、求解与结果分析

1、问题1的求解 先进行分布检验,选择合适的检验的方式对差异性进行检验,否则进行非参数检验。评价可信程度,选用离差平方和。通过对附件1 数据的观察,可知葡萄酒样品的评价项目满分为100,葡萄酒外观、香气、口感以及平衡、整体评价等指标在其中占有一定比例。仔细观察数据可得部分数据有错误,为了减少其对结果分析的影响,我们取均值代替异常数据。

将每个表格中10个品酒员对某一种酒打分求其平均作为该酒的最终得分,绘制出频数分布图进行初步分析,再通过SPSS 软件绘制出红、白葡萄酒在两组评酒员评价结果下的评分分布直方图:(左图为样酒真实得分所得直方图和正态曲线,右图为取整后所得的直方图图)

第一组红葡萄酒:

第一组白葡萄酒

第二组红葡萄酒:

第二组白葡萄酒:

结论:通过对图像的观察分析,可以大致预科葡萄酒样品质量及其对应的数量分布呈正态分布。接下来进行数据分布的正态性检验。为了对这一预测进行更精确的验证,下面分别使用统计软件SPSS 中提供的Q-Q 图检验对数据进行正态性分布检验。 Q-Q 图检验:

第一组红葡萄酒:

第一组白葡萄酒:

由Q-Q 图得,第一组图离散情况较为一般,并不严格离散在分布线上,第二组图大量数据集中在0.5-1.0之间,虽无数据超过1.0,单集中在0.5之内的数据同样不足。于是得出结论:葡萄酒的样感官分析评价不符合正态分布,但是将数据取整之后画出直方图较之前的数据得图部分可近似认为服从正态分布。所以接下来使用非参数检验来确定是否有显著性差异。

非参数检验:秩和检验

基本步骤为:(1)建立假设:H 0:差值的总体中位数为0,H 1:差值的总体中位数部位0,检验水准为0.05; (2)算相各对值的代数差;

(3)根据差值的绝对值大小编秩;

(4)将秩次冠以正负号,计算正、负秩和;

(5)用不为“0”的对子数n 及T (任取T+或T-)查检验界值表得到P 值。 得红葡萄酒秩和检验结果:

得白葡萄酒秩和检验结果:

由上述秩和检验结果可得出,红葡萄酒和白葡萄酒的两组评价具有显著性差异。进一步我们判断这两组数据的可靠性。

我们假设P 则每一酒样的评分误ij 为第j 号评酒员对第i 号酒样的评价分数,差程度为:

2

110

ε1i =∑P ij -P i

10j =1

() i =1, 2 27

此处ε1i 为10名品酒员对第i 号酒样评价离散程度的衡量指标。

ε2j

2127

=P ij -P j j =1, 2 10 ∑27i =1

()

此处ε2j 为第j 名品酒员对1~10号酒样评价的离散程度的衡量指标。

我们认为,不同专家对同一酒样的评分差距越小时,说明该评分越是能被大

多数人接受。当一名专家对不同酒样给出的评分差异比较明显时,该评分也能被大多数人接受。综上所述我们建立可靠性指标: (1)同一样品酒的得分离散度ε1i 越小越好;

(2)同一品酒员对不同品质的酒评分离散度ε2j 越大越好。

127

ε1i

∑可得到: ε1=

27i =1

结论:第二组的样品酒的离散程度更小,第二组对样品酒一致性更高。

110

ε2=∑ε2j

10j =1

结论:第一组的品酒员分数离散度更大。

综上所述,两组在可靠评价指标上各具有一定优势。故考虑权重,我们比较查阅相关饲料得出,同一样品酒的得分离散度ε1i 越小越好这一指标所占权重较第二个条件更大,因此选取第二组数据可信度更高。 5.2问题2的求解

问题2要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,葡萄酒的质量很大程度上取决于酿酒葡萄的质量,但也与酿酒葡萄的的理化指标有关,所以这些因素都要考虑进去。

我们先对理化指标数据进行标准化处理,公式如下:x i =

'

x i -x

σx

x 为某种理化指标原始数据,σx 为该理化指标标准差。利用多元统计分析中逐

步回归的思想,把葡萄酒评分作为因变量,对应的酿酒葡萄理化指标作为自变量,将酿酒葡萄的理化指标逐个加入到函数中进行拟合,若相应的统计量是检验显著的则保留该变量,检验不显著则剔除该变量。

y 为标准化处理后的葡萄酒评分,x 1, x 2 x 30分别对应酿酒葡萄的30

种理化指标(一级),建立如下形式的函数:

y =B 0+B 1x 1+B 2x 2+ +B p x p +ε

其中B 0, B 1, B 2和B p 为待估参数,ε为残差。 由x 对

y 进行逐步回归,得出函数,再利用函数关系可获得各个酿酒葡萄样本

所酿葡萄的预期评分。接下来对各葡萄酒的得分进行聚类分析,我们采用对样本进行聚类的Q 型聚类,利用SPSS 进行聚类分析,再根据各类平均得分的高低进行分级,得出初步结果,考虑到分级的合理性,我们将红、白葡萄酒各分为四级(一级最优,四级最劣),在各级别内,对各葡萄酒样品的评分求均值得到该评级葡萄酒的基准分。结果如下: 葡萄酒的分类标准:

通过文建立酿酒葡萄理化指标和葡萄酒评分的函数关系,得到各个葡萄样本所酿

葡萄酒的预期评分,我们参考欧式空间距离的概念,利用预期评分与葡萄酒各评级基准分之间的“距离”来判断酿酒葡萄与各个等级之间的“远近关系”,进而实现对酿酒葡萄的分级公式如下:d i , j =

y (i ) -y (j ) 2,经判别,分级结果如下表:

红葡萄样本分级:

白葡萄样本分级:

六、实验心得

在这个模型的建立中用到很多的数学软件,有的我还不是很熟悉,但是它有很重要,需要用这些软件去对数据处理,计算等,还需要去绘图来对比说明。运用到数据分析与处理,要求我们熟悉掌握各种模型的建立及其求解过程。在判断第一组和第二组数据是否具有显著性差异的是时候,我们运用非参数检验得出不同结论,这时就要查阅相关资料整理各自所占权重得出最终结论。重点难点是对问题的思考分析得出最可靠的方法进行求解,因此需要我们动手实践类比查阅资料,询问老师,不断努力完成实验。


相关文章

  • 2012-2015数学建模国赛题目
  • (请先阅读"全国大学生数学建模竞赛论文格式规范") A 题 葡萄酒的评价 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量 ...查看


  • 数学建模葡萄酒问题二的分析
  • 一.问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会 ...查看


  • 基于改进层次分析法的葡萄酒品质评价模型
  • 基于改进层次分析法的葡萄酒品质评价模型 [摘 要]葡萄酒理化指标众多,这些理化指标是评价葡萄酒品质过程中必不可少的参考因子.本文通过几项葡萄酒理化指标的国家标准进行建立葡萄酒的评分模型,对模型所得结果与专业评酒员的评分作排序对比.一般的层次 ...查看


  • 血糖浓度论文
  • 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话.电子邮件.网上咨询等)与队外的任何人(包括指导教师)研究.讨论与赛题有关的问题. 我们知道,抄袭别人的成果是违反竞赛规 ...查看


  • l六年制青岛版三年级下册数学预习
  • 第一单元 两三位数除以一位数(二) 信息窗一 1. 朗读教材第2页---3页. 2. 读一读例题,要求能够非常流利地朗读出来.然后列出算式 (1)苹果:这次展出了8个新品种,共184箱.平均每个品种的苹果有多少箱? (2)葡萄:我们村有9个 ...查看


  • 作文:很有意思的数学
  • 数学是很有趣的,它能够开发人们的思维. 古尔古尔邦节快到了,天山南北充满了节日气氛.集镇上,车水马龙,热闹异常.店铺里.道路旁.地摊上,到处都摆满了货物,琳琅满目,应有尽有.水果商们把贮藏保鲜的苹果.葡萄.雪梨.石油.哈密瓜一并搬了出来,希 ...查看


  • 数学游戏和数学故事
  • 数学游戏 1.小雄是个不爱学习的孩子.这一天,爸爸教小雄如何写数,爸爸让小雄先看一遍书,然后再给他出题目,答对了就带他去海底世界.小雄心里在想着海底世界呢,没有看进去多少.过了一会儿,爸爸开始给小雄出题了,他让小雄写出三千零八万零五百零八. ...查看


  • 化学建模论文,经典三篇
  • (1)探讨以废铁屑为原料制备硫酸亚铁铵 一.以废铁屑为原料制备硫酸亚铁铵的实际意义 硫酸亚铁铵是一种重要的化工原料, 用途十分广泛, 在无机化学中用作合成其他化合物的原料, 是分析化学中常用的还原剂, 还是一种常见的净水剂.防腐剂, 在农业 ...查看


  • 葡萄酒质量的评价分析
  • 葡萄酒质量的评价分析 摘要 该文针对葡萄酒质量的评价问题建立了相应的数学模型,通过酿酒葡萄的好坏与所酿葡萄酒的质量的关系,利用葡萄酒和酿酒葡萄检测的理化指标,对葡萄酒的质量进行合理的评价与分析. 问题一,酒样品都是一样的,只是品酒人员不同, ...查看


热门内容