2012年电子科技大学中山学院优秀论文 葡萄酒等级划分体系模型的探究 摘 要 针对目前葡萄酒评价体系不完善的现状本文对葡萄酒评价体系作出探究。 对于问题一运用单因素方差分析法利用Matlab软件以Anoval函数求解。求出p-value显著性水平取0.05作为标准来判断那组有显著性以及通过比较方差来判断那组数据更加可信。 对于问题二在问题一中得到第二组评分更可信因此根据该组的评分进行分级通过用Matlab软件的Corrcoef和Regress函数对该组成分进行相关性验证和用EXCEL画出图表进行分析找出影响葡萄酒分级的成分然后在酿酒葡萄数据中找出与影响葡萄酒分级相同的成分再结合葡萄酒评分对葡萄样品进行分级得出葡萄样品成分的排列结合成分的量和葡萄酒分级得出影响酿酒葡萄分级成分的范围。 对于问题三通过问题二的解答可以知道葡萄酒和酿酒葡萄的划分级别利用附件二的资料对每一种理化指标的数据根据对应的含量建立模型运用matlab软件拟合数据作出拟合线性图并采用多元回归分析法进行回归分析最后根据拟合线性图和回归系数来分析两类理化指标之间的关系。 对于问题四分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。结合题目给出芬香物质的数据对感官指标和理化指标进行综合分析用MABTLE拟合感官指标和理化指标的数据得出结论需要结合葡萄酒的理化指标和感官指标对葡萄酒的质量进行综合评价。关键字方差分析法 分级 理化指标 线性相关 回归分析 一、问题的重述 随着我国经济的快速发展葡萄酒市场竞争也异常激烈和无序“三精一水”、假年份、假产地酒、假酒庄影响消费者的健康虽然我国的GB15037-2006《葡萄酒》国家标准对葡萄酒的质量作了规定但由于相应规范的制定工作限制我国关于葡萄酒质量等级分划的标准还未完善国家迫切需要制定统一的质量等级制度。 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分然后求和得到其总分从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量文章给出了某一年份一些葡萄酒的评价结果及该年份这些葡萄酒的和酿酒葡萄的成分数据。本文尝试解决以下问题 问题一 由于评酒师对葡萄酒的评分存在主观性需对评酒师的分数进行客观分析分析两组评酒员的评价结果有无显著性差异哪一组结果更可信 问题二葡萄酒的质量离不开原料酿酒葡萄的质量所以酿酒葡萄的理化指标至关重要。需根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 问题三酿酒葡萄与葡萄酒的理化指标之间的联系可能影响着葡萄酒质量所以需建立模型酿酒葡萄与葡萄酒的理化指标之间的联系。 问题四分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量能否综合感官指标和理化指标建立模型来评价葡萄酒的质量是问题关键所在。 二、模型假设 1.品酒员打分相互之间没有影响 2.品酒员对样品的给的总分是他对该样品所有方面评分的总和并且该样品的最终得分可认为是10位品酒员打分的平均值 3.题目所给的数据真实可靠 4.酿酒方式及酿酒过程对葡萄酒的质量没有影响 5.不同种类葡萄酒的成份数据值统一标准没有差异 6.所有样品的酿造过程相同。 三、符号说明 n 测试数量 r 测试水平量 A 因素SS 各类数据源的平方和 Df 各类数据相应的自由度 MS 各类的均方值 F 统计量 P 大于F的概率 AS 各组均值对总方差的偏差平方和 ES 各组数据对均值偏差平方和的总和 . 四、问题分析 问题一的分析 我们要根据附件1的数据可知评酒员对红酒27组样品和白酒28组样品进行评分每件样品都进行了两次评分即是有两组评分数据题目要求分析两组评酒员的评分结果有无显著性差异以及那一组数据更加可信对于显著性的判断我们采用单因素方差分析法Analysis Of Variance。对于每件样品评酒员对外观香气口感及其整体评价进行打分每一组的每件样品都有十名品酒员进行评分故求每个品酒员对样品酒的总分之后求出这十名品酒员给的总分的平均分此平均分就是该样品的总分葡萄酒分为白酒和红酒我们对第一组的红酒和第二组的红酒进行方差分析法运用matlab软件中的anova1函数可得出p-value及F值通过分析就可知道那组更加具有显著性。方差是考察数据的波动性的方差小就说明数据比较稳定方差大就是波动性比较大 故通过比较两组数据的方差大小就知道那一组数据更加可信。 问题二的分析 根据问题一可知第二组的评酒员的评酒分数更可靠所以选择第二组葡萄酒的数据进行处理。从评酒员对葡萄酒评分的分数入手用逆向思维反推葡萄的等级。首先将第一问中第二组的白葡萄酒和红葡萄酒的每一种样品的评分进行分等级依次分为四个等级,然后用EXCEL将每个等级的样品酒的理化指标画成曲线图忽略异常数据点观察各等级间的理化指标有没有相关性如果有相关性找出影响葡萄酒质量的相关因素跟酿酒葡萄的理化指标数据进行对照得出酿酒葡萄的分级依据。 问题三的分析结合葡萄酒和酿酒葡萄的理化指标作出每两个理化指标间的直观趋势图观察两者之间的大体关系根据曲线拟合的方法得出两者间的函数关系。 问题四的分析 由第三问求解可得出酿酒葡萄与葡萄酒的理化指标之间是呈线性相关的因此我们要证明酿酒葡萄和葡萄酒的理化指标对葡萄酒质量是有影响的只需证明酿酒葡萄的理化指标对葡萄酒质量是有影响。在综合附录3给出的芬香物质用MABTLE拟合出理化指标和感官指标的关系图呈相关性所以要综合葡萄酒的理化指标和感官指标一起来评价葡萄酒的质量。 五、模型建立与求解 5.1问题一的模型建立和求解 对于两组评酒员的评价结果有无显著性差异我们采用单因素方差分析法去解决。 单因素方差分析法: 只考虑一个因素A 对所关心的指标的影响A 取几个水平在每个水平上作若干个试验试验过程中除A 外其它影响指标的因素都保持不变只有随机因素存在),我们的任务是从试验结果推断因素A 对指标有无显著影响即当A 取不同水平时指标有无显著差别。A 取某个水平下的指标视为随机变量,判断A 取不同水平时指标有无显著差别相当于检验若干总体的均值是否相等。 设 A取n 个水平nAAAA,...,,321,在水平iA下总体ix 服从正态分步N(iu,2),i=1,...,n,这里u,2未知iu可以互不相同但假定ix有相同的方差又设在每个水平iA下作了in次独立试验即从中抽取容量为in的样本记作,,...,1,jijnjxijx服从N(iu,2)i=1,…,n,j=1,…, in且且相互独立。将这些数据列成表1单因素试验数据表的形式。 表5.1 单因素试验数据表 分值 第一组红酒 第二组红酒 第一组白酒 第二组白酒 A1 X12 X21 X12 X21 A2 X21 X22 X21 X22 ..... A3 X31 X32 X31 X32 根据上述理论首先我们对数据进行处理附件1里有四组数据红葡萄酒和白葡萄酒各有两组数据每种酒都有两组人进行对其进行评分每件样品酒有十名品酒员号打分采用单因素方差分析法我们将样品酒的总分作为唯一考虑的因素A运用matlab软件编程求出品酒员对每组样品打的总分的平均分.