葡萄酒的评价_大学生数学建模大赛国家二等奖论文(编辑修改稿)内容摘要:

图 34标准化变量的典型变量的系数 从图 33可以看出在仅考虑白葡萄 14个理化指标的情况下,典型相关系数不再是 1,比较符合实际情况。 图 34指出了来自红葡萄指标的第一典型变量 WGPC1为: * * * * * *1 2 3 8 1 2 1 41 0 . 3 4 9 6 * 0 . 6 5 4 4 * 0 . 3 7 4 5 * 0 . 3 3 2 9 * 0 . 7 1 9 3 * 0 . 3 0 3 7 *。 W G P C x x x x x x     (12) 来自红葡萄酒的第一典型指标变量 WWPC1 为: * * * *1 2 3 71 0 . 5 6 7 0 * 0 . 5 7 4 9 * 0 . 6 0 4 4 * 0 . 6 4 8 3 *。 W W P C y y y y    (13) 关于第二典型变量有: * * * * * * *2 6 9 1 0 1 1 1 3 1 42 0 . 3 7 2 0 * 0 . 4 9 1 0 * 0 . 6 8 8 3 * 0 . 3 3 4 1 * 0 . 3 4 1 3 * 0 . 5 8 0 3 * 0 . 3 5 5 4 *。 W G P C x x x x x x x      (14) 18 * * * * *3 5 6 7 82 0 . 4 8 8 4 * 0 . 3 0 9 5 * 0 . 4 9 0 6 * 0 . 3 0 7 7 * 0 . 6 0 0 4 *。 W W P C y y y y y    (15) 问题 四 模型的建立与求解 我们根据问题三经过典型相关性分析得到的葡萄理化指标来讨论 酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 建立多元线性回归模型, 并 通过MATLAB 对所得的模型进行残差分析和数据拟合,通过数据拟合图来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,然后用残差图进行检验。 ( 1)、考虑红葡萄 和 红 葡萄酒的理化指标对 红 葡萄酒质量的影响。 首先通过 MATLAB 工具对红葡萄 12 个 理化指标数据,红葡萄酒 9 个理化指标的数据和红葡萄酒质量的相关数据进行回归分析 检验(程序和结果见附录 16)。 根据结果可以得到红葡萄理化指标,红葡萄酒理化指标及红葡萄酒质量之间的回归模型为: 1 2 3 4 5 6 77 2 .4 9 3 2 0 .0 0 0 5 * 0 .0 0 1 5 * 0 .4 0 8 8 0 .1 2 1 5 * 0 .3 4 5 0 * 0 .2 8 5 2 * 0 .0 2 6 1 *Z X X X X X X X       8 9 1 0 1 1 1 2 1 3 1 40 . 0 6 5 1 * 4 . 0 4 5 1 * 1 0 . 5 0 6 4 * 0 . 2 3 2 4 * 0 . 1 4 0 7 * 0 . 0 0 3 7 * 1 . 5 8 1 7 *X X X X X X X       1 5 1 6 1 7 1 8 1 9 2 0 2 11 .7 8 3 1 * 0 .0 6 3 3 * 0 .5 5 7 1 * 3 .2 6 8 5 * 0 .0 1 5 7 * 0 .1 2 5 7 * 0 .3 1 3 4 *。 X X X X X X X       (16) 用 MATLAB 将红葡萄酒实际质量数据和模型所得到的数据进行数据拟合 (程序见附录 17)所得拟合图如图 35 所示: 图 35 红葡萄酒质量实 际与模型数据拟合图 从图 37 可以看出,红葡萄酒质量实际数据与模型数据拟合度较高,所以可知, 用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是可行的, 所建多元线性回归模型成立。 下面用残差图(图 36)来检验模型,从图中可以看出,存在两个差异点,可忽略不计,说明所建的多元线性回归模型是比较合理,完善的。 19 图 36残差分析图 ( 2)、 考虑白葡萄 和 白 葡萄酒的理化指标对 白 葡萄酒质量的影响。 首先通过 MATLAB 工具对白葡萄 14 理化指标数据,白葡萄酒 9个理化指标的数据和白葡萄酒质量的相关数据进行回归分析与检验(程序和结果见 附录 18)。 根据结果可以得到红葡萄理化指标,红葡萄酒理化指标及红葡萄酒质量之间的回归模型为: 1 2 3 4 5 6 72 8 6 8 .6 3 1 6 0 .0 0 0 9 * 0 .0 3 8 7 * 4 .3 6 5 5 * 1 .8 5 8 9 * 0 .0 1 5 3 * 0 .0 0 5 2 * 8 .7 6 4 6 *Z X X X X X X X       8 9 1 0 1 1 1 2 1 3 1 4 1 50 . 2 9 4 3 * 0 . 0 4 7 8 * 0 . 7 8 2 2 * 0 . 0 3 2 8 * 2 . 2 7 5 4 * 0 . 0 0 7 5 * 0 . 6 1 4 2 * 3 . 9 1 5 *X X X X X X X X        1 6 1 7 1 8 1 9 2 0 2 1 2 20. 15 00 * 1. 83 33 * 1. 17 75 * 12 0. 92 04 * 27 .3 36 * 26 . 68 7 * 9. 31 85 *X X X X X X X       ; (17) 用 MATLAB 将白葡萄酒实际质量数据和模型所得到的数据进行数据拟合,得到的拟合图如图 39(程序见附录 19): 图 37 葡萄酒质量实际数据和模型数据拟合图 从图 37 看出,红葡萄酒质量实际数据与模型数据拟合度较高,所以可知,用葡萄和葡萄酒 的理化指标来评价葡萄酒的质量是可行的, 所建多元线性回归模型成立。 20 下面用残差图(图 38)来检验模型,从图中可以看出,存在三个差异点,可忽略不计,说明所建的多元线性回归模型是比较合理,完善的。 图 38 残差分析图 ( 3) 由于葡萄和葡萄酒中都含有芳香物质,而葡萄酒质量的评定指标中有香气分析,因此接着我们继续考虑芳香物质和香气之间的关系,进一步论证芳香物质与葡萄酒质量之间的联系。 用 SAS 软件先对酿酒红葡萄评分中的香气分析进行归一化处理,接着与芳香物质含量总和进行相关分析(程序见附录 20),得到结果如下 图所示(见图 39,40) 图 39 图 40 结果分析:由图 39 可以看出,香气分析的三个指标与芳香物质含量总和的线性关系不明显;由图 40 可以得到,香气分析的三个指标与芳香物质含量总和的相关性不明显。 说明芳香物质不影响红葡萄酒质量,可以用红葡萄和红葡萄酒的理化指标来评价葡萄酒的质量。 用 SAS 软件先对酿酒白葡萄评分中的香气分析进行归一化处理,接着与芳香物质含量总和进行相关分析(程序见附录 21),得到结果如下图所示(见图 41,42) 21 图 41 图 42 结果分析:由图 41 可以看出,香气分析的三个指标与芳香物质含量总和的线性关系不明显;由图 42 可以得到,香气分析的三个指标与芳香物质含量总和的相关性不明显。 说明芳香物质不影响白葡萄酒质量,可以用白葡萄和白葡萄酒的理化指标来评价葡萄酒的质量。 六、 模型评价 求解问题一时运用了数据的归一化方法,从而避免因每个分数的最高分不一致而直接使用数据造成较大误差的现象,接着还对归一化后的数据进行正态性检验,如果 服从正态分布就作参数检验,否则就做非参数检验,如不先进行正态性检验而随便作参数检验或者非参数检验,这样会产生很大误差,所以我们就先作正态性检验,大大减少了人为误差。 求解问题二时运用了主成分分析,将这么多的理化指标缩减为与酿酒葡萄好坏有较大关系的理化指标,从而更加准确地对酿酒葡萄进行分级;另外还用了WARD 法系统聚类分析,画出谱系聚类图,能够更好地看出酿酒葡萄的分类级别。 求解问题三时运用了典型相关分析的思想来解决酿酒葡萄与葡萄酒的理化指标之间的联系,典型相关分析利用综合变量对之间的相关关系 来反映两组指标之间的整体相关性的多元统计分析方法,所以更能反映酿酒葡萄与葡萄酒的理化指标之间的联系。 在求解问题一时,数据的归一化过程是把十组品酒员的评分加起来后再求平均值,可能会造成很大的误差; 在求解问题三、问题四时,没有对二级指标进行分析,可能会对酿酒葡萄与葡萄酒的理化指标之间的联系产生一定的影响。 七、 参考文献 [1] 汪远征 徐静雅, SAS 软件与统计应用教程,北京,机械工业出版社, 2020 [2] 张志涌 杨祖樱, MATLAB 教程,北京,北京航空航天大学出版社, 2020 [3] 新浪博 客,判断酿酒葡萄品质的五大指标性物质, 2020 [4] 网,第 5 章 SAS 非参数检验,22 2020 年 9月 8日 [5] 道客巴巴, 8 SAS 中聚类分析 [ 统 计 学 经 典 ] , 2020 年 9 月 8 日 [6] 百度文库, SAS 讲义 第 三 十 七 讲 典 型 相 关 性 分 析 , 2020 年 9 月9日 [7]姜启源,谢金星,叶俊,数学模型(第三版),高等教育出版社, 2020 年 8月第 3版 八、 附录 附录 1( SAS 软件):对原始数据的归一化处理过程 data a。 set aa。 c1=a1b1。 c2=a2b2。 c3=a3b3。 c4=a4b4。 c5=a5b5。 c6=a6b6。 c7=a7b7。 c8=a8b8。 c9=a9b9。 c10=a10b10。 keep c1 c2 c3 c4 c5 c6 c7 c8 c9 c10。 run。 data q w e r t y u i o p。 set qw。 select (F1)。 when (39。 139。 ) output q。 when (39。 239。 ) output w。 when (39。 339。 ) output e。 when (39。 439。 ) output r。 when (39。 539。 ) output t。 when (39。 639。 ) output y。 when (39。 739。 ) output u。 when (39。 839。 ) output i。 when (39。 939。 ) output o。 when (39。 1039。 ) output p。 otherwise put F1=39。 wrong39。 end。 run。 data qq。 set q。 C1=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C1=C1/50。 keep C1。 run。 data ww。 set w。 C2=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C2=C2/100。 keep C2。 run。 data ee。 set e。 C3=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C3=C3/60。 keep C3。 run。 data rr。 set r。 C4=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C4=C4/80。 keep C4。 run。 data tt。 set t。 C5=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C5=C5/ keep C5。 run。 data yy。 23 set y。 C6=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C6=C6/60。 keep C6。 run。 data uu。 set u。 C7=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C7=C7/80。 keep C7。 run。 data ii。 set i。 C8=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C8=C8/80。 keep C8。 run。 data oo。 set o。 C9=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C9=C9/220。 keep C9。 run。 data pp。 set p。 C10=c1+c2+c3+c4+c5+c6+c7+c8+c9+c10。 C10=C10/110。 keep C10。 run。 附录 2( SAS 软件):对原始数据进行正态性检验 proc univariate data=AS normal。 var c1。 histogram c1。 probplot c1。 run。 附录 3( SAS 软件):对原始数据进行配对两样本的非参数检验 proc univariate DATA=ASD。 Var c1。 RUN。 附录 4( SAS 软件) :对处理后的数据(红葡萄酒得分)进行归一化处理 data q w e r t y u i o p。 set cc。 select (F1)。 when (39。 139。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。