数学建模葡萄酒问题二的分析(6)
时间:2025-07-13
时间:2025-07-13
数学建模葡萄酒问题二的分析
5.3.1问题三模型的建立及求解
为了研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指标定义为Y,把酿酒葡萄的理化指标定义为X,
先利用相关性分析,可以分别算出每一个Y关于所有X的相关系数矩阵。取出其中相关系数大于0.35的X,在利用多元线性回归,分别算出每一个Y关于相关系数大于0.35的X的R2,及各X的系数与置信区间。根据R2的值把Y分成三类:A类为R2大于0.8。B类为R2介于0.5到0.8之间C类为R2小于0.5.
对于A类如果置信区间包含0,则把相应的变量踢除。根据这些新的变量,从新做一次线性回归如果R2的值与剔除变量之前相差不大,就取剔除变量之后的变量。若相差较大则取没有剔除变量的那些X来表示Y。
对于B类可直接得出Y关于X的线性方程, 对于C类, 模型的建立与求解:
问题二的模型
葡萄酒的理化指标分为一级指标和二级指标。由于二级指标都在一级指标中进行反应,剔除二级指标。对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共30个指标。由于指标太多,并且多指标之间往往存在着一定程度的相关性。为了把指标复杂的关系进行简化,对理化指标做主成分分析。
由于理化指标中的指标不同,其计量单位不同,所以数据量纲也不一致。因此,在进行主成分分析前,先对数据进行量纲化处理。统计学原理告诉我们,要对多组不同量纲数据进行比较,可以先将它们标准化转化成无量纲的标准化数据。而综合评价就是要将多组不同的数据进行综合,因而可以借助于标准化方法来消除数据量纲的影响。
无量纲标准化法:
上一篇:房屋拆除施工方案
下一篇:英语定语从句用法精讲