多元统计分析报告
时间:2025-07-14
时间:2025-07-14
自己写的多元统计分析的报告,使用了聚类,主成分,因子分析方法,使用的软件有spss和matlab
聚类分析、主成分分析、因子分析的应用
一、选题背景
此题选自2012年的全国大学生数据建模竞赛的A题,其中涉及多元统计分析中的多种分析方法,在这里我使用通过使用显著性检验,聚类分析、主成分分析和因子分析将计算的过程展现出来。因为处理数据的角度不同,所以分析的结果有可能和获奖的优秀论文中的结果有所差异,如果有不正确的地方,还望老师指点。因为数据量比较大,在这里不在列出,使用的数据通过http://www.77cn.com.cn/problem/2012/2012.html网站可以下载。
我曾参加过2012年的全国大学生数学建模竞赛,但是我们那时并没有深入的学习多元统计学方面的知识,当时做的时候只把前两问使用显著性分析和使用主成分分析进行了一些处理,通过上统计分析的课觉得这个题完全可以使用所学的知识解决,因此本文通过参考一些优秀的论文将这个题的整个过程详细的实现了一遍。使用的分析工具有EXCLE2007, SPSS17.0中文版和MATLAB2013.a。具体的题目如下:
确定葡萄酒质量时一般是通过聘请有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、分析过程
1.问题一
自己写的多元统计分析的报告,使用了聚类,主成分,因子分析方法,使用的软件有spss和matlab
表1(两种葡萄酒的得分情况)
使用表1中得出的平均值,利用SPSS中的Kendall和调系数检验法对这两组评委的打分进行一致性检验,这里之所以选择Kendall和调系数检验法,随让一致性检验有多种方法,但是不同的方法使用范围是有限制的,而此方法正是用来检验多个评分者给分的一致性程度。
Kendall和调系数检验法原理
和谐系数的计算公式:
若评分中出现相同等级,则需要计算校正的系数,其公式为:
SPSS操作步骤
打开SPSS并导入处理之后的结果,选择菜单栏中的“分析”—>“非参数检验”—>“K个相关样本”—>“选择检验的数据”。
分析结果 使用SPSS中Kendall检验进行评分的一致性检验的结果如表(2)所示:表(2)中红葡萄酒的和谐系数Kendall为0.128,白葡萄酒的和谐系数Kendall为0.396,由此可知两组评委给
自己写的多元统计分析的报告,使用了聚类,主成分,因子分析方法,使用的软件有spss和matlab
因为两组评委打分的不一致性,因此可以进一步的运用可靠性分析,得到两组评酒员的评价结果的可靠度。 Cronbach’sα系数法是一种内在信度的检验方法,用以衡量组成量表题项的内在一致性程度如何。通常 <0.35是表示其信度为低信度,0.35< <0.70为时表示为中信度,0.70< 时表示信度为高信度。
Cronbach’sα系数
操作步骤:
打开SPSS并导入处理之后的结果,选择菜单栏中的“分析”—>“度量”—>“可靠性分析”—>“选择Cronbach’sα系数法”
表(3)可靠性统计量
通过使用 Cronbach’s可信度检验的结果可知,第一组的α系数为0.393,基于标准化项的α系数为0.577,第二组的α系数为0.566,基于标准化项的α系数为0.577,虽然两组的内部可行度并不高,但是第二组的评分结果的可信度比第一组的高。因此应该以第二组的评分结果为准。
2.问题二
首先对附表2中的数据进行处理,同样利用EXCLE对其中有多组测量数据的测量值求平均值,之后利用MATLAB中的系统聚类方法,根据酿酒葡萄的理化指标与葡萄酒中对应的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,其中葡萄酒的质量为第二组评委给葡萄酒的打分。
由于酿酒葡萄的理化指标有一级指标和二级指标之分,通过在第三问中的主成分分析中分别对一级指标单独进行主成分分析和对一、二级指标一起进行主成分分析的结果进行对比可知,二级指标的影响并不大,因此在这里给出的聚类结果为使用一级指标进行聚类的结果,其中红葡萄酒的酿酒葡萄的聚类结果如图(1)所示,白葡萄酒的酿酒葡萄的聚类结果如图(2)所示,酿酒葡萄的分级结果如表(4)所示。
自己写的多元统计分析的报告,使用了聚类,主成分,因子分析方法,使用的软件有spss和matlab
图(1)红葡萄的分级结果
图(2)白葡萄的分级结果
自己写的多元统计分析的报告,使用了聚类,主成分,因子分析方法,使用的软件有spss和matlab
使用白葡萄中与红葡 …… 此处隐藏:2528字,全部文档内容请下载后查看。喜欢就下载吧 ……