应用统计学因子分析与主成分分析案例解析+SPSS操作分析
时间:2026-01-20
时间:2026-01-20
因子分析与主成分分析
摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。
关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件 引言:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。 基本步骤:在SPSS中进行因子分析的步骤如下:
选择“分析---降维---因子分析”,在弹出的对话框里
(1)描述---系数、KMO与Bartlett的球形度检验
(2)抽取---碎石图、未旋转的因子解
(3)旋转---最大方差法、旋转解、载荷图
(4)得分---保存为变量、显示因子得分系数矩阵
(5)选项---按大小排序
点击确定得到如下各图
图3-1
图3-2
KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量。
Bartlett 的球形度检
验 近似卡方 df
Sig.
图36成-份矩阵a成份 1 固定资产投 GDP 工业资总值 产品商格指数 居价消费民平水 货物周量 职转工均工资平 居民费价格指消 提数方取 法:主份。成a. 提已了 取3 个份成。. 911.884 82. 2-621. .66 04.86.4 5 -65.0 1 .1236. 835.4 29. 95 -65.96. 377-.7 2 .5527 3 21.3 .120 2.01.433 27. -.2779 .62 379.4图37-旋成转矩阵a份成 份1G PD 业工产总值固定 产资投 货资周物量 转工平职工均资 居消费水平 居民民费价格消指 商数品格价数 指9.5 5.944 .728.7 15 04.8. 291-. 153-. 1042 1.42.1 90 .315- .057. 952 .481- 0.13 .49- 3 6.1-3 -1014. .1-3 7.192- .1-21 -20.9. 99 .6819
提取方法
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 5 次迭代后收敛。
图3-9
(2)因子模型中各统计量的意义
A)因子载荷:因子载荷为第i个变量在第j个因子上的载荷,实际上就是与的相关系数,表示变量依赖因子的程度,反应了第i个变量对于第j个因子的重要性。
B)变量的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为,公式为:
= (j=1,2,….,k)
表示全部公因子对变量的总方差所做出的贡献,也即是变量的信息能够被k个公因子所描述的程度。
C)公因子的方差贡献率:在因子载荷矩阵A中,各列元素的平方和记为,表示第j个公因子对于X所提供方差的总和,它是衡量公因子相对重要性的指标。方差贡献率越大,表明公因子对X的贡献越大。
(3)基本分析结果
A)KMO和球形Bartlett检验用于因子分析的适用性检验。KMO检验变量间的偏相关是否较小,Bartlett球形检验是判断相关矩阵是否是单位阵,参见图3-2。
由Bartlett检验可以看出,应拒绝个变量独立的假设,即变量间具有较强的相关性,但是KMO的统计量为0.620,小于0.7,说明个变量间信息的重叠程度可能不是特别的高,有可能做出的因子分析模型不是很完善,但还是值得尝试的。
B)变量共同度Communalities是表示各变量中所含原始信息能被提取的公因子所表示的程度,由图3-3所示的变量共同度可知:几乎所有变量的共同度都在80%以上,因此提取出的这几个公因子对各变量的解释能力是较强的。
C)碎石图用于显示各因子的重要程度,横轴为因子序号,纵轴表示特征根大小,从中可以非常直观的了解到哪些是最主要的因子,参见图3-5。本例中可见前三个因子的散点位于陡坡之上,而后五个因子散点成了平台,且特征根均小于1,因此至多考虑前三个公因子即可。
D)图3-4给出的是各成分的方差贡献率和累计贡献率,以及进行因子旋转后的方差贡献率和累计贡献率,前者将在主成分分析中进行说明。
E)图3-6为因子载荷矩阵,在前面已经直接按列的方向将其解释为个成分的系数,实际上严格讲因子载荷矩阵应该是各因子在各变量上的载荷,即是各因子对各变量的影响度。表示如下:
ZX1=0.884F1+0.385F2+0.120F3+
ZX2=0.606F1-0.596F2-0.277F3+
.
.
ZX8=0.822F1+0.429F2-0.210F3+ 在表达式中各变量已经不是原始变量,而是标准化变量。表示特殊因子,
是除了这3个公因子之外影响该变量的其他因素。原来设计了8个指标来表示经济发展水平,但是经过因子分析后,只需要三个因子即可描述影响地区经济发展状况。
F)为了使因子载荷矩阵中系数更加 …… 此处隐藏:2168字,全部文档内容请下载后查看。喜欢就下载吧 ……
上一篇:无脊椎动物学测试答案