SAS方差分析(理论+程序实例)
时间:2025-07-15
时间:2025-07-15
第二十五课 方差分析
当影响观察结果的影响因素(原因变量或分组变量)的水平数大于2或原因变量的个数大于1个,一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。
一、 方差分析概述
方差分析(analysis of variance)又称变异数分析,可简记为ANOVA,主要用于检验计量资料中的两个或两个以上均值间差别显著性的方法。当欲比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方MS(mean square)。
1. 方差分析的基本思想
根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以相应部分的自由度得出各部分的均方,然后列出方差分析表算出F值,作出统计推断。
方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。方差分析表的一般形式见表25.1所示:
表25.1 方差分析表形式
表中变异来源一栏,可分为总变异(total),误差(residual),各个效应(effect)相对应的项。效应项与试验设计或统计分析的目的有关,一般有:主效应(包括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。
当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为 情况下,由F(f1,f2)临界值表查得单侧F 界限值。当F F 时,则P ,不拒绝原假设H0,说明不拒绝这个效应项的效应为0的原假设,也即这个效应项是可能对总变异没有实质影响的;如果F F ,则
P ,拒绝原假设H0,说明拒绝这个效应项的效应为0的原假设,也即这个效应项是很可能对总变异有实质影响的。
2. 方差分析的试验设计
为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。在试验设计阶段常需要作主要四个方面的考虑:
1) 研究的主要变量
方差分析的主要变量,也称响应变量或因变量(dependent variable),它是我们试验所要观察的主要指标。一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进行分析。
2) 因素和水平
试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平(level)。在每一个因素下面可以分成若干水平。例如,某工厂的原料来自四个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,四个地区便是地区这一因素的四个水平。当某个主要因素的各个水平间的主要因变量的均值呈现统计显著性时,必要时可作两两水平间的比较,称为均值间的两两比较。
3) 因素间的交互影响
多因素的试验设计,有时需要分析因素间的交互影响(interaction),2个因素间的交互影响称为一级交互影响,例如因素A与因素B的一级交互影响可记为A×B,3个因素间的交互影响称为二级交互影响,例如因素A与因素B与因素C的二级交互影响可记为A×B×C。当交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断。
二、 单因素方差分析
单因素方差分析(one factor ANOVA 或one-way ANOVA)或称为完全随机设计的方差分析(completely random design ANOVA)。试验设计时按受试对象的抽取或分组的随机程度不同可细分为以下两类:
完全随机设计——从符合条件的总体中完全随机地抽取所需数目的受试对象,再
将全部受试对象完全随机地分配到k组中去。此时,受试对象与试验因素间无直接联系。
组内完全随机设计——按试验因素的k个水平将全部受试对象划分成k个子总体,
再分别从k个子总体中完全随机地抽取所需数目的受试对象。此时,试验因素的各水平决定了受试对象各自应该归属的组别。
设因素A有k个水平A1,A2, ,Ak,在每一个水平下考察的指标可以看成一个总体,现有k个水平,故有k个总体,并假定:
① 每一总体均服从正态分布;
② 每一总体的方差相同;
③ 从每一总体中抽取的样本相互独立。
我们要比较各个总体的均值是否一致,就是要检验各总体的均值是否相同,设第i个总体的均值为 i,那么就是要检验如下原假设:
H0: 1 2 k
其备选假设为:
H1: 1, 2, , k不全相同。
设从第i个总体获得容量为ni的样本观察值为yi1,yi2, ,yini,i 1,2, ,k,各样本间