关于多元线性回归的毕业论文(10)
时间:2025-07-08
时间:2025-07-08
多元线性回归
式(2.9)两边同除以SST ,得:
SSRSST
SSESST
1
(2.10)
显而易见,各个样本观测点与样本回归直线靠的越近,SSR在SST 中所占的比重就
SSRSST
越大。(2.10)式中的正是反映解释变量(或回归直线)对被解释变量决定程度的
指标,我们称它为“决定系数”(determined coefficient),通常用R2表示。计算公式为:
R2
2.4.2 决定系数的性质及修正可决系数
决定系数是对回归模型拟合程度的综合度量,决定系数越大,模型拟合程度越高。决定系数越小,则模型对样本的拟合程度越差。决定系数R2具有如下性质:
(1) 决定系数R2具有非负性。
由决定系数的定义式可知,R2的分子分母均是不可能为负值的平方和,因此其比 值必大于零。
(2) 判定系数的取值范围为0 R2 1。
由R2的计算公式可以看出:当所有的观测值都位于回归直线上时,SSR=0,这时
2
R=1,说明总离差可以完全由所估计的样本回归直线来解释;当观测值并不是全部位
SSRSST
1
SSESST
.
于回归直线上时, SST>0,则SSR/SST>0,这时R2<1;当回归直线没有解释任何离差,即模型中解释变量Y与因变量Y完全无关时,Y的总离差全部归于残差平方和,即
SSR=SST ,这时R2=0。
(3) 判定系数是样本观测值的函数,它也是一个统计量。
判定系数R2的大小受到自变量X的个数k的影响。可以证明,增加自变量X的个数,回归平方和增大,从而使得R2增大。由于增加自变量个数引起的R2增大与拟合好坏无关,在含自变量个数k 不同的模型之间比较拟合程度时,R2就不是一个合适的指标,必须加以调整。
调整方法为:把残差平方和与总离差平方和之比的分子分母分别除以各自的自由度,变成均方差之比,以剔除自变量个数对拟合优度的影响。调整的判定系数为: R2 1-n-1n-K-1
(1-R) 1-2
n-1n-K-1
ε
*
ii
i
2i
2
(Y-Y)
(2.11)