线性回归分析

时间:2025-04-02

§ 8.3 线性回归分析 一、回归分析原理 回归分析实际上就是建立某种数学模型并做检验。假定: 一列(或多列)数据的变化同另一列数据的变化呈某种函数关 系,衡量数据联系强度的指标,并通过指标检验其符合的程度, 就称为回归分析。

回归分析包括:一元回归、多元回归以及线性回归和非线 性回归: 一元回归:Y(因变量)取值:y1 y2 y3… X(自变量)取值:x1 x2 x3 … 建立一元线性回归方程: Y=BX+C(方程中的 B 为回归系 数,C为常数) 或者是非线性回归方程:Y=f(X)

多元回归:Y(因变量)取值: y1 y2 y3… X1(自变量1)取值: x11 x12 x13 … X2(自变量2)取值: x21 x22 x23 … ……

Xn(自变量n)取值: xn1 xn2 xn3 …

建立多元线性回归方程:Y=B1X1+B2X2…+ BnXn + B0(方 程中的Bi为回归系数) 或者是非线性回归方程:Y=f(X1 X2…Xn)

二、回归分析的概念 假定测量数据为: 因变量 自变量1 自变量2 … 自变量n y1 x11 x21 … xn1 y2 x12 x22 … xn2 … … … ym x1m x2m … xnm 建立因变量与自变量的关系,回归方程: Y=B1X1+B2X2 …+ B0 纳入前:

y j xij 0 j

εj为随机因素影响,即残差。

纳入后:

Y j Bxij B02 ( Y y ) j j j 1

要求组内离差平方和 最小。 m

纳入方程的自变量应满足: ①自变量的作用显著 X的变化应引起Y的显著变化。从而需要对回归方程做F 检验: m 2 组间离差平方和: S R (Y j y )

j 1

组内离差平方和:

S E (Y j y j )j 1

m

2

总离差平方和:

ST SR SER

回归均方差(组间方差): M

2 ( Y y ) j j 1

m

n2 ( Y y ) j j j 1 m

残差均方差(组内方差):

ME

m n 1

计算F值,

MR F ME

由F值查表,得到P。讨论显著度水平: <=α 自变量作用显著 P >α 自变量作用不显著

将未进入方程的某自变量 Xi与 Y做方差分析,各水平均值 差异显著,满足: F > 3.84 或P<= 0.05 则该Xi可以进入回归方程。而已进入回归方程的Xi与回归 后的Y如果出现: F < 2.71 , P> 0.1 则该Xi 必须从回归方程中剔除。 ②方程中回归系数的作用显著 对已进入方程的变量的回归系数做 T检验,该检验的零假 设是Bi=0,即回归系数可以忽略,备择假设是Bi不为零。T值 的计算为: B

T

i

通过查表可以得到P(即:Sig T)。 若P> 0.1的Xi须可以考虑首先从回归方程中剔除。 其中: Bi为偏回归系数 SEBi为偏回归系数的标准误

SEBi

③欲进入方程的自变量应当与已进入的自变量相关程度 足够低。 引进描述相关程度的量:容忍度Tolerance,即变量之间 的相关系数的显著度水平。若: Tolerance > 0.0001 表明欲进入方程的自变量与其它自变量的相关程

度低, 即:xi 与xj相关程度低,则xi可以进入回归方程。

三、自变量纳入回归方程的方式 SPSS for Win8.0系统提供的自变量纳入方程的方式有五种, 分别为: ①强行介入法Enter(一次性进入) 这是一种不检验F和Tolerance,一次将全部自变量无条件 地纳入回归方程。 ②强行剔除Remove(一次性剔除) 指定某些变量不能进入方程。这种方法通常同别的方法联 合使用,而不能首先或单独使用,因为第一次使用或单独使用 将意味着没有哪个变量进入方程。 ③逐步进入Stepwise 每次选择符合进入条件的自变量进入方程,进入后立即检 验,不合格者剔除,直到全部合格自变量进入方程。 ④反向剔除Backward 先强行介入,再逐个剔除不合格变量,直到全合格。 ⑤正向进入Forward 每次选择符合进入条件的自变量进入方程,逐个选择,逐 个进入,直到全部合格自变量进入方程。

四、操作步骤 ⒈回归分析命令菜单 执行:[Statistics][Regression] [Linear] 选择因变量到:“Dependent”因变量框内 选择若干个自变量移动到:“Independent(s)”自变量框内。 ⒉回归方法 “Method”下拉菜单提供了五种回归方法供选择: 强行介入法Enter 正向进入Forward 反向剔除Backward 逐步进入Stepwise 强行剔除Remove

“Block 1 of n” 可以将回归步骤分为若干组块。在指定了 一组因变量和自变量后,可以用“Next”按钮再建立另一个组 块,以便再次指定一组因变量和自变量。在建立了若干组块以 后,执行回归分析命令,将能够逐一组块地进行分析。 例如:在研究“小麦产量”时,收集了“土壤成分”、 “农家肥料”、“化肥”、“灌溉”以及“种谷物的产量”等 数据。假定:“小麦产量”为因变量。要求在回归方程中先以 “土壤成分”、“化肥”和“种谷物的产量”为自变量,然后 剔除“种谷物的产量”,再将其它自变量根据系统的计算来确 定是否纳入方程。因此 可以分成三个组块来完成: ①在第一组块Block 1中使用强行介入法Enter,选“土壤 成分”、“化肥”和“种谷物的产量”为自变量。单击“Next” 按钮。 ②在第二组块Block 2中使用强行剔除Remove,选择“种 谷物的产量”。 再单击“Next”按钮。 ③在第三组块Block 3中使用正向进入Forward,选择其它 自变量。 在最后结果中,“土壤成分”、“化肥” 将成为自变量 无条件进入方程,而“种谷物的产量”将不出现在方程中,其

“Selection Variable”为指定抽样变量以及抽样规则。 例如:以年份year为抽样变量,并指定抽样规则为 1985年 以后的样本,则可以指定“Selection Variable” 为year。 在定 …… 此处隐藏:3454字,全部文档内容请下载后查看。喜欢就下载吧 ……

线性回归分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219