第九章 双变量回归与相关
发布时间:2024-11-12
发布时间:2024-11-12
第九章 两变量回归
与相关
主要目的:对两个随机变量间 的关系作量化研究
第一节
直线回归
一、直线回归的概念 直线回归研究的是双变量的数量关 系,有两种情况: (1)一个变量是选定变量; 另一变量是随机变量。 (2)两个变量都是随机的。
回归关系
描述变量间的依存关系
首先,在直角坐标系中绘制散点图,观 察是否有直线趋势,但并不是要求所有的点 都在一条直线上。
回归方程与线性函数的区别:线性函数要求变量间有严格的函数 关系──一一对应。
Y · · · · · ·
P ·Y Y Y Y · · · ·Y
·
Y Y
X
Y a bX条件:Y正态分布
(9-1)
二、直线回归方程的求法( 最小二乘法原理( Y i Y i) 达最小):b l lXY XX
2
( X X )(Y Y ) (X X )2
(9-3)
a Y bX
(9-4)
l
XY
XY
( X )( Y ) n(9-5)
例 9-1 某地方病研究所调查了 8 名正 常儿童的尿肌酐含量 (mmol/24h) 如表 9-1。 估计尿肌酐含量(Y)对其年龄(X)的回 归方程。表 9-1 8 名正常儿童的年龄 X(岁)与尿肌酐含量 Y (mmol/24h)
编 号 X Y
1
2
3
4
5
6
7
8
13 11 9 6 8 10 12 7 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
X X / n 76 / 8 9.5
Y Y / n 23.87 / 8 2.9838
l
XX
764 76 / 8 422
Y 1.6617 0.1392 X
lYY=72.2683-23.872/8=1.0462 lXY=232.61-76×23.87/8=5.8450 b=5.8450/42=0.1392,a=2.9838-0.1392×0.95 =1.6617
三、直线回归中的统计推断
(一)假设检验1.方差分析 2
Y Y (Y Y ) (Y Y ) (Y Y ) Y Y Y Y 2 2
SS 总=SS 回+SS 残
(9-6)
H0:β=0, H1:β≠0,α=0.05 SS 回= l XY / l XX =5.8452/42=0.8134 表 9-2变异来源2
例 9-1 的方差分析表 df 7 1 6 SS MS F P 1.0462 0.8136 0.8134 20.97 <0.01 0.2328 0.0388
总变异 回归 残差
2.
t 检验Y X
S
0.2328 0.1970 n 2 8 2残
ss
S S lb
Y X XX
0.1970 0.0304 42
t=b/Sb=0.1392/0.0304=4.579 t 0.005/2,6=4.317<4.579<5.208=t 0.002/2,6 0.002<P<0.005,…
(二) β的可信区间 b±tα/2,υSb=0.1392±2.447×0.0304 =(0.0648,0.2136) (三) 估计和预测
Y X 0 Y 0 的区间估计 1.
SY S 0
Y X
(X 0 X ) 1 n
2
X X2
2
(9-14)
1 (12 9.5) 0.1970 0.1031 8 42
Y 0 t / 2, S
Y0
(9-15)
Y
1.6617 0.1392 12 3.33210
3.3321±2.447×0.1031=(3.080,3.584)
2.
个体 Y 值的预测区间Y X
SY S0
1 1 n
( X 0 X ) (X X )2
2
2
,(9-16)
1 (12 9.5) 0.1970 1 0.2223 8 42
Y
0
t / 2, S
Y0
(9-17)
3.3321±2.447×0.1031=(2.788,3.876)
第二
节
直 线 相 关
一、直线相关概念
主要目的:对两个随机变量间的关
系作量化研究
适用于双变量正态分布变量线性相关(linear correlation )
简单相关(simple correlation)
相关系数r表示两个变量间直线相关关系的方向与 密切程度。
线性相关的性质可由散点图来直观地说明。