关于多元线性回归的毕业论文(5)
时间:2025-07-08
时间:2025-07-08
多元线性回归
2 多元线性回归分析基础
2.1多元线性回归定义
在客观世界中普遍存在着变量之间的关系。变量之间的关系一般来说可分为确定性的与非确定性的两种。确定性关系是指变量之间的关系可以用函数关系来表达的。另一种非确定性的即所谓的相关关系。例如人的身高与体重之间存在着关系,一般来说,人高一些,体重也要重一些,但同样高度的人,体重往往不相同。人的血压与年龄之间也存在着关系,但同年龄的人的血压往往不相同。气象中的温度与湿度之间的关系也是这样的。这是因为我们涉及的变量(如体重、血压、适度)是随机变量,上面所说的变量关系是非确定性的。此时 ,便可以用到回归分析。回归分析能帮助我们从一个变量取得的值去估计另一个变量所取的值。
在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。
在研究问题是,我们考虑一个变量受其他变量的影响时,把这变量称为因变量,记为Y,其他变量称为自变量,记为X,这时相关系数可记作
Y f x , 其中f x 为当X x时,因变量Y的均值,即
f x E Y|X x
.
称f x 为Y对X的回归函数, 为Y与f x 的偏差,它是随机变量,并假定E 0。 回归函数可以是一元函数,也可以是多元函数,即
Y f(x1,x2, ,xm) ,
其中 f(x1,x2, ,xm) E(Y|X1 x1,X2 x2, ,Xm xm)为m元回归函数,统称为多元回归函数。
2.2多元线性回归模型
2.2.1 模型的建立及矩阵表示 多元线性回归模型的一般形式是: Y 0 1Z1 2Z
2
Z3
3
Z4 Z5 5 4
(2.1)
j 1,2,...,k)其中 (是回归系数,Y是被解释变量,z1i,z2i ,zki是k个对Y有显j
著影响的解释变量(k 2), i是 反映各种误差扰动综合影响的随机项,下标i表示第i期观察值(Yi,z1i,z2i ,zki), i 1,2, n。
假设多元样本回归函数为:Yi 0 1z1i 2z2i kzki回归残差为: i Yi Yi。