第3章 回归分析预测方法
发布时间:2024-11-25
发布时间:2024-11-25
管理预测方法
l e c t u r e
FORECASTING METHODS FOR MANAGEMENT
管理预测方法主讲:上海财经大学 邵建利博士
© 2012 by Shao Jianli
管理预测方法
l e c t u r e
3
REGRESSION ANALYSIS PREDICTION METHOD
回归分析预测法
© 2012 by Shao Jianli
管理预测方法
3.1 引言1.回归分析的提出 回归分析起源于生物学研究,是由英国生 物学家兼统计学家高尔登(Francis Galton 1822-1911)在19世纪末叶研究遗 传学特性时首先提出来的。 高尔登在1889年发表的著作《自然的遗传 》中,提出了回归分析方法以后,很快就 应用到经济领域中来,而且这一名词也一 直为生物学和统计学所沿用。 回归的现代涵义与过去大不相同。一般说 来,回归是研究因变量随自变量变化的关 系形式的分析方法。其目的在于根据已知 自变量来估计和预测因变量的总平均值。
(Francis Galton 1822-1911)© 2012 by Shao Jianli3
管理预测方法
2.回归分析和相关分析(1)函数关系 函数关系反映客观事物之间存在着严格的依存关 系。在这种关系中,当一个或几个变量取值一定时 ,另一个变量有确定的值与之相对应,并且这种关 系可以用一个确定的数学表达式反映出来。 一般把作为影响因素的变量称为自变量,把发生 对应变化的变量称为因变量。
© 2012 by Shao Jianli
管理预测方法
3.1 引 言(2)相关关系相关关系反映的是客观事物之间的非严格、不确定的线 性依存关系。这种线性依存关系有两个显著的特点: ①客观事物之间在数量上确实存在一定的内在联系。表现 在一个变量发生数量上的变化,要影响另一个变量也相应地 发生数量上的变化。 ②客观事物之间的数量依存关系不是确定的,具有一定的 随机性。表现在当一个或几个相互联系的变量取一定数值时 ,与之对应的另一个变量可以取若干个不同的数值。这种关 系虽然不确定,但因变量总是遵循一定规律围绕这些数值的 平均数上下波动。
© 2012 by Shao Jianli
管理预测方法
3.1 引言(3)回归分析与相关分析的关系相关分析是以相关关系为对象,研究两个或两个以上随机变量之 间线性依存关系的紧密程度。通常用相关系数表示,多元相关时 用复相关系数表示。 回归分析是对具有相关关系的变量之间的数量变化规律进行测定 ,研究某一随机变量(因变量)与其他一个或几个普通变量(自 变量)之间的数量变动关系,并据此对因变量进行估计和预测的 分析方法。由回归分析求出的关系式,称为回归模型 回归分析与相关分析的联系是,它们是研究客观事物之间相互依 存关系的两个不可分割的方面。在实际工作中,一般先进行相关 分析,由相关系数的大小决定是否需要进行回归分析。在相关分 析的基础上建立回归模型,
以便进行推算、预测,同时相关系数 还是检验回归分析效果的标准。相关分析需要回归分析来表明客 观事物数量关系的具体形式,而回归分析则应建立在相关分析的 基础上。© 2012 by Shao Jianli
管理预测方法
3.1 引言3.回归模型的种类根据自变量的多少,回归模型可以分为一元回归模型 和多元回归模型。 根据回归模型的形式线性与否,回归模型可以分为线 性回归模型和非线性回归模型。 根据回归模型所含的变量是否有虚拟变量,回归模型 可以分为普通回归模型和带虚拟变量的回归模型。 此外,根据回归模型是否用滞后的因变量作自变量, 回归模型又可分为无自回归现象的回归模型和自回归 模型。
© 2012 by Shao Jianli
管理预测方法
3.2 一元线性回归预测法1. 一元回归模型设 x 为自变量,y 为因变量,y 与 x 之间存在某种线性关系,即一元线性回归模型为:
y a bx u式中,x 代表影响因素,我们往往认为它是可以控制或预先给定的,故称之为自变 量;u 表示“非主要因素”的影响、随机变化、观测误差和模型数学形式设定偏差 等各种因素对 y 的影响的总和,通常称为随机扰动项;因变量 y 就是我们的预测对 象;常数 a, b 是待定的参数。 给定(x,y)的 n 对观测值(xi,yi) i 1,2, , n ,代入上式得 ,
yi a bxi ui
,i
1,2, , n
其中 ui, i 1,2, , n 为 u 的 n 个观测值。© 2012 by Shao Jianli8
管理预测方法
3.2 一元线性回归预测法 2. OLS (Ordinary Least Square)估计(1)OLS 的中心思想 最小二乘法的中心思想,是为观测值( xi , yi ) i 1,2,...,n )配 ( 合一条较为理想的回归直线。这条回归直线应满足下列两点要求: (1) 原观测值与模型估计值的离差平方和为最小; (2) 原观测值与模型估计值的离差总和为 0。这两点 可以用公式表示如下:
i ) 2 min ( yi y ( y y ) 0i i
© 2012 by Shao Jianli
管理预测方法
2. OLS (Ordinary Least Square)估计回归参数的估计值为:b
n xi yi xi yii 1
n
n
n
n xi2 ( xi ) 2i 1 i 1
n
i 1 n
i 1
a
yi 1
n
i
n
b
xi 1
n
i
n
y bx
1 n 1 n x xi y yi 其中: n i 1 n i 1 ,
© 2012 by Shao Jianli
管理预测方法
2. OLS (Ordinary Least Square)估计 2. OLS的特性 最小二乘估计量 a, b 具有 线性、无偏性和最小方差性 等良好的性质。线性、无偏 性和最小方差性统称BLUE性 质。满足BLUE性质的估计量 a, b 称为BLUE估计量。
© 2012 by Shao Jianli
管理预测方法
3.2 一元线性回归预测法 3. 回归方程的检验 在一元线性回归模型中最常用 的显著性检验方法有:–相关系数检验法 –F检验法 –t检验
法
© 2012 by Shao Jianli
管理预测方法
3.33.3.1
回归方程的检验
离差平方和的分解与可决系数
在一元线性回归模型中,观测值的数值会发生波动, 这种波动称为变差。变差产生的原因如下: ①受自变量变动的影响,即x取值不同时的影响; ②受其他因素(包括观测和实验中产生的误差) 的影响。为了分析这两方面的影响,需要对总变差进 行分解。
© 2012 by Shao Jianli
管理预测方法
3.3
回归方程的检验
(1) 离差平方和的分解 Lyy ( yi y)2 [( yi yi ) ( yi y)]2 ( yi yi ) 2 ( yi y) 2 2 ( yi yi )( yi y)
即
( yi y) 2 ( yi yi ) 2 ( yi y) 2 或记为
L
yy
Q Q1
2
即 总变差=剩余变差+回归变差
© 2012 by Shao Jianli
管理预测方法
3.3(2) 可决系数 R2
回归方程的检验
R2
回归变差 Q 2 L yy 总变差
R2
( yi y ) 2
( yi y )2
2
1
( yi y ) 2
( yi y ) 2
显然 0 R
1
。
© 2012 by Shao Jianli
管理预测方法
3.3
回归方程的检验
3. 3.2 相关系数检验法 相关系数 相关系数有两种定义方法: (1) 根据总变差定义,
R
( yi y ) 2
( yi y )
2
1
( yi y ) 2
( yi y ) 2
(2)根据积差法定义,R
( x x )( y y ) ( x x ) ( y y)i i 2 i i
2
因此根据平均数的数学性质可将其简化为: n xi yi xi yi R n xi2 ( xi ) 2 n yi2 ( yi ) 2© 2012 by Shao Jianli16
上一篇:06 吊装作业安全管理标准
下一篇:大一上学期高数知识点