回归分析的基本思想及其初步应用(H)

时间:2025-04-02

回归分析的基本思想及其初步应用(H)

1.1 回归分析的基本思想 及其初步应用

回归分析的基本思想及其初步应用(H)

温故知新不相关 两个变量的关系 函数关系 相关关系 非线性相关 函数关系中的两个变量间是一种确定性关系。 函数关系中的两个变量间是一种确定性关系。 相关关系是一种非确定性关系。 相关关系是一种非确定性关系。 线性相关

回归分析的基本思想及其初步应用(H)

例1、某大学中随机选取8名女大学生,其身高 某大学中随机选取8名女大学生, 和体重数据如下表所示. 和体重数据如下表所示.编号 体重/kg 体重/kg 1 48 2 57 3 50 4 54 5 64 6 61 7 43 8 59 身高/cm 身高/cm 165 165 157 170 175 165 155 170

求根据女大学生的身高预报体重的回归方程, 求根据女大学生的身高预报体重的回归方程, 并预报一名身高为172cm的女大学生的体重 的女大学生的体重. 并预报一名身高为 的女大学生的体重

回归分析的基本思想及其初步应用(H)

解:1、选取身高为自变量 ,体重为因变量 ,作散点图: 、选取身高为自变量x,体重为因变量y,作散点图:

2、由散点图知道身高和体重有比较好的线性相关关系, 、由散点图知道身高和体重有比较好的线性相关关系, 因此可以用线性回归方程刻画它们之间的关系。 因此可以用线性回归方程刻画它们之间的关系。

回归分析的基本思想及其初步应用(H)

样本点呈条状分布,身高和体重有较好的线性相关关 样本点呈条状分布, 因此可以用回归方程来近似的刻画它们之间的关系. 系,因此可以用回归方程来近似的刻画它们之间的关系. (x,y)称 (x,y)称为

$ $ 就是未知参数a和 的最好估计 心 根据最小二乘法估计a 和b 就是未知参数 和b的最好估计, 样的最好估计, 本点的中n n ∑(xi - x)(yi - y) ∑ xiyi - nxy 探究P4: 探究 : i=1 b = i=1 n = n = 0.849, 的女大学生的体重一定是 于是有 身高为172cm的女大学生的体重一定是 身高为 的女大学生的体重一定是60.316kg吗? 吗 2 2 2 ∑(xi - x) ∑ xi - nx 如果不是,你能解析一下原因吗? 如果不是,你能解析一下原因吗? i=1 i=1 a = y - bx = -85.712

y 所以回归方程是 $ = 0.849 x 85.712所以,对于身高为 的女大学生, 所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为 的女大学生

$ = 0.849 ×172 85.712 = 60.316(kg ) y

回归分析的基本思想及其初步应用(H)

解:散点图: 散点图:

思考P3 思考产生随机误差项e 产生随机误差项 的原因是什么? 的原因是什么?

3、从散点图还看到,样本点散布在某一条直线的附 、从散点图还看到, 线性回归模型来表示: 来表示 我们可以用下面的线性回归模型来表示: 而不是在一条直线上, 近,而不是在一条直线上,所以不能用一次函数 y=bx+a+e,其中a和b为模型的未知参数, y=bx+a+e,其中a 为模型的未知参数, y=bx+a简单描述它们关系。 简单描述它们关系

。 简单描述它们关系 e称为随机误差。 称为随机误差。

回归分析的基本思想及其初步应用(H)

思考P3 思考 产生随机误差项e的原因是什么 的原因是什么? 产生随机误差项 的原因是什么?随机误差e的来源(可以推广到一般): 随机误差e的来源(可以推广到一般): 1、其它因素的影响:影响体重 y 的因素不只是身高 、其它因素的影响: x,可能还包括遗传基因、饮食习惯、生长环境等 ,可能还包括遗传基因、饮食习惯、 因素; 因素; 2、身高 x的观测误差。 的观测误差。 、 的观测误差

回归分析的基本思想及其初步应用(H)

线性回归模型y=bx+a+e增加了随机误差项e,因 线性回归模型y=bx+a+e增加了随机误差项e y=bx+a+e增加了随机误差项 变量y的值由自变量x和随机误差项e共同确定, 变量y的值由自变量x和随机误差项e共同确定,即自 变量x只能解析部分y的变化。 变量x只能解析部分y的变化。 在统计中,我们也把自变量x称为解析变量, 在统计中,我们也把自变量x称为解析变量,因变 解析变量 预报变量。 量y为预报变量。

回归分析的基本思想及其初步应用(H)

残差数据点和它在回归直线上相应位置的差异 称为相应于点( 残差。 称为相应于点(xi,yi ) 的残差。

$ e i = yi $ i y

例:编号为6的女大学生,计算随机误差的效应(残差) 编号为6的女大学生,计算随机误差的效应(残差)

61 (0.849 × 165 85.712) = 6.627残差平方和把每一个残差所得的值平方后加起来, 把每一个残差所得的值平方后加起来,用数学符号表 n 示为: 示为: ( yi $ i ) 2 y ∑i =1

称为残差平方和 称为残差平方和 在例1 在例1中,残差平方和约为128.361。 残差平方和约为128.361。 128.361

回归分析的基本思想及其初步应用(H)

残差分析与残差图的定义: 残差分析与残差图的定义:$ $ $ 来判断模型拟合的效果, 我们可以通过残差 e1 , e 2 ,L , e n 来判断模型拟合的效果,判断原始 数据中是否存在可疑数据,这方面的分析工作称为残差分析。 数据中是否存在可疑数据,这方面的分析工作称为残差分析。表1-4列出了女大学生身高和体重的原始数据以及相应的残差数据。 列出了女大学生身高和体重的原始数据以及相应的残差数据。 列出了女大 …… 此处隐藏:2781字,全部文档内容请下载后查看。喜欢就下载吧 ……

回归分析的基本思想及其初步应用(H).doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219