第10章 回归分析

发布时间:2024-10-08

《excel统计分析典型实例》

第10章 回归分析 回归和相关已成为统计学中最基本的概念之一, 其分析方法已是标准的、常用的统计工具之一。 从狭义上看,相关分析的任务主要是评判现象之 间的相关程度高低以及相关的方向,而回归分析 则是在相关分析的基础上进一步借用数学方程将 那种显著存在的相关关系表示出来,从而使这种 被揭示出的关系具体化并可运用于实践中去,如 果从广义的角度去理解相关和回归,此时回归分 析就包含着相关分析。本章就着重讲述狭义的相 关分析方法以及其结果的检验。

《excel统计分析典型实例》

10.1 一元线性回归分析 对具有相关关系的两个变量进行统计分析的方法叫做回归 分析。通俗地讲,回归分析是寻找相关关系中非确定性关 系的某种确定性。 回归分析最基本的分类就是一元回归和多元回归,前者是 指两个变量之间的回归分析,如收入与意愿支出之间的关 系;后者则是指3个或3个以上变量之间的关系,如消费支 出与收入及商品价格之间的关系等。 进一步,一元回归还可细分为线性回归和非线性回归两种, 前者是指两个相关变量之间的关系可以通过数学中的线性 组合来描述,后者则没有这种特征,即两个相关变量之间 的关系不能通过数学中的线性组合来描述,而表现为某种 曲线模型。 本节会重点讲述最基本的一元线性回归分析在Excel中的实 现和操作方法,并对其结果的假设检验过程进行叙述。

《excel统计分析典型实例》

10.1.1 基础知识 从历史上看,“回归”概念的提出是要早于“相关”的,生物统 计学家高尔顿在研究豌豆和人体的身高遗传规律时,首先提出 “回归”的思想。1887年,他第一次将“回复”(Reversion)作 为统计概念使用,后改为“回归”(Regression)一词。1888年 他又引入“相关”(Correlation)的概念。原来,他在研究人类 身高的遗传时发现,不管祖先的身高是高还是低,成年后代的身 高总有向一般人口的平均身高回归的倾向。通俗地讲就是,高个 子父母,其子女一般不像他们那样高,而矮个子父母,其子女一 般也不像他们那样矮,这种关系可以认为是一种简单的线性相关 关系。 线性相关关系的一般表达模型如下:

《excel统计分析典型实例》

10.1.2 逐步计算法回归过程示例 进行回归分析的主体部分就是要计算a和b,在Excel中,可以通过3种方法 实现,从本小节起的3小节中会一一结合介绍。 逐步计算法就是通过上一小节得到的公式,逐个计算公式中的各个统计量, 最终求解出a和b的计算结果。 在某建材工地做混凝土抗压强度实验室中,考察每立方米中混凝土的水泥 用量(kg)对混凝土抗压强度(kg/)的影响,测得数据如图10.1所示,利用 逐步计算

法分析两者间相关关系的具体方法如下:

《excel统计分析典型实例》

10.1.3 散点图法 在数据较多,且要求快速得出回归分析结果时,可以使用 此方法。同样以某建材工地做混凝土抗压强度实验为例, 考察每立方米中混凝土的水泥用量(kg)对混凝土抗压强度 (kg/)的影响,其具体的操作方法如下:

《excel统计分析典型实例》

10.1.4 利用回归分析工具求解 在Excel中,还提供了比较系统地进行回归分析的工具,可以将整个回归 内容完整地展现,并给出详尽的统计结果,可以对回归分析进行必要和完 整的假设检验。本小节继续以某建材工地做混凝土抗压强度实验为例,考 察每立方米中混凝土的水泥用量(kg)对混凝土抗压强度(kg/)的影响,其 具体的操作方法如下:

《excel统计分析典型实例》

10.1.5 结果详解 Excel的回归分析工具计算简便,但内容丰富,其输出结果主要有回归统 计表、方差分析表、回归参数表、残差统计表和概率输出表5个模块,并 有相应的图表与之相配合,本小节就会对这5个模块逐一进行详细叙述。 1.回归统计表回归统计表包括以下5部分内容。 2.方差分析表 方差分析表的主要作用是通过F检验来判断回归模型的回归效果,表格内 各个统计量的计算可以参照方差分析中的计算方法实现。 3.回归参数表 在回归参数表中,可以读出一元线性回归分析所需要的参数a和b,即其他 统计量,每个统计量的具体解释方法如下: 4.残差统计表 残差统计表对应RESIDUAL OUTPUT部分,是回归分析设置时选中残差选项 对应的结果部分,有观测值、预测抗压强度、残差和标准残差四项表格输 出部分,还有残差图和线性拟合图两个图表输出, 5.概率输出表 概率输出表对应结果中的PROBABILITY OUTPUT部分,工作表区中有两列数 据,并有相应的柱形图配合解释结果,下面对这些内容进行一一介绍。

《excel统计分析典型实例》

10.2 一元线性回归的假设检验 一元线性回归的假设检验,需要对拟合的效果、 求解的参数等进行假设检验,包括对R平方的拟合 优度检验、t检验、F检验、DW检验等方法,下面 将一一叙述其具体方法,同时也可以根据本章的 假设检验过程来了解回归分析检验的大体思想。

《excel统计分析典型实例》

10.2.1 拟合优度检验 拟合优度检验主要用于检验拟合模型的线性关系 的显著性程度,是针对相关系数进行的检验,在 相关分析中已经有详细地介绍,此处不再赘述。

《excel统计分析典型实例》

10.2.2 标准误差检验 模型的拟合优度决定了预测精度,而标准误差就是用于检验回归 模型预测精度的指标。标准误差由因变量的观测值和计算值定义, 同时考虑到样本大小和变量数目的影响。标准误差的计算公式在 第4章已经介绍,从公式中可以看出,标准误差

是基于回归模型预 测值与实际值的平均误差总和的统计平均结果。误差平方和越小, 模型的精度也就越高。由于误差值会受到量纲的影响,因此,可 以引入变异系数的概念,其具体公式如下

《excel统计分析典型实例》

10.2.3 t检验 t检验在线性回归分析中是用来检验回归系数a、b是否具有统计意义,即 检验参数a、b在设定的假设检验水平α下是否为零。因为a为截距,检验 的意义不大,但b值如果在显著性水平α下为零,则方程就会变为常数的 等式,这暗示自变量与因变量没有因果关系,因而回归分析也就失去了意 义。所以,回归分析主要是针对斜率b进行t检验。 同时,对于一元线性回归分析而言,根据公式:

《excel统计分析典型实例》

10.2.4 F检验 F检验是总体相关显著性检验,主要用于检验自变量与因变量之间的线性统计关系是 否可以接受。F 检验也是基于因变量的观测值、计算值和平均值定义的,同时考虑样 本大小和自变量数目的影响。简而言之,F的计算公式为回归平方和与剩余平方和在 “惩罚”了自由度之后的比值,因此,回归平方和越大越好,剩余平方和越小越好, 因此二者的比值越大越好,从而F统计量也就越大越好。 在一元线性回归分析分析中,有:

《excel统计分析典型实例》

10.2.5 DW检验 DW检验即Durbin-Watson检验,又叫残差序列相关检验,是 一种适用于小样本的检验方法,DW检验只能用于检验随机 误差项具有一阶自回归形式的序列相关问题,其中的序列 相关是同一变量前后之间的相关关系。 DW的检验方法如下所示。

《excel统计分析典型实例》

10.2.6 有效回归检验 在回归分析中,进行分析时可能会遇到数据之间没有回归关系, 但通过计算恰好得出了线性回归模型的情况,这种回归本成为虚 假回归,为了检验回归的有效性,可以对数据系列中因变量的变 化率随自变量变化的响应程度进行分析,用公式表达即为:

《excel统计分析典型实例》

10.3 一元非线性回归分析 尽管线性模型的应用简便,但是线性模型在现实 中是较少出现的,大量的模型都表现为非线性模 型。之所以在回归分析中强调线性模型,是因为 其有处理非线性模型的价值。在实际工作中,有 许多简单而又实用的非线性模型,这些模型都可 以通过简单的数学变换转换为线性关系,从而利 用最小二乘技术进行回归运算,求解后还可以再 转换成非线性模型,在本节中,会对多种非线性 模型的线性转变及其回归分析进行详细介绍。

《excel统计分析典型实例》

10.3.1 常用非线性模型 比较常见的有指数模型、对数模型、幂指数模型、双曲线模型、抛物线模 型、正态分布模型等,本小节中会逐一说明其具体形式。

第10章 回归分析.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219