2012—第6章虚拟变量回归模型2

时间:2025-07-12

第6章 虚拟变量回归模型

Essentials of Econometrics

第6章 虚拟变量回归模型.

本章主要内容 6.1 虚拟变量的性质

6.2 ANCOVA模型:包含一个定量变量、一个两分定性变量的回归 6.3 包含一个定量变量、一多分定性变量的回归 6.4 包含一个定量变量和多个定性变量的回归 6.5 比较两个回归

6.6 虚拟变量在季节分析中的应用

10-2

6.1 虚拟变量的性质虚拟变量的基本含义 许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等

但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾害 对GDP的影响,季节对某些产品(如冷饮)销售 的影响等等 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”10-3

6.1 虚拟变量的性质这种“量化”通常是通过引入“虚拟变量”来完成的。 根据这些因素的属性类型,构造只取“0”或“1”的人工 变量,通常称为虚拟变量(dummy variables),记为D。 例如,反映文程度的虚拟变量可取为:

1,本科文化 Di 0,非本科文化一般地,在虚拟变量的设置中: 基础类型取值为0(不具备某种性质); 比较类型取值为1(具备某种性质)。10-4

6.1 虚拟变量的性质 虚拟变量模型的类型

根据加入的途径,可以将虚拟变量模型分成两种类型: ——加法类型:用虚拟变量表示不同截距的回归,即虚 拟变量只可以改变回归方程的截距,是加法类型。 ——乘法类型:用虚拟变量表示不同斜率的回归,即虚 拟变量影响到回归方程的斜率变化,是乘法类型。

10-5

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型

方差分析模型(analysis-of-variance models, ANOVA)

差别截距系数(differential intercept coefficient)

10-6

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型

概念:回归模型只含有定性变量或虚拟变量的模型称 为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。

10-7

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型以加法方式引入虚拟变量时,分为四种情形: 情形一:解释变量只有一个分为两种相互排斥类型的定性 变量而无定量变量的方差分析模型(见6.1节)

一个以性别为虚拟变量考察个体消费者每年的食品支出的模型:

Yi B1 B2 Di ui 1,女性 Di 0,男性其中:Yi为每年食品支出(美元), Di=1,若是女性,Di=0,若是男性。10-8

(6-1)

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型 男性食品

支出的期望:

E(Yi / Di 0) B1 B2 (0) B1 女性食品支出的期望:

E(Yi / Di 1) B1 B2 (1) B1 B2它表示了两类截距值的差异。10-9

B2 称为差别截距系数(differential intercept coefficient),

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型

10-10

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型表 6-2 食品支出与税后收入和性别的关系

10-11

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型例 6-1食品支出与性别虚拟变量回归结果(男性为基准类)

Yi 3176.833 503.1667 Di

se 233.0446 329.5749 p 0.000 0.1578

t 13.63187 1.526714 r 2 0.189010-12

其中:Yi为每年食品支出 (美元), Di=1 , 若是女 性 ,Di=0, 若 是男性。

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型虚拟变量的设置原则 例 6-1食品支出与性别虚拟变量回归结果(女性为基准类)

Yi 2673.667 503.1667 Di

se 233.0446 329.5749 p 0.000 0.1578

t 11.47277 1.526714 r 2 0.1890

10-13

其中:Yi为每年食品支出 (美元), Di=1,若是男性,Di=0,若 是女性。

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型虚拟变量的设置原则

(1)虚拟变量的赋值是任意的。在这个例子中,令D=0,代 表女性;D=1,代表女性;当然,赋值可根据习惯而定。 (2)赋值为0的一类常称为基准类 (base),对比类(bench mark),控制类(control)或者遗漏类(omitted category)等等。 因此,在模型中男性就是基准类。 (3)虚拟变量D的系数称为差别截距系数(differential intercept coefficient),因为它表明了取值为1类的截距值与 基准类截距值的差距。

10-14

6.1 虚拟变量的性质:用虚拟变量表示不同截距的 回归----加法类型虚拟变量的设置原则 (4)虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定性变量的类 别数少1,即如果有m个定性变量,只在模型中引入m-1个 虚拟变量。 在这个例子中,性别有两类,因而在模型中仅引进一个 虚拟变量。如果不遵循这个规则,就会陷入虚拟变量陷阱 (dummy variable trap),也即完全多重共线性(perfect multicollinerarity)情形。

1,女性 Di 0,男性10-15

6.2 ANCOVA模型: 包含一个定量变量,一个两分定性变量的回归模型 回归模型中既包括定量解释变量,又包括定性解释变量, 我们把这种回归模型称为协方差分析模型( ANCOVA )。 ANCOVA模型能够反映定量解释变量(称为控制变量或 协变量)的控制

效果。

10-16

…… 此处隐藏:526字,全部文档内容请下载后查看。喜欢就下载吧 ……
2012—第6章虚拟变量回归模型2.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219