stata关于面板数据说明

时间:2025-02-21

stata软件中关于面板数据的介绍

Chp8 Panel Data

一直想把看Panel模型时的感悟整理成笔记,但终因懒惰而未能成行。今天终于下决心开了个头,可遗憾的是,这个开头却是从本章的结尾写起,因为这一部分最容易写。不过,凡事有了好的开头基本上也算成功一半了,所以后面的整理工作还要有劳各位的督促。文中的不足还望不吝指出。

8.1 简介 8.2 一般模型

8.2.1 固定效应模型(Fixed Effect Model) 8.2.2 随机效应模型(Random Effect Model) 8.3 自相关性 8.4 动态Panel Data 8.5 门槛Panel Data

8.6 非稳定Panel Data及协整 8.7 Panel VAR 8.8 Stata8.0实现

在介绍了Panel Data的基本理论后,下面我们介绍如何使用STATA8.0软件包来实现模型的估计。前面我们已经提到,Panel Data具有如下数据存储格式:

company

1 1 1 1 2 2 2 2 3 3 3 3

year 1951 1952 1953 1954 1951 1952 1953 1954 1951 1952 1953 1954

invest

755.9891.21304.41486.7588.2645.5641.0459.3135.2157.3179.5189.6

mvalue

4833.04924.96241.75593.62289.52159.42031.32115.51819.42079.72371.62759.9

其中,变量company和year分别为截面变量和时间变量。显然,通过这两个变量我们可以非常清楚地确定panel data的数据存储格式。因此,在使用STATA8.0估计模型之前,我们

stata软件中关于面板数据的介绍

必须告诉它截面变量和时间变量分别是什么,所用的命令为tsset1,命令格式如下: tsset panelvar timevar

这里需要指出的是,由于Panel Data本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到Panel Data身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量Lag_invest,也就是invest的一阶滞后,那么我们可以采用如下命令: gen Lag_invest = L.invest 得到的新的数据为:

company

1 1 1 1 2 2 2 2 3 3 3 3

year 1951 1952 1953 1954 1951 1952 1953 1954 1951 1952 1953 1954

invest755.9 891.2 1304.4 1486.7 588.2 645.5 641.0 459.3 135.2 157.3 179.5 189.6

Lag_invest

.755.9 891.2 1304.4

.588.2 645.5 641.0

.135.2 157.3 179.5

mvalue 4833.0 4924.9 6241.7 5593.6 2289.5 2159.4 2031.3 2115.5 1819.4 2079.7 2371.6 2759.9

当然,按照这样的思路,我们还可以产生某个变量的移动平均、差分等。总之,凡是可以应用到时间序列上的命令,基本上都可以应用到Panel Data中来。在完成了上述设定后,我们就可以进行基于Panel Data的数据描述性统计和模型的估计了。

8.8.1 Panel Data样本描述性统计

在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于Panel Data而言,我们至少要知道我们的数据中有多少个截面(个体),每个截面上有多少个观察期间,整个数据结构是平行的还是非平行的2。进一步地,我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成: 12

See help tsset, 命令为[whelp tsset]。另外,如果想获得关于Panel Data的所有帮助,可采用命令[whelp xt]。 所谓平行面板数据是指所有截面单位的观察期间都相同,如我们在分析中国各省份的经济增长时,共有29个截面,每个截面都取1979-1998共20年的数据,共有580个观察值,这就是一个典型的平行面板数据。非平行面板数据就是不同的截面有不同的观察期间。

stata软件中关于面板数据的介绍

xtdes xtsum xttab

对Panel Data截面个数、时间跨度的整体描述 分组内、组间和样本整体计算各个变量的基本统计量 采用列表的方式显示某个变量的分布,较少使用

xtdes命令用于初步了解数据的大体分布状况,我们可以知道数据中含有多少个截面,最大和最小的时间跨度是多少。在某些要求使用平行面板数据的情况下3,我们可以采用该命令来诊断处理后的数据是否为平行数据4。

xtsum命令事实上是我们经常使用的命令summary的扩展,各个统计量都分别在样本总体、组内和组建三个层次上进行计算。基本的命令格式为: xtsum [varlist] [if exp] [, i(varname) ]

其中,[]中的内容都为可选项,在不设定选项的情况下,STATA默认对所有变量进行统计性描述。另外,如果我们前面已经采用tsset命令声明了截面变量和时间变量,[, i(varname) ]可以完全省略。

需要指出的是,由于我们可以把面板数据简单地视为混合数据(pooled data),所以以往针对截面数据设定的命令,如list、sum、des、tabstat、histogram、kdensity等命令也都可以用于Panel data的样本描述。

8.8.2 模型的估计

STATA8.0主要提供了如下模型的估计方法,对于门槛面板数据模型(Panel Threshold)和向量自回归面板数据模型(Panel VAR)等近期发展出来的模型,STATA8.0中还没有现成的估计程序,在估计过程中还需要我们自己编写程序。

xtreg xtregar xtgls xtpcse xtrchh xtivreg xtabond xtabond2 xttobit xtintreg

Fixed-, between- and random-effects, and population-averaged linear models Fixed- and random-effects linear models with an AR(1) disturbance Panel-data models using GLS

OLS or Prais-Winsten models with panel-corrected standard errors Hildreth-Houck random coefficients models

Instrumental variables and two-stage least squares for panel-data models Arellano-Bond linear, dynamic panel data estimator

Arellano- …… 此处隐藏:10711字,全部文档内容请下载后查看。喜欢就下载吧 ……

stata关于面板数据说明.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219