高频金融时间序列波动性研究

发布时间:2024-11-28

电子科技大学

硕士学位论文

高频金融时间序列波动性研究

姓名:张娇

申请学位级别:硕士

专业:运筹学与控制论

指导教师:王定成

20090501

摘要

摘要

高频金融时间序列数据样本容量大,采集周期短,包含了丰富的市场信息,是金融市场特征的最好反映。为了更深入地探究市场微观结构,高频金融时间序列的波动性研究与建模成为国内外计量经济学者的研究热点。Andersen与Bollerslev在1998年提出一种新的波动率估计方法一“已实现"波动;Christensen和Podolskij在2005年基于极差理论提出另一种波动率估计方法一“已实现"极差波动;国内学者对这两种方法分别进行扩展,得到更有效的估计方法。

本文首先选取我国上证股指1分钟交易数据进行统计分析,验证了我国沪市高频价格序列和收益率序列具有高峰厚尾、非正态分布及波动聚集等ARCH特征,同时还具有长记忆性、波动率的日内“U”型走势等性质。

而后,基于国内外学者已有的研究成果,提出赋权“已实现’’波动方法的改进——调整赋权“已实现"波动,理论上证明其无偏性和有效性;利用我国上证股指高频数据计算得到不同估计方法下的积分波动的不同估计量,实证说明调整赋权“已实现”波动方法更优化,并选取统计指标最优的对数赋权“已实现’’极差波动率作为后续建模工作的研究对象;基于收益率序列的平稳性和长记忆性特征,本文建立AR(i).FIGARCH(p,d,q)模型,采用聚合序列分析法和极大似然估计法确定模型参数。

最后,给出对数赋权“已实现"极差波动率真实值与拟合值的比较图,直观说明所建模型的拟合效果优良;计算我国上证股指1分钟交易数据样本的高频收益率,与AR(O.FIGARCH(p,Zg)模型的预测值进行比较,说明此模型在波动性估计及预测方面具有一定的实用价值。

关键词:高频金融时间序列,波动性,调整赋权“已实现"波动,AR(O-FIGARCH(p,Zg)模型

ABSTRACT

ABSTRACT

High—frequency

containsfinancialdatahaslargesamplesizeandshortsamplingcycle.Itabundantinformationofmarket.Itisthebestrepresentationofthe

deeplyonfinancialandmarket.Inordertoresearchthemicrostructureofmarket,analyzing

modelingthevolatilityofhigh—frequencyfinancialtimeseriesbecomethehotspotsofdomestic

proposedandaforeigneconometricresearchers.In1998,ofestimation,theRealizedAndersen&Bollerslevmethod.Another

ChristensenandnewmethodVolatilitymethod--RealizedRange-based

Podolskijin2005.Thenthe

extendingthetwomethods.VolatilityWasbroughtforwardbydomesticscholarsputforwardeffectivemethodsby

Inthispaper,weanalyzethestatisticalcharacteristicsofhigh-frequencydatainthe

isShanghaiStockMarket,whichsampledwimthefrequencyoflminute.Theresult

verifiesthatthetypicalcharacteristicsof

China'sstockmarket.Forhigh—frequencytimeseriesarereflectedinexample,highkurtosis,heavytail,non-normaldistribution,congregatedvolatility,longmemoryprocess

onandintraday‘‘U’一shapedtrend.Basedtheresearchresults,anewestimatingmethod,AdjustedWeighted

andRealizedVolatility,is

proventobeproposedastheimprovementandmoreofWeightedtoRealizedVolatilityunbiasedefficient.According

Integratedtheseestimatingmethods,weworkouttheestimationvaluesofVolatilityandprovetheeffectivenessofthe

AdjustedWeightedRealizedVolatility.Then

tologarithmicWeightedRealizedRange-basedVolatilityischosenfitdataowingto

isitsbeststatisticproperty.AfterwardstheAR(力一FIGARCH@谚g)model

andlongestablishedbecausethereturnrateofthemodelserieshasthecharacteristicsofstablememory.Theparameters

areestimatedbythemethodofPolymerizationsequenceanalysisand

7‘maximum

likelihoodestimation.

Finally,thecomparisonbetweenlogarithmicWeightedRealizedRange-basedVolatilityanditsfittedvalueshowsthatthemodelhasfavorablefittingresult.Thenwecalculatethereturnrateofthesample.Bycomparingitwitllthepredictivevalue,theAR(i)-FIGARCH(p,Zg)modelisprovedto

TTbevaluableinestimatingandforecasting

ABSTRACT

volatility.

Keywords:high—frequencyfinancialtimeseries,volatility,AdjustedWeightedRealized

Volatility,AR(i)一FIOARCIJ(p,叠DmodelⅢ

独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。

签名:日期:1胡年6月砂日

关于论文使用授权的说明

本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。

(保密的学位论文在解密后应遵守此规定)

签名:导师签名:≯t盈妓日期:卅年‘月歹日

第一章引言

第一章引言

1.1选题背景及意义

基于统计学意义,金融时间序列是指金融市场上金融产品(诸如股票、期权、债券等)的价格、收益等数据依照时间先后顺序排列而得到的数据序列值。金融时间序列分析研究的是金融资产价格随时间变化而变化的理论和实践。金融理论和时间序列本身都存在不确定因素,对其波动性的计量分析对探究金融市场微观结构具有极其重要的现实意义。

成熟的国际金融市场在开市时间内是持续、高频率运作的,各种信息连续地影响市场价格的运动过程。我国在改革开放进程中通过经济体制改革,逐步与世界接轨,尤其是加入WTO后,国内金融市场正飞速发展。在金融市场全球化、电子化、虚拟化的发展过程中,金融业每天将产生海量的数据。这些数据是金融时间序列的具体体现形式。及时有效地从这些海量数据中挖掘出高附加值的信息资源或有用的知识为金融机构的经营管理作决策服务已成为专业人士关注的热点。

而之前的很长一段时期内,我们可获取的实际数据大都是离散并且低频率的。金融数据的离散采集造成了市场信息不同程度的缺失,当我们利用这些数据进行市场微观结构分析时得到的结论是不全面的。为了更深刻地理解金融市场特征,需要对高频率的金融数据加以研究,数据采集频率越高,信息丢失则越少。

在金融计量学领域,高频时间序列通常指以小时、分钟甚至秒为频率所采集的日内金融数据,其采样频率是等间隔的;另一类实时记录每笔交易数据的高频时间序列称为超高频数据,对一般金融市场而言,其每笔交易发生是高频率的,且时间间隔是随机的。较之传统的低频数据(年度数据、周数据、日数据等),高频金融数据的样本容量大,采集周期短,其中包含了丰富的市场信息,是金融市场特征的最好反映。国内外研究者通过对成熟市场的实证研究发现,高频金融时间序列具有高峰厚尾、非正态分布及波动聚集等ARCH特征,同时还具有长记忆性、波动率的日内U型走势等性质【l】。

计算机和通讯技术的发展,为高频率金融数据的采集、存储、检索和处理提供了必备条件。高频数据的获取使得对市场实际价格、成交量、成交规模和平均深度的连续观测成为可能。但利用金融高频数据进行研究时存在一些问题。例如,

电子科技大学硕士学位论文

在数据收集方面,以较长时间段为周期来对数据取样时,可能会出现偏差,描述的并不是同一个现象。以股票指数为例,公司、企业等的合并或不动资产的转让会影响其结构。当对股票指数的历史记录进行分析时,这种影响不易被察觉,从而会使分析结果出现偏差。再者,以小时为取样频率的数据,会出现由于地球的公转、自转及时区分布等造成的季节性波动影响很大,且超过其他次要的因素。1.2高频金融时间序列研究发展的基本动因

高频金融时间序列产生至今,对金融高频数据的分析一直是金融研究领域中一个倍受瞩目的焦点。这可以归结为两个原斟2】:

一个原因在于对金融高频数据本身所具有的特征的关注。通常所指的交易数据,除了交易价格外,还包括与交易相连的询报价、交易数量、交易之间的时间间隔、相似资产的现价等等,因此,对于金融高频数据的分析,实质上是一个关于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的’’复杂多变量问题。这样如何从总体上来分析金融高频数据、又如何处理具体金融交易中高频数据的特殊性,便成为众多金融领域的从业者和研究者所面临的一个富有挑战性的课题。

另一个原因在于金融高频数据对理解市场的微观结构来说相当重要。对金融高频数据的逐步积累和了解,不仅转变了一些陈旧的研究理念,如以前认为短期的价格波动是不相关的噪音并且不值得去搜集,但现在我们知道高频数据中的这种波动恰恰包含着理解市场微观结构的重要信息;而且随着对金融高频数据统计特征认识的深化,也使先前一些关于如金融市场同质性(homogeneous)、短期价格波动服从高斯随机游动(Gaussianrandomwalk)的古典经济假定受到了质疑。不难看出,在探寻金融市场微观结构的过程中,需要对基础经济理论、研究方法和计量模型等进行不断地创新和完善,而对金融高频数据的研究正好为这些理论、方法和模型的创新和完善提供了实证条件。

我国高频金融数据研究尚处于起步阶段。其原因一方面在于,从世界范围来看,高频金融数据研究仍然处于起步阶段,理论研究也才刚刚起步,尚无法成功地应用于实践。另一方面无论从商业角度还是技术角度来说,高频数据难以得到,使得许多学者无法对高频数据展开深入研究,从而极大地阻碍了理论研究的突破和实际应用的发展。2

第一章弓}言

1.3国内外研究现状和发展态势

金融时间序列是金融变量发展变化的真实记录,通过对它们的技术分析,可以定量发现其中的规律和特征,为科学决策提供重要信息。而对其波动特性的研究是对金融市场进行定量研究的前提,是分析资本资产定价、金融风险防范等问题的基础。近二三十年来,如何能够更准确地刻画波动性受到国内外学者的广泛关注,也有学者就不同的角度分析高频金融时间序列,得到一些有意义的成果:

(一)金融高频数据统计特征的研究

早期的研究表明,金融高频数据是不稳定的,在较短期间内有厚尾(heavy-tail)趋势。相比较而言,近期对金融高频数据统计特征的研究更为深入和具体。Andersen和Bollerslev的研究【3悛现高频收益数据具有非正态性。随着数据频率的增加,其数据的峰度也是随之增加的,到分钟数据,峰度就已经达到了100以上了。Andersen和Bollerslev采用高频数据对美国股票市场和外汇市场的日内波动性和长记忆性进行了研究,证明了在这些市场中存在着波动的长记忆性【41。Andersen和Bollerslev利用高频数据对日本股票市场进行了研究,通过滤波的方法证明了波动长记忆性的存在[51。

(二)金融高频数据的“日历效应”研究

“日历效应”是指波动、交易量、买卖价差、交易频率等金融变量在日内、周内、月内表现出稳定的和周期性的运动模式。“日历效应"是对金融高频数据的研究中最重要的发现。McInish和Wood利用分钟数据发现日内波动具有“U"型模式L61;Admati和Pfleiderer,Brock和Kleidon各自给出了日内“u”型模式的理论解释[7][8];Hedvau对它们进行了比较网;Rah.mall和Lee等利用个股交易数据对日内“u”型模式进行了实证研究,并发现交易量、买卖价差、交易频率也存在“U’’型模式【l川;Andersen和Boller-slev系统地分析了“日历效应”,并解释了它产生的原因,通过德国马克对美元的汇率数据拟合了“日历效应"【ll】。Andersen,Bollerslev,Cai利用弹性傅立叶形式回归(FlexibleFourierFormRegression)对日本股票市场进行了分析,发现由于日本市场有不同于美国市场的午间休市的交易制度,日本股票市场波动呈现日内双“U"型模式【6】。

(--)对金融波动性测度方法的研究

金融时间序列的波动性作为一个隐含变量,不仅是资产风险的决定因素,还是衍生证券定价中的一个关键参数,对它的估计及其相关性质的研究是计量经济3

电子科技大学硕士学位论文

学的一个挑战。

金融波动性测度方法大致分为两类,一类是基于样本历史序列的波动性估计方法,另一类是基于衍生证券定价模型的隐含波动率法【l羽。第一类方法中主要是两大类模型——自回归条件异方差(ARCH)族模型和随机波动(SV)模型。第二类方法主要是应用于金融衍生产品定价研究中,量化市场中某一衍生产品价格蕴含的标的证券的波动率,反映市场对于标的证券价格未来波动的预期。而传统的测度方法对高频时间序列得不到很好的分析结果,不能直接应用。文献[13,14]在弱GARCH模型的基础上,提出了一套弱GARCH模型的估计检验方法。文献[15,16】提出了HGARCH(HeterogeneousGARCH),在GARCH模型的条件异方差项引入时间刻度变换处理技术。

对利用高频数据计算金融波动做出贡献最大要数Andersen与Bollerslev两人近年来的工作,最主要的成果是他们提出了一种叫“已实现"波动(realizedvolatilit3,)的测量方法【31。“已实现”波动是把一段时间内收益率的平方和作为波动率的估计,这种估计方法不同于ARCH类模型和SV类模型,它没有模型(modelfree),不需要进行复杂地参数估计,在多变量的情形下可以扩展为“已实现"协方差矩阵,它不仅包括各变量自身的“已实现"波动,也包括变量之间的“已实现”相关系数。对“已实现’’协方差阵可以建立向量分整自回归移动平均模型(VectorAutoregressiveFractionallyIntegratedMovingAverageModel)。估计出VARF/MA模型的参数以后,就可以预测将来的波动性和相关系数,可以很方便地应用于资产定价,资产配置等领域。

理论上,已实现波动是积分波动(integratedvolatility,IV)的一致估计量。事实上,由于受到不连续交易、竞一要价价差等微观结构因素的影响,已实现波动是积分波动的有偏估计量。为了提高高频数据波动率估计的准确性,文献【17】提出了另一种更有效的波动估计量,已实现极差波动(range-basedvariance,RRV),也是无模型的。

(四)对金融时间序列长记忆性的研究

长记忆性最初是由水文学家Hurst于1951年在对尼罗河潮汐数据的研究中发现的。Malldelbrot【18】引入分数布朗运动及分形概念奠定了长期记忆分析的严格数学基础后,长记忆性研究在流体学、气象学及地球物理学等自然科学领域引起了广泛关注,而经济、金融时间序列的长记忆性也逐渐成为经济学、金融学领域的研究热点。本文2.1节介绍的很多国内外文献的实证研究中发现金融时间序列(如证券市场的收益率序列)自相关函数呈现出一种缓慢的衰减模式,而非短记忆过程式4

第一章引言

的以指数率迅速衰减,这种现象被称为长记忆性。如果一个收益序列具有长记忆性,则说明该序列的观测值之间相互不独立,根据之前的收益率可以预测将来的收益率。而金融市场研究的一个重要理论基础——有效市场假说,强调收益率时间序列的独立性,即资产价格基于之前的信息是无记忆或短记忆的。长记忆性的存在意味着基于布朗运动(Brownianmotion)、鞅过程(Martingaleprocess)以及有效市场假说所推导出的一系列模型(如Markowitz的现代资产组合理论、资本资产定价模型、套利定价模型和Black.Scholes的期权定价理论等)都无效。因此,对长记忆性的研究具有一定的理论价值;且这一特性在收益序列的波动性中也有体现,金融时间序列的波动性是否具有持续性的研究也具有重要的现实意义,对于了解市场微观结构、预测市场的走势、分析市场风险及历史对未来变化的影响等方面均有重要的作用。

1.4本文主要研究内容及方法

高频金融时间序列因其丰富的信息蕴含量和明显区别于低频数据的特征已成为计量经济学方面的研究热点,对其波动性的研究有助于我们更好地认识市场微观结构,在风险度量方面的应用性很强。本文将以我国上证股指高频数据作为分析样本,根据已有的波动率分析方法,结合数据样本本身的特征,改进波动率估计方法,并试图对性质良好的估计量进行建模,预测收益率序列的走势,以此说明模型本身的实际应用价值。具体的结构安排如下:

第一章为本文的引言,介绍选题背景,对高频金融时间序列研究的发展历程进行简介,综述国内外已有研究成果及发展态势。

第二章介绍成熟证券市场的高频金融时间序列的特征,说明在数据分析中可能存在的问题。选取2007年1月4日至2007年4月30日我国上证股指的1分钟交易数据进行统计分析,验证我国股市数据是否具备高频时间序列的特征,为后面的建模分析奠定基础。

第三章介绍已有研究中总结的金融时间序列波动率的特征,综述时间序列波动性研究领域经典的条件异方差模型及其扩展形式,及在高频时间序列的波动性研究中特有的“已实现"波动和“已实现"极差波动方法及其建模。借助“已实现”波动已有扩展形式的思想,对赋权“已实现”波动进行改进,提出积分波动的新估计量,并证明它的无偏性和有效性。

第四章主要工作是实证和建模。根据我国上证指数1分钟交易数据收益率序5

电子科技大学硕士学位论文

列的日内“U"型走势和长记忆性等特征,结合已有的高频时间序列波动率计算方法,计算几种积分波动的估计量,比较结果显示,基于极差理论且考虑了“日内效应”的赋权“已实现”极差波动率为最优估计量。基于收益率序列的平稳性和长记忆性特征,建立AR(0.FIGARCH(p,Z碍)模型。经过模型定价和参数估计后,运用该模型进行了拟合值比较和收益率预测,进一步研究收益率序列的波动性质。

第五章对全文工作进行总结,并提出了高频金融时间序列波动性研究的一些可行方向。6

第二章高频金融时间序列

第二章高频金融时间序列

2.1高频金融时间序列的特征

迄今为止,对国际成熟市场的高频数据实证分析已经得到一些典型的数据特征,主要有:

1.波动率日内“U’’型走势

每个交易日内的波动率一般是开盘与收盘时高,中间交易时间较低。Mclnish和Wood(1985)t6】利用分钟数据发现日内波动具有“U"型模式;Admati和Pfleiderer(1988)阴,Brock和Kleidon(1992)ISl各自给出了日内“U”型模式的理论解释,Hedvall(1995)【91对它们进行了比较;Rahman和Lee等(2002)Do]利用个股交易数据对日内“U”型模式进行了实证研究,并发现交易量、买卖价差、交易频率也存在“U"型模式。

2.波动率具有日历性

日历性指波动率、交易量、买卖价差、交易频率等金融指标在日内、周内、月内表现出稳定的和周期性的运动模式[121。Andersen和Bollerslev(1998)【11】系统的分析了“日历效应",并解释了它产生的原因,通过德国马克对美元的汇率数据拟合了“日历效应",发现“日历效应"对准确计量波动性至关重要。Andersen,Bollerslev,Cai(1998)【5】利用弹性傅立叶形式回归(FlexibleFourierFormRegression)对日本股票市场进行了分析,发现由于日本市场有不同于美国市场的午间休市的交易制度,日本股票市场波动呈现日内双“u”型模式。Andersen和Bollerslev(1997)M】在研究“日历效应"与波动持续性之间的关系时,发现在对日内周期性的“U”型模式进行滤波处理之后,波动持续性大大的下降。

3.价格序列具有高峰厚尾性

通过实证分析发现,金融收益序列并非如之前的研究中所假设的服从正态分布,呈现出高峰厚尾的分布特性。在其均值附近以及离均值较远的尾部,其真实分布比标准正态分布具有更高的概率分布密度函数值。Anderson增加的,分钟数据的峰度就已经达到100以上了。

4.价格序列具有负相关性7andBollerslev(1998)ul】实证表明随着日内数据频率的增加,数据序列的峰度值也随之

电子科技大学硕士学位论文

GoodhartandFigliuoli(1991)[19】、MainishandWood(1991)实证研究了日内价格

and

and序列是具有负的一阶相关性的,特别是出现在一些跳点的情况下。BollerslevDomowitz(1993)再次从询报价的数据中找到了这一特征。Low

种相关性具有非线性的特征。Muthusuamy(1996)用5分钟的频率数据验证序列的负相关性,并进一步证明了这

除了以上4个主要的特征外,高频数据还具有一般的ARCH特征(如厚尾、非正态、波动率聚集)。Andersen和Bollerslev(1998)【3】的研究发现高频收益数据具有非正态性。20世纪90年代以来,金融计量学者开始关注金融序列是否具有长记忆性的问题。现有的国内外文献研究发现,成熟、开放的股票市场收益不存在显著的长记忆特性,但在一些新兴的证券市场这一特征却非常显著。Andersen和Bollerslev(1997)【4】采用高频数据对美国股票市场和外汇市场的日内波动性和长记忆性进行了研究,证明了在这些市场中存在着波动的长记忆性。Andersen和Bollerslev(2000)【5】利用高频数据对日本股票市场进行了研究,通过滤波的方法证明了波动长记忆性的存在。在国内方面,汤果等(1999)t20】对上海股市日收益的FIGARCH建模,以及邹新月(2002)t2l】对深圳股市绝对收益序列的分析,虽然都提及了波动长记忆性的分析方法,但没有能够在波动的意义上对得到的结果进行合理地解释。为此,李亚静【22】等通过对绝对收益和平方收益自相关函数的显著性检验,验证了我国股市波动的长记忆效应;而王春峰和张庆翠【23】从波动长记忆建模的角度,利用FIGARCH模型实证了我国股市波动的记忆性特征。

2.2金融高频数据分析中问题研究

金融高频数据的特征为认识市场微观结构提供了更为详细的信息,但也给相关的实证研究带来了前所未有的问题。目前,理论界虽然对这些问题有了一定的探讨并且提出了若干建议性的解决方案,但距离问题的真正解决还相差甚远。因此在未来的研究中,这仍然是~个值得关注的问题。总的来看,金融高频数据的分析中所遇到的问题大致可以归纳为如下三类【2】:

1.数据问题

(1)不准确的时间(inaccuratetimes)。对每日数据来说,数据库中对每个观测值(如每日收盘价格)所记录的日历时间通常是准确的。相反,日内交易的记录时间却往往是不准确的。比如在一个采用公开喊价交易机制的金融市场中,交易数据要等到交易者的交易卡片进入计算机系统以后才做时间标记,这当中则可能会

第二章高频金融时间序列

有几个小时的时滞。对金融高频数据来说,交易之间的间隔比较短,这种不准确性往往会造成交易或报价被记录到一个错误的间隔中,或者交易或者报价的时间序列不正确等问题。

(2)不正确的交易量(inaccuratevolumes)。同样地,在采用公开喊价交易机制的金融市场中由于单笔交易量较难观察到,在对其所建立的金融高频数据中,往往采用对单笔交易估计而非精确的交易量,从而就意味着用这些数据所作的研究是不可靠的。

(3)失时效的价格(staleprices)。实证研究通常需要现价时间序列,但除非价格形成过程是连续的,否则就无法得到这样的时间序列,而需要使用失时效的价格作为替代。所谓失时效的价格,指的是一段时间之前发生的交易价格。比如说,要得到一个按固定间隔(如每15分钟)观察的价格序列,因为在这样短的一段时间内也许不会有交易或报价出现,所以就只能用最近的价格作为替代。可是如果将这样的数据视为固定间隔取值数据的话,就会引起各种各样的偏差。比如,如果把不等间隔的数据视为等间隔的数据的话,就会高估后者的方差,并且收益的时间序列会表现出自相关性。

(4)缺省值(missingvalue)。用来计算收益的价格必须来自单独的交易或报价,在这里如何处理缺省值问题非常重要,因为它将影响作为结果的时间序列的统计特征。在每月或者每周数据中几乎不可能出现缺省值问题,而且对大多数金融证券来说通常每天至少会有一个交易(或报价),所以每日数据一般也不会遇到这个问题。然而,在金融高频数据中(如时间间隔缩短为1分钟)缺省值却会时常发生,并且成为影响相关研究的一个实质性的问题。

2.日内数据带来的市场微观结构的影响

(1)离散性(discreteness)。价格的离散性在取值范围很大的低频样本中不是个重要问题,因为它可以用一个连续过程作为很好的近似。但是对日内价格运动来说,离散性却是个严重问题,因为它可能一共只有五、六个观测值。缺少连续性暗示了按照连续间隔状态所建立的模型不能很好地代表数据,并且会导致一系列的统计问题,如有限依赖变量、拒绝随机性检验(因为它可能会带来微弱的负自相关)、增大估计的方差、带来价格变动分布中的峰度问题等等。

(2)季节性(seasonalities)。有关的实证研究已表明,在很多金融市场中都存在交易量、收益波动性、询报价差额的“U’’型趋势和收益中的日内模式及自相关关系。由于这些现象会导致周末效应的消失、高估信息对收益波动性的影响以及会隐藏高频数据中的ARCH效应等,所以,对它们进行控制是相当重要的。9

电子科技大学硕士学位论文

(3)询报价反弹(bid.askbounce)。在低频数据中询报价差额对收益计算的影响很小。可是研究表明,在高频数据中,它却会造成收益中的负自相关关系。询报价差额是一个交易成本,它不仅会给基于套利的定价关系带来噪音并且造成算术收益和收益方差的高估;而且还会影响价格时间序列的动态性、价格逆转与延续性检验的效力及增加收益的波动性。

3.统计与计量问题

(1)缺少正态性(1ackofnormality)。根据中心极限定理所推出的“金融市场的收益服从正态分布’’的结论是有争议的。对于对数形式的收益来说,每个月的对数收益值等于这个月中每分钟收益值的总和,因而每月收益数据趋于正态分布。但是当交易间隔变得比较短时,正态分布的论点就失去了效力。有实证研究表明,随着交易间隔越来越短,收益的分布也会越来越偏离正态。非正态性之所以重要,不仅因为它会令很多标准统计检验失效,而且它也是建立一些模型,如BlackScholes期权定价模型和进行风险价值分析的重要基础。

(2)ARCH效应。众所周知,在每日或更低频的收益数据中存在ARCH效应。关于波动性的建模和预测对金融工具的定价是很重要的。如对期权来说,Engle和Bollerslev的ARCH模型就是对波动一致性进行估计的成熟方法。但是对于估计频率过高的金融数据表现出来的ARCH效应来说,ARCH模型的效果可能不很明显。’

2.3我国股市高频数据统计特征分析

2.3.1数据样本来源

本文采用的分时数据是上海证券交易所提供的上证A股价格指数自2007年1月4日到2007年6月30日的每个交易日的1分钟交易数据,剔除节假日后共有117个交易日,上证交易所的交易时间是上午9:30.11:30,下午13:OO.15:oo,共4个小时,包含28080个数据样本点。在本章的统计特征和第四章的建模实证中,选取该样本中1月到4月的共18719个数据进行分析,后两月数据共9361个用作第四章的预测分析。

该分时数据文件包含交易日期和时问、开盘价、最高价、最低价和收盘价等数据项。开盘价指在时间区间刚开始时上证A股指数的当前值;最高值是指在该时间区间内上证A股指数出现的最高点;最低值则指该区间内上证A股指数的最lO

Kf、x罅一XLE

第二章高频金融时间序列

低点;收盘价指上证A股指数在该时间区间结束的交易时点的值。

本文对数据样本的实证分析主要利用EViews、Matlab、OxMetrics等软件完成。2.3.2基本统计量及常用符号说明

1.叩,J第f个交易日第f个时间区间的开盘价;

2.印“第t个交易日第f个时间区间的收盘价:

3.幼¨第f个交易日第f个时间区间的最高对数价格;

4.勿¨第t个交易日第f个时间区间的最低对数价格;

5.‘,第t个交易日第i个时间区间的对数收益率,简称为收益率;

‘J=lncpf,f—hl印f,“

6.1tx序列{Xt)的均值;

7.%序列{Xt)的标准差;

.、l

crx={e(x-uz)2卢

8.偏度s[矧衡量随机变量X围绕其均值的非对称性:

一c—e(x一鲰)3

如果概率密度函数是对称的,S值为0;正的S值说明序列分布有长的右拖尾,即右偏;S值为负说明序列分布有长的左拖尾,即左偏。

在统计学软件应用中,为比较正态分布和其他分布,引入偏度系数。偏度系数越趋于0说明越接近正态分布。

9.峰度K[24]峰度值K度量凸起或平坦程度:

=—j———;卫蚌

正态分布的K值为3;K值大于3说明分布的凸起程度大于标准正态分布:K值小于3说明分布的凸起程度相对于标准正态分布是平坦的。

类似偏度系数,软件应用中常用峰度系数进行分布的正态性检验。峰度系数为峰度值减去三,所以峰度系数越趋于0说明越接近正态分布。

10.Jarque.Bera统计量【241检验一组样本是否能认为其来自正态总体。计算公式:

高频金融时间序列波动性研究.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219