多重假设检验及其在经济计量中的应用
时间:2025-07-15
时间:2025-07-15
多重假设检验及其在经济计量中的应用
第纠卷第4期2007年4月
统计研究
StatisticalRe9目Irch
Vd.24。No.4Apr.2007
多重假设检验及其在经济计量中的应用
刘乐平
内容提要:基于错误发现率(FDR:False
张龙蔡正高
Discovery
Rate)的多重假设检验(MHT:MultipleHypothesisTesting),已成为
一种有效解决大规模统计推断问题的新方法。本文以错误控制为主线,对多重假设检验问题的错误控制理论、方法、过程和最新进展进行综述,并对多重假设检验方法在经济计量中的应用进行展望。
关键词:多重假设检验(MHT);错误发现率(FDR);经济计量学;q-值中图分类号:C812
文献标识码:A
文章编号:1002—4565(2007)04—0026—05
A
MultipleHypothesis
TestandItsApplicationinEconometrics
ZhangLong
CaiZhenggao
tests
are
LiuI.eping
Abstract:ItiscommonineconometricappHcationsthatseveralhypothesisreviewsthetheoryandproceduresofmultiplehypothesis
rate
carried
recent
out
at
the姗e
time.Thepaper
testing(MHT),summarizes
the
developmentsoffalsediscovery
andfinallyprospectstheapplicationofMHTineconometrics.Keywords:Multiple
hypothesistesting;falsediscoveryrate;econometrics;q-value
一、引言
巨型(海量)数据集合问题与大规模(高维)推断问题(huge
data
sets
设检验作为一个整体(称为一个检验族:Family.wise),然后对这个检验族中的每个假设同时进行检验的问题。它是现代DNA数据统计分析中迫切需要解决的问题,例(苟鹏程等,2006)Ho,在基因芯片数据统计分析中,“微阵列(Micmarray)”技术的迅速发展,给统计学专业人员提供了大量的微阵列数据。这类资料的特点:样本含量较小(一般为十几个或数十个),而变量数(基因数)非常多(一般为几百、几千甚至几万个)。如何对微阵列数据的差异表达进行
*本文获天津市2005年度社科研究规划项目“经济计量学现代贝叶斯统计建模研究”(TJ05.TJ001);教育部人文社会科学重大项目“我国车险统计精算的广义线性模型及其应用研究”(05JJDglOl52)的资助。本文得到美国佛罗里达大学生物统计系教授吴尚武(SamuelS.wu)博士的大力帮助,在此表示感谢!当然,文责自负。
andlarge.scaleinferenceproblems)
被总结成为2l世纪统计学需要突破的两大难题(Efron,B.,2005)¨]。为解决巨型数据集合问题
——数据挖掘(DataMining)的理论、方法和技术已
应运而生。而对于大规模统计推断问题,基于错误发现率①(FDR:False验(MHT:Multiple
Discovery
Rate)的多重假设检
Hypothesis
Testing),也为研究者提
供了一种有效的新思路。
在世界顶级的两大学术刊物《Science》和(Nature)上,近期都出现了FDR的应用研究成果:2001年,天体物理学家与统计学家合作在(Science)上发表了利用FDR方法证实宇宙起源大爆炸理论的论文(Miller,C
J.,Nich01.,RC.,Batuski,DJ.,
①FDR:False
Discovery
Rate,国内学者还有其它多种译法,如
“假发现率”和“阳性发现错误率”等。本文采用“错误发现率”的翻译是沿用了单重假设检验中第1类错误(TypeI含义。
②多重假设检验问题与经典统计中的多重比较问题(如方差
error-false
Science,2001)心]。2005年,在(Nature)上,遗传学家与统计学家合作,将FDR方法用于遗传多态现象间交互作用对基因表达的影响研究(Brem,RB.,
Storey,JD.,Whittle,J.andKruglyak,L.,Nature,
positive)的
分析后多组均敷的比较或多组等级分布比较后的两两比较等)不同。在样本观 …… 此处隐藏:10041字,全部文档内容请下载后查看。喜欢就下载吧 ……