基于SVM的概率密度估计及分布估计算法

发布时间:2021-06-05

总第236期

2009年第6期

计算机与数字工程

Computer&DigitalEngineeringVol.37No.6

 25

基于SVM的概率密度估计及分布估计算法

徐玉兵 谭 瑛 曾建潮 张建华

(太原科技大学系统仿真与计算机应用研究所 太原 030024)

3

摘 要 在最大熵分布估计算法中,根据Jaynes原理来建立分布估计算法中的概率密度。基于SVM的概率密度估计则是根据概率密度的定义,由核函数构造一个包含未知参数的概率密度函数。它根据样本点建立这个概率密度的数学规划模型,并用不敏感损失函数的支持向量机方法来求解这个模型。对得到的概率密度进行仿真测试,最后将得到的密度应用到分布估计算法中。

关键词 核函数 样本点 舍选法 分布估计算法中图分类号 TP301

DensityEstimationBasedonSupportVectorne

withitsApplicationinEstimationhms

XuYubing TanYingianhua

(SystemsSimulationand,UniversityofScienceandTenchnology,Taiyuan 030024)

  Abstract In

theedistributionestimatealgorithmanditsapplication,itconstructsthedensityof

theestimationofdistalgorithmsaccordingtoJaynesprinciple.Onthebasisofprobabilitydensityandthroughthekernelfunction,densityestimationbasedonsupportvectormachineconstructsaprobabilitydensityfunctionwhichin2cludesunknownparameters.IttakesuseofinsensitivelossfunctionπsSVMtosolvethemathematicalmodelthatwascon2structedbysamplepoints.Havingasimulationtestonthedensity,thenitwillbeappliedintheestimateofdistributional2gorithm.

Keywords kernelfunction,empiricaldistributionfunction,regressionestimate,acceptance-rejectionmethod,es2timationofdistributionalgorithms

ClassNumber TP301

1 引言

概率密度具有广泛应用,可用于数据挖掘中的聚类分析[1]以及电子器件寿命估计和排队论[2]。在一些情况下我们可以知道密度服从的分布,如电子器件寿命服从指数分布以及排队理论服从的泊松分布,它们的密度可以通过样本矩估计或极大似然估计等参数估计方法得到概率密度。但在实际应用中很多时候我们并不知道概率密度服从的分布,这时可根据样本

点进行回归估计得到实际概率密度的一个近似估计。

然而参数估计具有很大的局限性。例如对高斯分布可以估计未知参数,但对混合高斯密度就得不到很好的结果。在60年代,人们提出了非参数估计方法并建立了一套完善的渐近理论。这种方法的目标是从较宽的函数集中估计密度,而不是局限于参数化的函数集。非参数估计是为解决密度估计和函数回归估计的问题发展起来的。为了使理论全面,人们找到构造和分析非参数算法的一般

3

收稿日期:2009年3月26日,修回日期:2009年4月13日

作者简介:徐玉兵,男,硕士研究生,研究方向:智能计算。谭瑛,女,教授,硕士生导师,研究方向:数据库,决策支持系统。曾建潮,男,教授,博士生导师,研究方向:复杂系统与群体智能,智能计算,群控制与决策。张建华,男,博士研究生,研究方向:分布估计算法。

精彩图片

热门精选

大家正在看