基于高斯混合模型的遥感影像半监督分类
时间:2025-04-02
时间:2025-04-02
第36卷第1期2011年1月武汉大学学报 信息科学版
GeomaticsandInformationScienceofWuhanUniversityVol.36No.1Jan.2011
文章编号:1671-8860(2011)01-0108-05文献标志码:A
基于高斯混合模型的遥感影像半监督分类
熊 彪1 江万寿1 李乐林1
(1 武汉大学测绘遥感信息工程国家重点实验室,武汉市珞喻路129号,430079)
摘 要:提出了对每一类地物的光谱特征用一个高斯混合模型(Gaussmixturemodel,GMM)描述的新思路,并应用在半监督分类(sem-isupervisedclassification)中。实验证明,本方法只需少量的标定数据即可达到其他监督分类方法(如支持向量机分类、面向对象分类)的精度,具有较好的应用价值。关键词:遥感影像分类;半监督分类;高斯混合模型中图法分类号:P237.4
当今遥感影像获取手段快速发展,不仅影像分辨率越来越高,而且数据量也迅速增加[1]。然而,数据处理方法的发展却难以跟上影像获取技术的步伐,如何从影像数据中快速地提取信息已成为一道难题。
半监督学习利用少量的标定数据协同未标定的数据得到精确的分类边界[3]。半监督分类承认标定数据不足,并在学习样本有限的情况下,利用新出现的数据不断学习,这更符合人脑的学习机制。因此,半监督学习在最近十多年快速发展,并迅速应用在网络标定、图像索引、语音识别等各个方面[3,4],同时也有学者将其引入到遥感影像分类[5,6]。高斯混合模型在图像分割、视频图像背景建模、运动物体检测等方面也都取得很大成功,但用于影像分类的研究却不多[7]。文献[8]考虑到遥感图像中地物在光谱空间表现为多种密度分布的混合,并借助期望最大(expectationmaximization,EM)算法估算每个类别的概率密度曲线参数,但它依然是将单类地物的光谱特征表示为单峰的正态分布。文献[9]将QuickBird图像中的房屋用一个高斯混合模型描述,不同子高斯项代表不同的房屋类型,从而将房屋分为精细的类型,验证了高斯混合模型对单类物体分类时的有效性。
[2]
法之一[10],但一般情况下都是假设各类别的数据为高斯分布[11],对遥感数据拟合并不理想,这给实际应用带来很多限制。本文利用高斯混合模型拟合每一类别的特征概率分布,实验证明,每个类别的概率函数只需要由3个左右分量的高斯混合模型即可以充分表达。
1.1 高斯混合模型及最大似然估计
设X=[X1, ,Xd]
T
T
是d维的随机变量,
x=[x1, ,xd]表示X的一个实例。如果它的概率密度函数能写成k个成分的密度分布的加权平均和:
P(x| )=
m=1
p(x|
m
k
m)(1)
则认为X服从有限混合分布,其对应的模型就为有限混合模型。其中, 1, , k是各个成分分布混合的权值; m是第m个成分分布的参数;{ 1, , k; 1, , k}是所有参数的集合;同时 m必须
满足如下条件 m 0,m=1, ,k且
m=1
k
m
=1(2)
如果假设所有成分的概率分布都服从高斯分布,则所对应的模型为高斯混合模型。而d维的高斯混合模型的参数 实际上由两个参数所决定:均值向量 和方差矩阵 。
在式(2)约束下,式(1)参数的解析解比较复杂,一般采用迭代方法[13]。即先建立样本的最大似然方程,然后采用EM算法对类参数及混合参
[12]
1 高斯混合模型
贝叶斯分类器现在仍是应用最广泛的分类算
收稿日期:2010-10-18。
:(;
第36卷第1期熊 彪等:基于高斯混合模型的遥感影像半监督分类
109
数进行估计。
最大似然估计的基本假设是所有N个样本的集合X={x(1), ,x(N)}是独立的,则其似然函数可定义如下:
l( )=p(X| )=
n=1
其中, l={ l1, , lk; l1, , lk}为参数集合,kl
ll由地物光谱分布的特性选取最佳的高斯分量数,
概率分布p(x| lm)服从高斯分布。根据概率理论的叶贝斯公式,未知数据点x属于wl类的后验概率为:
P(wl|x)=
n
p(x
N
n
| )(3)
进一步定义对数似然函数为:
H( )=ln[l( )]=将式(1)代入式(4),得:
H( )=
n=1N
k
n=1
llP(x)
(13)
lnp(x
N
| )(4)
式中,P(wl)为先验概率,也就是在图像中类别出
现的概率;P(x|wl)为似然概率,为在类别wl中出现像元点x的概率,由式(12)计算得到。
L
ln mp(x| m)
m=1
(5)
由于P(x)=l P(x|wl)P(wl)与类别wl无=1
关,对各类来说是一个公共因子,在比较大小时不起作用,判断类别时可以去掉,此时,最大似然判
别规则变为[13]:
x wl,当且仅当:
P(x|wl)P(wl) P(x|wj)P(wj)(14)式中,所有l和j都来自1,2,3, 种可能的类别。
所谓最大似然估计,就是要找到使式(4)最大的 的估计值^ ,即
H(^ )=max
n=1
ln p(x|
m
m=1
Nk
m)(6)
1.2 EM算法估计高斯混合模型参数
参数估计的EM算法是由Dempster等提出的[12],它分为E(expectation)步和M(maximiza-tion)步。对于高斯混合模型,采用EM算法进行参数估计的过程如下。
E步:首先初始化参数 m、 m和 m,计算样本n属于第m类的后验概率:
Qmn= mp(x| m)
标准化后为:
Rmn
mn
==Qn
mmm
2 半监督分类
一般认为,半监督学习的研究始于Shahshaha-ni和Landgrebe的工作[14]。半监督学习认为标定数据比较少,不足以代表分类空间,在分类的过程
中利用标定数据和未标定数据协同分类,通过合理建立 …… 此处隐藏:6591字,全部文档内容请下载后查看。喜欢就下载吧 ……