基于信息熵的商标图像检索
发布时间:2024-11-28
发布时间:2024-11-28
基于信息熵的商标图像检索
基于信息熵的商标图像检索
报告人:邵妍2012年5月14日
基于信息熵的商标图像检索
图像的信息熵假设有随机事件的集合为 X1, X 2 , , X N ,它们 的出现概率分别为p1, p2 , , pN ,若满足条件:0 pi 1; i 1, , N; P i 1
则定义Shanon熵为: H ( p1, p2 , pN ) pi log pi
基于信息熵的商标图像检索
图像的信息熵不同形状的图像所包含的信息量是不同 的。全白或者全黑的图像可以看做是必然事 件,所包含的信息量为0.当图像各层亮度的 象素出现的概率相等时,图像所包含的信息 量越大,所以可以利用信息熵来描述图像形 状。
基于信息熵的商标图像检索
图像的信息熵设 {F ( x, y); x 1, 2, , M ; y 1, 2, , N} 是一 个二维的图像象素矩阵,且F ( x, y) 表示(x, y)处象素的亮度。若每个象素的亮度量化为 K层,图像的各个象素是独立的,且亮度为L 的象素出现的概率为PL ,则图像的信息熵为H ( p0 , p1, , pk ) pL log pL , L 0,1 , K
基于信息熵的商标图像检索
图像的信息熵F ( x, y) 0 代表背景像素 对于二值图像, F ( x, y ) 1 代表图像目标象素点。则图像 点, 的信息熵可以写成:
其中,
H ( p0 , p1 ) p0 log p0 p1 log p1
p1 F ( x, y) / M N; p0 1 p1
基于信息熵的商标图像检索
分块求熵矢量根据Shanon熵的性质可知,二值图像的熵 只与图像中的图像像素点和背景空白像素点的数目 有关,而与像素点的位置无关。因此两幅图像像素 点相同,则熵必相同,但形状不一定相同。因此, 还需要通过像素点分布在不同空间的信息熵来判断 两幅图像的形状相似度。
解决这一问题的常用方法就是对图像分块,通 过计算两幅图像中不同小块的熵组成的熵矢量之间 的距离来衡量图像间的差异。
基于信息熵的商标图像检索
分块求熵矢量
等距离分块等面积分块 四叉树分块
基于信息熵的商标图像检索
分块求熵矢量主要步骤:1.计算F(x,y)的基准点,即图像的重心( x ,
y) ;
2.计算F(x,y)中,目标象素到基准点的最大距 离 Dmax ; 3.以图像的基准点为圆心,以 Dmax为半径得到目 标区域的外接圆; 4.在外接圆内,使用等面积区域划分法或者等距离 区域划分法将目标区域划分为M个子图像。
基于信息熵的商标图像检索
分块求熵矢量等距离划分即每个子图所覆盖的距离区间的长 度相等,即:2 DMAX {( x, y )| ( x x ) ( y y ) M ,( x, y ) T ( x, y )} ti ( x, y) (i 1) D 2 2 i DMAX MAX {( x , y )| ( x x ) ( y y ) ,( x , y ) T ( x , y )} M M 2
i 1 1 i M
ti ( x, y)
等面积划分即每个子图像所包含的面积是相等的, 即:2 DMAX {( x , y )|( x x ) ( y y ) ,( x , y ) T ( x , y )} i 1 M 2 2 ( i 1) DMAX i D {( x , y )| ( x x )2 ( y y )2 MAX ,( x , y ) T ( x , y )} 1 i M M M 2
2
基于信息熵的商标图像检索
实 验
基于信息熵的商标图像检索
实验数据库: 2500幅二值商标图像,其中100幅为 训练图像,2400幅为测试图像。
其中,训练图像是由测试图像中的 十幅图像经过旋转,缩放等变形而来。
基于信息熵的商标图像检索
实验实验一: 从100幅变形图像中任选一幅图像,在整体 100幅中检索其相似图像,并输出检索结果中 最相似的前10幅图像,查看在这10幅图像中与 其相近的10幅图像占几幅,以及它们所处的位 置。
基于信息熵的商标图像检索
实验在100幅变形图像中,使用整体图像熵 进行检索结果如下:
基于信息熵的商标图像检索
使用等距离分块求熵矢量的方法进行检索结果如下: block_num=10:
block_num=15:
基于信息熵的商标图像检索
使用等面积分块求熵矢量的方法进行检索结果如下: block_num=10:
block_num=15:
基于信息熵的商标图像检索
实验实验结论: 通过实验可知,整体信息熵的查全率为30.3%, 等距离分块求信息熵的查全率为55.8%,等面积分 块求信息熵算法的查全率为62.4%,因此可以看出 通过分块求熵矢量来衡量两幅图像的差异比直接用 整幅图像的信息熵衡量的效果要好很多; 而等面积分块比等距离稍微好一点点;
当block_num为15的时候,检索过程比分块数 为10时计算量增大了一些,但检索结果并没有改善。
上一篇:冲压模具基础知识