一种2DDCT与压缩感知结合的人脸识别(2)
发布时间:2021-06-07
发布时间:2021-06-07
鉴于此,提出将二维离散余弦变换与压缩感知相结合用于人脸识别。首先对原始人脸图像实施2DDCT变换,接着进行压缩,滤掉图像中不敏感的中频和高频部分后,在频域中用压缩感知算法提取人脸特征,将提取的人脸识别特征用最近邻分类器完成识别,在ORL、Yale、YaleB及Feret人脸数据库上得到了较好的识别效果,且能减少整体识别时间。
2 人脸识别模型
人脸图像数据包含较大的冗余信息,需要进行降维处理;首先将人脸图像实施2DDCT,经过2DDCT后能量主要集中在低频系数上,适当地提取2DDCT系数也就达到了降维的目的。然后在频域中应用CS进行特征提取,将提取的人脸识别特征利用最近邻分类器完成识别。
2.1 离散余弦变换
人脸图像数据是高度相关的,存在很大的冗余性。图像经过2DDCT变换后,其低频分量集中在左上角,高频分量分布在右下角。低频分量包含了图像的主要信息,与之相比高频分量就显得不那么重要了,所以可以忽略高频分量,从而达到压缩的目的。图像经过2DDCT变换后,只需用少量的数据点即可表示图像。2DDCT系数很容易被量化,因此能获得较好的块压缩,同时具有快速算法,因此在人脸识别中容易实现。
离散余弦变换是一种常用的图像数据压缩方法,它的压缩质量接近于信息压缩的最优变换(K L变换)。 对于一幅M N的数字图像f(x,y),离散余弦变换的特点是:频域变化因子u,v较大时,DCT系数C(u,v)的值很小; 而数值较大的C(u,v)主要分布在u,v较小的左上角区域,这也是有用信息的集中区域。基于2DDCT系数重建图像时,保留少数离散余弦变换的低频分量,而舍去大部分高频分量,利用反变换仍可获得与原始图像相近的恢复图像。
2.2 压缩感知(CS)
压缩感知的数学描述是:
n对给定的T,稀疏信号x R在数据字典 [ 1, 2,..., k] Rn k,(n k)上可以
k表示为x , R且0 T n,这里0是l范数。在CS理论中,信号x被投映
p0矩阵 Rp n n,(T p ),压缩成感知向量y x R。对给定的数据字典 ,投映
矩阵 和压缩成感知向量y x ,重构原始信号x的过程如下:
设 Rp knk,x R可以看作向量 R满足下列方程的表示: ,(p k)
y (1)
由于p k,式(1)是欠定方程,从y重构x需要在所有满足式(1)中找出最稀疏解
满足下列方程:
argmin 0 使得 y (2)
后,重构信号可以用x 表示。 求得
[8]在稀疏分解算法的设计方面,已经有许多好的算法,如基于贪婪迭代思想的MP(Matching
Pursuit),正交最小二乘OLS(Orthogonal Least Squares)等算法以及与之相关的改进算法,本文采用的是正交最小二乘算法OLS。
2.3 基于压缩感知的人脸识别(CSFR)