您的当前位置:首页稀疏表示的人脸识别及其优化算法

稀疏表示的人脸识别及其优化算法

2023-11-06 来源:小侦探旅游网
第29卷第1期 2012年2月 文章编号:1005—0523(2012)01-0010—05 华东交通大学学报 Journal of East China Jiaotong University Vb1.29 NO.1 Feb..2012 稀疏表示的人脸识别及其优化算法 郑轶 ,蔡体健 ,。 (1.华东交通大学轨道交通学院,江西南昌300013;2.华东交通大学信息工程学院,江西南昌330013;3.中南大学信息科 学与。一程学院,湖南长沙410075) 摘要:稀疏表示的本质就是稀疏正规化约束下的信号分解。提出一种改进的正交匹配追踪算法,使运算量较高的矩阵求逆 运算转变为轻量级的向量运算或向量与矩阵的运算,可以加快逆矩阵和大矩阵乘积的求解。将此算法应用于稀疏表示的人 脸识别,探讨并验证了稀疏阀值的设置和训练字典的选择对人脸识别率和识别速度的影响。 关键词:压缩感知;人脸识别;稀疏表示;快速正交匹配追踪算法;特征提取 中图分类号:TP391.4 文献标识码:A 人脸识别问题是一个经典的模式识别问题。近年来,受到压缩感知理论的启发,基于稀疏表示的人脸 识别技术得到了广泛研究。基于稀疏表示的人脸识别是利用训练图片构造字典,再通过求解一个欠定方 程来求得测试图片的最稀疏线性组合系数,然后根据这些系数来对图像进行识别分类。 稀疏表示的人脸识别问题表示成数学形式为:l,= ,其中Y∈R 是m维自然信号,A∈R 是预定 义的基(又称为字典),X∈R 是自然信号在预定义基下的iv/维稀疏表示。在已知原始信号的基础上,求解 其在预定义基下的稀疏表示,是一个稀疏编码问题,可有以下两种求解方式n。 : 稀疏正规化约束下的稀疏编码: .1 ̄=argminI[Y—A201;s.t.112010≤ 3 ̄=argmin11012o s.t.j1y—AXll ≤s (1) (2) 误差约束下的稀疏编码: 式中: 是原始信号l,在预定义基下的稀疏表示系数;s是误差容限; 是稀疏阈值;l1.1l 表示『n范数,即列 数向量中非0元素的个数。 稀疏编码与信号的压缩感知重构具有相同的数学形式,其主要的求解算法包括最小,0范数法、贪婪迭 代匹配追踪系列算法等。其中,匹配追踪类方法为其近似求解提供了有力工具,在稳定性和运行速度方面 具有一定的优势。目前常用的匹配追踪类算法包括:正交匹配追踪(o ̄hogonal matching pursuit,0MP)算 法 ,基于树型搜索的正交匹配追踪算法 ,正则化正交匹配追踪算法 ,压缩采样匹配追踪算法 。等。 l正交匹配追踪算法 正交匹配追踪思想 ~本质上是来自于 ‘稀疏”,就是从过完备字典的Ⅳ个原子中寻找 个关键分量, 这 个关键分量系数的绝对值应该比其它N-K个分量大得多。算法在每一次的迭代过程中,从过完备原子 库里选择与信号最匹配的原子来进行稀疏逼近并求出余量,然后不断迭代选出与信号余量最为匹配的原 子。为了减少迭代次数,算法通过递归对己选择原子集合进行正交化以保证迭代的最优性。具体见算法 收稿日期:2011 12-26 基金项目:周家自然科学基金项口(61165007);华东交通大学科研项目(09111004) 作者简介:郑轶(1970一),男,副教授,硕士,研究方向为机械工程与信息控制及处理。 第1期 郑轶,等:稀疏表示的人脸识别及其优化算法 1,其中第5步是贪心选择原子的步骤,g是所选择原子的索引;第6步是将所选择的原子 添加到子空间 A ,Ad是 的子矩阵;第7步是对已选择的原子进行正交化,并计算信号的表示系数 =( ≠) y,在 此需要计算( ) 逆矩阵,矩阵的求逆运算是重量级的运算,往往需要对矩阵进行三角分解或QR分解; 第8步是计算最小残差 。 算法1正交匹配追踪算法 第1步第2步输入:字典 ,列信号Y,误差容限s或稀疏阈值K 输出:稀疏的系数X 第3步初始化:设置残差R:=Y,系数 :=0,A :=[] 第4步do while(迭代条件成立) 第5步q:=max f I} 第6步A := 第7步 =( 第8步第9步enddo ) A;Y R:=Y-A X 2改进的正交匹配追踪快速算法 正交匹配追踪算法的计算量主要集中在( ) 矩阵求逆,而A 在每次迭代中只是增加一列,因此 对( ) 的求逆,完全可以用它的上一次迭代的逆矩阵推算得来。假设未更新前的子字典为 ,则更 新后的子字典A≯=l A。l。令 = ≠,则可以推得: F= T =l : ; I:够 c3 (4) 式中: = ;c=ATA 。 由于F是对称正定矩阵,因此可令F_。:l y1ll ,又由于FF~:I(,为单位矩阵),经过运算可得到: =1/(c—vTp );y=一P Vw;x=P_。I—VY ) 由于每次迭代都只是增加一列,因此在上式中C和W都是标量, 和】,是向量,而 是上一次迭代的 逆矩阵,是个已知矩阵,因此F 的求解变成了向量或向量矩阵的轻量级运算。 为了进一步减少正交匹配追踪算法的计算量,可以跳过残差 的计算,直接计算A R,并充分利用上 一次迭代的结果进行递推。其演算过程如下: =A Y—A≯ )=A (Y-A ( ≠)_。 l,)= 】,一 F y (5) 令 = ≯, = jl,,则G= ATA ],Q: (ATy)T ̄ ,G和Q的值都可以从上一次迭代的值递 推得到,A R=A 】,一GF Q=A Y—GX。需要注意的是每一次迭代过程中字典A也需要更新,即将上次 选中的原子删除。同样 也必需做同样的更新。改进的快速正交匹配追踪快速算法(fast orthogonal matching pursuit,FOMP)见算法2: 算法2改进的快速正交匹配追踪快速算法 第1步输入:字典A,列信号y,误差容限s或稀疏阈值K 12 华东交通大学学报 第3步初始化:设置残差 :=Y,系数 =0,A :=[],G:=[],Q:=[], :=1,product0=A Y 第4步第5步第6步do while(迭代条件成立) q:=max IAWkRI If >1 then 第7步计算c,,,V, ,,,Y, ,然后计算F然后计算~=-。=lI -I l第8步Else 第9步 F一:( ) 第10步Endif 第11步 ≠:=A≠Aq] 第12步G= ATA 】,Q 第 步Ty] X=F Q A R=product0一GX 更新product0 ̄llG 第 步第 步第 步end do 3在稀疏表示的人脸识别中的应用 基于稀疏表示的人脸识别利用测试人身份的稀疏性来进行人脸识别n 。数学表示形式为:l,= ,其 中Y∈R 是测试人脸图像,A∈R ”是用已标识的若干个人的 幅人脸图像形成训练字典,每幅图像有m 个像素点。 =l0,…,0, ,0,…,01 ∈R 是稀疏系数,除了与测试图像对应的系数为非0, 的其他值大 多为0。由于一般情况下,z《m(虽然潜在的情况是 》m), 是非完备字典,高维的图像数据破坏了方 程的欠定性,无法利用现有的稀疏编码算法求解,并且在现实中,噪声或遮挡不可避免,为此改为用 】,= +e来描述,其中e∈R 是 维未知噪声,再将此式变换一下: y=[At][x1=BW 式中:I是单位矩阵, = ∈R ~;W=I _Jl ∈ 题变成求解以下最优化问题,可以用以上的FOMP算法来计算测试样本的表示系数x Wo=argmin l IIo s.t.Y=BW (6) (7) ,此时 + >m,因此基于稀疏表示的人脸识别问 人脸识别问题实际上是一个测试样本的归类问题。获得了测试样本的稀疏表示 后,由于 中的非0 系数是与字典中属于某一样本类的原子相关,根据这些非0系数就可以简单快速判断测试样本所属类别。 但是由于不同样本类的同一光照角度的图像很相似,容易产生误判,另外噪声的存在使得许多小的非O项 和多个类别相关,因此我们需要设计一个更精确的分类器。具体做法是:将 中某样本类的系数保留,其 他样本类的系数清0,然后计算测试信号的非线性逼近误差值,最后比较所有样本类的误差值,最小的非线 性逼近误差所对应的类即是测试样本归属的类。 4实验与参数设置 以Yale B人脸库 l(the yale face database B)做人脸识别实验,选用10个人某种姿势下的64种不同光 照条件下的640幅图片,每幅人脸图片大小为84×96像素,对图片进行了直方图均衡化及归一化处理,实 验中选取每个人的一部分图片形成训练字典,随机选取其他的图片做测试样本。所选用的机器是Dell笔 记本电脑,Genuine Intel CPU 1.66 GHz,1 G内存。 第1期 郑轶,等:稀疏表示的人脸识别及其优化算法 1)两种算法的对比。为了对比经典的OMP算法与改进的OMP算法的优劣,我们为每样本类选择15 个光照图片,选择的原则是尽量考虑各种光照角度的图片,从而构建一个大小为8064×8 214的训练字 典。随机选择不在字典中的300幅人脸图片用于测试,设置稀疏阀值从5变化到5O,在相同条件下应用这 两种算法进行人脸识别实验,分别记录下两种算法平均100幅人脸识别时间以及对应的识别率。所得到的 曲线图如图l所示。 由图1可知,改进的FOMP算法100幅人脸识别时间少于经典OMP算法,并且随着稀疏阀值的增加, 两种算法的人脸识别时间的差距加大,当稀疏阀值 =50时,两种算法的100幅人脸识别时间相差达到14 秒多。 2)影响识别率的主要因素。在实验中我们发现增加稀疏阀值,相应地人脸识别率随着提高。图2是 设置字典大小为8 064×8 214(每样本类15张图片),并给测试图片增加不同比例椒盐噪声的情况下,人脸 识别率也随稀疏阀值的变化曲线,由图2可知,在稀疏阀值较小时,增加稀疏阀值可明显提高识别率,但稀 疏阀值增加到一定值时(如 >15),识别率趋于稳定,分析其原因可知字典中每样本类的原子数目决定了 稀疏阀值的设置。 100 98 篓96 …_。警 鲞94 无噪声识别率曲线 ——40%噪声的识别率曲线 30%噪声的识别率曲线 92 …一55%噪声的识别率曲线 90 ..L.................—L.................J...................I..................L.............-J 10 20 30 40 50 60 稀疏阀值 图1 FOMP算法与OMP算法运行速度的对比 图2不同噪声下人脸识别率随稀疏阀值的变化情况 Fig.1 The speed comparison between the Fig.2 Face recognition rate changes with the sparse OMP algorithm and the FOMP algorithm threshold under diferent noise 为了进一步提高人脸识别率,需对训练字典进行调整。为每个样本类提供各种角度的光照图片,特别 是极端光照条件下的人脸图片,能明显提高人脸识别率,见图3(a)。图4是设置稀疏阀值为20,分别为测 试人脸添加10%,30%,55%的椒盐噪声的情况下,人脸识别率随训练字典变化的曲线。由图4可知,在字 典大小达到一定值时(每样本类20幅图片),人脸识别率基本稳定下来,添加了55%椒盐噪声的测试样本的 识别率仍可达到99.5%以上,这远远超过了人类肉眼的识别能力。图3(b)是为测试图像分别添加10%, 30%,55%的椒盐噪声后的图片。从图3可知,噪声达30%及以上的图片,人类肉眼已很难识别了。 由图3和图4可知,在噪声较小的情况下(3O%以下噪声),每样本类的光照图片只需20张,也就是说在 光照变动不超过3O。的情况下,人脸图片是可以完全正确识别的,Yale B人脸库光照的左右变动范围 为一130。-130。,上下变动范围为_4O。~9O。,光照角度并不全,如果补全数据,性能将可以进一步得到提高。 ■■一 (a) 不M角度的光照人脸图片 ■一豳 (b) 添加 同噪声的人脸图片 训练字典中每类的原子数/个 图3训练图片和测试图片 图4不同哚声下人脸识别率随训练 字典大小的变化情况 Fig.3 training picture and testing picture Fig.4 Face recognition rate changes with the size of dictionary under different noise 华东交通大学学报 2012正 5结论 研究提出了一种改进的FOMP算法,此算法是将重量级的矩阵求逆或大矩阵乘积运算转变为轻量级 的向量运算或向量矩阵运算,从而提高了算法的运算速度。此算法可广泛应用于稀疏分解或压缩重构,特 别适合于人脸识别以及类似的高维数据的分类。将此算法用于人脸识别实验,分析了影响人脸识别率的 因素,通过实验验证了在光照角度的变动不超过30。的条件下,可以实现人脸的完全正确识别。如果进一 步考虑人脸的表隋、姿态等的变化,需要对训练字典的选择做进一步研究。 参考文献: [1]戴琼海,付长军,季向阳.压缩感知研究[JJ_计算机学报,2011,34(3):425—434. [2]李树涛,魏丹.压缩传感综述[ 自动化学报,2009,35(11):1369—1377. [3]杨荣根,任明武,杨静宇.基于稀疏表示的人脸识别方法[Jj.计算机科学,2010,37(9):266—269. [4]TROPP JA,GILBERTAC.Signal recoveryfrom randommeasurements via orthogonalmatching pursuit l Jj.IEEETransac— tions on Information Theory.2007.53(12):4655—4665. [5]WEI E,SHA I.Oghogonal matching pursuit algorithm for compressive sensing[EB/OL].(2008—08—01)l2011-09—01 Jhttp:// www.eee.hku.hk/~wsha/Freecode/freecode.htm. [6]KARABULUT G Z,MOURA L,PANARIO D,et a1.Flexible tree search based orthogonal matching pursuit algorithmlCj// IEEE International Conference on Acoustics,Speech,and Signal Processing,2005:673—676. [7]DEANNA N,ROMAN V Signal recovery from incomplete and inaccurate measurements via regularized orthogonal match— ingpursuit[J].IEEEjournal ofselectedtopicsin signalprocessing,2010,4(2):310—316. [8]刘亚新,赵瑞珍,胡绍海,等.用于压缩感知信号重建的正则化自适应匹配追踪算法[J].电子与信息学报,2010,82(11): 27l3.2717. [9]DO T T,L GAN,NGUYEN N,TRAN T D.Sparsity adaptive matching pursuit algorithm orf practical compressed sensing [C]//AsilomarConference on Signals,Systems andComputers,2008:581—587. [1 0]WRIGHT J,GANESH A,YANG A,et a1.Robust face recognition via sparse representation l J1.IEEE Transactions on Pat— tern Analysis and Machine Intelligence,2009,3 1(2):2 1 0—227. [1 1]GEORGHIADES A S,BELHUMEUR P N,KRIEGMAN D J.From few to many:illumination cone models for face recog— nition under variable lighting and pose[J_.IEEE Trans Pattern Anal Mach Intelligence,200 1,23(6):643—660. Face Recognition Based on Sparse RepresentatiOn and Optimization Algorithms Zheng Yi ,Cai Tijian ’ (1.School of Railway Tracks and Transportation,East China Jiaotong University,Nanchang 3300 1 3,China;2.School of Infor— mation Engineering,East China Jiaotong Universiy,Nanchang 3300 t1 3,China;3.School of Information and Science Engineering, Central South University,Changsha410075,China) Abstract:The essence of sparse representation is the signal decomposition under the constraint of sparse regu— larized.This paper proposes an improved orthogonal matching pursuit algorithm,which would convea the high complexity operations of matrix into the lightweight operation of vector or vector-matrix computing.This im‘ proved method could accelerate the solution of inverse matrix and large matrix multiplication.This paper ap— plies the algorithm to face recognition based on sparse representation,exploring and validating the effect of the sparse valve setting and training of the dictionary on face recognition accuracy and recognition speed. Key words:compressed sensing;face recognition;sparse representation;o ̄hogonal matching pursuit algo rithm;fe:ature extraction 

因篇幅问题不能全部显示,请点此查看更多更全内容