基于稀疏表示的人臉識別算法研究 - 圖文 - 下載本文

基于稀疏表示的人臉識別算法研究

江南大學物聯網工程學院, 江蘇無錫 214122

摘 要:生物特征識別是通過生物傳感器、計算機以及生物統計學原理等,依據人所固有的生理或行為特征對個人身份進行鑒定。而人臉識別是生物特征識別技術中的一個重要分支,在人機交互。安全認證等領域有著廣泛的應用。人臉特征具有唯一性,但是人臉圖像也容易受到各種干擾因素的影響,由此對人臉識別造成一定的影響。在現有的人臉識別算法中,大多數需要進行圖像預處理及復雜的特征提取,選擇何種特征對識別率影響非常大,并且對遮擋、噪聲等情況缺少魯棒性,這些問題往往使得現有的識別方法在應用中受到制約。主成分分析法是人臉識別領域的一個傳統方法。而基于稀疏表示的人臉識別是一個新興且有效的方法,此方法是通過稀疏表示來實現對人臉的識別,具有較高的識別率和較強的魯棒性。本文通過對Yale-B人臉數據庫進行識別測試,可以表明稀疏表示能夠有效的提高人臉識別效果,使識別率高大93%。通過實驗可以證明基于稀疏表示的人臉識別具有可行性,同時能正確識別人臉圖像并提高識別率。

關鍵詞 : 人臉識別; 主成分分析;稀疏表示; 魯棒性; 識別率

Algorithm for face recognition based on sparse representation

College of Internet of Things, Jiangnan University , Wuxi, 214122

Abstract:The biological feature recognition is through the biological sensor,computer and biostatistics,according to personal identity identification of physiological or behavioral characteristics of people inherent.Face recognition is an important branch of biometric identification technology,in human-computer interaction.Security authentication and other fields have a wide range of applications. Facial features is unique,but the face images are also vulnerable to various interference factors,which affect the face recognition.In the existing face recognition algorithm,most of the need for image processing and complex feature extraction,influence the choice of the characteristics of there cognition rate is very high,and the lack of robustness to occlusion,noise and so on,these problems are often makes the existing recognition methods are restricted in application.Principal components analysis method is a traditional method for face recognition.The face recognition based on sparse representation is a new and effective method,this method is through the sparse representation for face recognition,has high recognition rate and robustness.The recognition tests performed on Yale-B face database,may indicate that the sparse representation can improve the recognition rate effectively,and make the recognition rate as high as 93%.The experimental results show that the face recognition based on sparse representation is feasible,and can correct face recognition and improve the recognition rate.

Key words: face recognition; principal component analysis; sparse representation; robustness; recognition rate

0 引 言

信號的稀疏表示并不是新的東西。我們很早就一直在利用這一特性。在信號的數字采樣過程中,如果將數據表示成時間或空間的delta函數之和會給分析帶來很大不便。信號處理技術通常需要更有效的方法來捕獲信號的特征:在識別過程中,需要識別出顯著特征;在去噪過程中需要更有效地分離出信號和噪聲;而在壓縮過程中,則需要用更少的系數來描述大部分的信號。它們都有著一個共同的目標,即簡化信號表示,也就是稀疏化。

在冗余字典上的稀疏表示[1]

是一個迅速發展的領域,目前在很多基礎信號和圖像處理中取得了很好的效果。

隨著社會的網絡信息化程度的不斷提高,人類身份的數字化和隱性化也日趨明顯,隨之而來的關乎信息安全的身份鑒別問題也成為了一個關鍵性的問題[2]

。從上世紀60年代起,人臉識別技術就引起了廣大研究人員的注意,進入90年代以后,隨著安全領域對人臉識別系統的迫切需求,這才是人臉識別的研究真正步入了快速發展的軌道。目前人臉識別的基本方法主要有:整體匹配方法、局部特征匹配方法和兩者的混合算法。

本文提出的一種基于稀疏表示的人臉識別方法,首先利用主成分分析(Principal Component Analysis,PCA)對高維數據進行降維處理,以降維后的訓練樣本構建冗余字典,然后通過L1范數最優化對模型進行求解,求得測試樣本的稀疏線性表示,最后根據稀疏系數的分布按照一定的準則進行目標的分類識別。通過這種稀疏表示可以得到較高的識別率,相比較其他傳統的非稀疏識別方法識別率也有了明顯的提高。

1 人臉識別

1.1 人臉識別介紹

人臉識別即利用人臉部位的特征進行身份識別及判定。利用已有的人臉數據庫,從給定場景圖像或視頻中,通過識別設備確定一個或幾個人的身份。特征又分為人臉的外在特征如眼睛、鼻子等幾何形狀或幾何關系,以及人臉的內在結構關系如通過變換后得到的線性和非線性關系等。

一個通用的人臉識別框架結構圖如圖1.所示,其主要步驟包括:人臉檢測與定位,人臉分析,特征提取和人臉識別。

圖像輸入 人臉檢測/定位

人臉圖像

人臉分析/綜合

特征提取

人臉識別

識別結果

圖1.人臉識別基本框架圖

雖然人臉識別有著其他識別方式無法比擬的優點,但是在實際的應用中也存在很多困難。這些困難主要是人臉作為生物特征的特點所造成的。對人臉識別造成干擾的因素主要包括類間變化和類內變化。其中類間差異主要是指人臉結構造成的差異,這對于人臉搜索和檢測是有利的,但是對于利用人臉區分個體是十分不利的;類內差異主要是指由于成像的外界因素所造成的差異,如光照變化、人的表情、遮擋物等,這些對人臉的區分程度的影響是很大的。

1.2 影響因素及相應的解決方法

經過多年的研究,人臉識別技術在可控環境下取得了很大進步,目前在理想情況下已經能夠取得可以接受的檢測與識別的效果。但是在不可控的條件中,由于受到多種因素的影響,如光照、姿態、表情、遮擋等,人臉識別的效果有明顯的下降。所以無論在理論還是實際應用中人臉識別技術都有待進一步完善。

對于光照變化的問題,基于圖像處理技術的方法主要是從圖像本身處理出發,尋找光照不變或對光照變化不敏感的特征,使得處理后的圖像對不同光

照條件而言是穩定不變的。例如直方圖均衡化[3]

Gamma灰度矯正[4]以及Log變化[5]

等。

對于姿態問題,人類具有在不同姿態下識別人臉的能力,因為他們已經通過無數的閱歷,獲取了不同姿態之間的轉變關系的先驗信息。因此如果知道人類如何獲取這些先驗信息,就可以利用這種原理來進行各種姿態的人臉識別。LLR(Local Linear Regression)局部線性回歸算法就是假設人臉的側面與正面之間存在局部線性關系,通過大量側臉與對應正臉圖像進行訓練尋找這種線性關系,最后這種線性關系由側臉估計對應正面臉,完成識別。此外,基于神經網絡的方法以及光度立體分析也都是目前熱點研究的解決算法。

對于遮擋問題,也已經提出了帶遮擋人臉的支持向量機、尺度不變特征變換(SIFT)、隨機非均勻局部Gabor二值模式等算法。

2 主成分分析法

在信號處理領域,因為原始數據數量很大而且樣本一般都處于一個高維的空間,所以直接對原始數據進行所帶來的計算量和復雜度是十分巨大的。我們通過把原始數據映射或變換到低維來實現數據間的分類,從而得到最能反映樣本內在本質的特征,這個過程就是特征提取。特征提取的基本任務是如何從許多特征中找出那些最有效的特征,特征的選擇和提取的效果很明顯的影響到了分類算法的設計及效果。因此特征提取工作是數據處理領域的一個關鍵性問題,也受到了很多研究人員的重視。 主成分分析法(PCA)是應用最廣泛的一種特征提取算法,它是一種統計學方法,其思想源于K-L

變換,是一種離散的K-L變換[6]

,在信號處理、模式識別、數字圖像處理等領域已經得到廣泛的應用。主成分分析法的基本思想為:通過線性變換找到一組最優的單位正交向量,用它們的線性組合來重建樣本,并使得重建后的樣本和原始樣本的均方誤差最小,這些正交向量就被稱為主元成分。簡單地講,主成分分析法是一種以所有樣本的最優重建(重建誤差最小)為目的的特征提取算法。當我們使用主成分分析法對人臉圖像提取主要特征時,可以令隨機數據變量間的相關性大大減少,以此降低數據間的冗余,使得數據在一個低維的特征空間進行處理,同時保持原始數據的絕大部分信息,從而解決數據空間維數過高的瓶頸問題。主成分分析法的基本數

學原理如下:

假設對向量集合?xi?(其中 i=1,2,...)中的每一個

xi用確定的完備正交歸一化向量系數uj展開,cj為原始信號,(其中j=1,2,...,?),可得如下等式:

x???f?1cjuj (1)

假設只用有限項來估計x,即

x???dj?1cjui (2)

則由此引起的均方誤差為:

??E[(x??x)T(x??x)] (3)

又因為 uT?1j?1iuj???0j?1 (4)

所以 ??E[??j?d?1c2j] (5) 從而使得 cTj?ujx (6) 因此 ??E[??j?d?1uTjxxTuj] (7) 令??E[xxT],則有????Tj?d?1uj?uj (8) 用拉格朗日乘子法,可以求出在滿足正交條件(4)

下,取極值的坐標系統,即用函數

g(u)????Tjj?d?1uTj?uj??j?d?1?j[uj?uj?1]( 9) 對uj,(j?d?1,...,?)求導數,因此有

(???jI)uj?0,(j?d?1,...,?) (10)

令d=0,從而得到以下結論:

以矩陣?的特征向量作為坐標軸來展開x時,其截斷均方誤差具有極值性質,當取d個

uj,(j?1,2,...,d)來逼近x時,其均方誤差為

????j?d?1?j (11)

上式中,?j是矩陣?的相應特征向量。 可以證明,當取d個與矩陣?的d個最大特征值對應的特征向量來展開x時,其截斷均方誤差和在

所有其他正交坐標系下用d個坐標展開x時所引起的均方誤差相比最小。這d 個特征向量所組成的正交坐標系統成為x嵌入在D維空間中d維K-L變換坐標系,向量x在各K-L坐標系上的展開系數向量稱作x的K-L變換。

在人臉識別領域中,最著名的傳統方法為主成分分析法,該方法最早由Sirvovich和Kirby在1987年用于人臉識別[7]。然后,Turk等人在1991年又提出了基于PCA的新的識別方法——基于特征臉的人臉識別方法,將人臉圖像映射到新的特征子空間上進行識別。從這個時期開始,很多的基于PCA的人臉識別方法被提出來,這使得PCA方法被稱為是人臉識別領域最重要和最有效的方法之一。在相當長的一段時期中,雖然PCA技術被廣泛應用與人臉識別技術,但PCA設計的初衷卻是用于低維數據的處理。這也就要求在進行人臉識別的時候,我們首先要將人臉圖像轉換為低維向量,然后在運用PCA方法對其進行分析。這顯然會增加識別的時間復雜度,這也是PCA的缺點所在。后來,Wright J.等人提出了一種新的基于稀疏表示的人臉識別算法,該算法通過衡量各個類中的樣本對測試樣本的貢獻值,最終達到識別的效果[8],通常會將測試樣本表示為訓練樣本的稀疏線性組合[9]。而Xu Y.等人提出的新的稀疏表示方法[10],并證明了“稀疏表示”卻是能夠達到非常高的效率和精準的識別率。

3 稀疏表示算法

人臉識別分類算法是人臉識別技術的一個重要環節,與特征提取算法相比,分類算法的研究范圍更加廣泛同時也更加復雜。人臉的稀疏表示(SRC)是基于光照模型。即一張人臉圖像,可以用數據庫中同一個人所有的人臉圖像的線性組合表示。而對于數據庫中其它人的臉,其線性組合的系數理論上為零。由于數據庫中一般有很多個不同的人臉的多張圖像,如果把數據庫中所有的圖像的線性組合來表示這張給定的測試人臉,其系數向量是稀疏的。因為除了這張和同一個人的人臉的圖像組合系數不為零外,其它的系數都為零。

上述模型導出了基于稀疏表示的另外一個很強的假設條件:所有的人臉圖像必須是事先嚴格對齊的。否則,稀疏性很難滿足。換言之,對于表情變化,姿態角度變化的人臉都不滿足稀疏性這個假設。所以,經典的稀疏臉方法很難用于真實的應用場景。

稀疏臉很強的地方在于對噪聲相當魯棒,相關文獻表明,即使人臉圖像被80%的隨機噪聲干擾,仍然能夠得到很高的識別率。稀疏臉另外一個很強的地方在于對于部分遮擋的情況,例如戴圍巾,戴眼鏡等,仍然能夠保持較高的識別性能。上述兩點,是其它任何傳統的人臉識別方法所不具有的。 3.1 稀疏表示理論思想

稀疏表示(Sparse Representation)理論又被稱為壓縮感知(Compressed Sensing)理論,因為它在理論和實踐中的重大突破,尤其是在計算復雜度的下降和分類效果中的作用顯著提升,使得該理論現在被廣泛應用到信號處理的各個領域。而人臉圖像信號作為一種特殊信息,其本身及其所代表的含義在很多時候都具備“稀疏”這一特點,就是得將稀疏表示理論引入到人臉識別技術成為了一種可能。

Julien Mairal等[11]

于2008年提出了基于稀疏表示的圖像重建算法,他們基于稀疏表示理論對圖像進行去噪工作,并對圖像中小于10?10的區域做修復,取得了良好的效果。Allen Y.Yang和Yi Ma等[12]

結合壓縮感知理論提出了基于稀疏表示的人臉識別算法,其人臉識別的原理為:找到一個由訓練樣本最佳線性表示出原始樣本的稀疏解向量,也就是用最少的訓練樣本完成對待測樣本的最優線性表示。解向量的零元素越多,那么該解向量就越稀疏。如果解向量中只包含某一類的非零系數,那么我們就認為測試樣本就屬于這一類。

此方法的一個特點是并非針對單一樣本或某一類樣本的,而是利用所有訓練樣本進行稀疏表示,可以稱為一種全局方法。此方法具有識別功能,對某個測試樣本,如果其最緊湊的表示稀疏中包含多個類別,那么該測試樣本應該不屬于訓練樣本中的任何一類,這樣就可以將其排除,不用識別;同樣在識別過程中所得的稀疏表示向量能夠體現出訓練樣本中類間的差別,能夠從訓練樣本中選出很少的緊湊的一部分來對測試樣本進行表示,避免了欠擬合和過擬合的問題。

另外一個特點就是對圖像的特征要求較少。一般的人臉識別中,傳統的特征如由主成分分析提取的或由拉普拉斯變化獲取的特征會隨著使用特征數量的增加,而使性能趨于收斂。在稀疏表示中,重要的是特征的數量而不是獲取的過程,只有特征的數量滿足,甚至隨機選擇特征都可以對稀疏向量進行重構。因此,對于稀疏表示方法中利用采樣或隨機特征在識別過程中同樣可以達到較高的識別率。

基于稀疏分解的人臉識別是不需要訓練的,或者說訓練及其簡單。基于稀疏表示的人臉識別,其稀疏表示用的字典直接由訓練所用的全部圖像構成。因為稀疏表示的方法對使用什么特征并不明暗,所以在其訓練過程中只需要把原始圖像數據經過簡單的處理之后排列成一個很大的三維矩陣存儲到數據庫中就可以了。

問題的關鍵在于,當實際環境中來了一張人臉圖像之后,去求解這張人臉圖像在數據庫所有圖像上的稀疏表示,這個求解算法一般是比較耗時的。盡管有很多方法被提出來,但是對于實際應用問題仍然沒法解決。所以,關鍵問題就歸結于L1范數最小化問題。

3.2 基于稀疏表示的人臉識別

基于稀疏表示的人臉識別過程可用圖1來表示,首先對訓練集圖像和測試圖像都進行圖像預處理,并分別提取特征點。然后通過稀疏表示分類最后識別出人臉圖像。

圖1 基于稀疏表示的人臉識別框圖

Fig.1 Block diagram of face recognition based on sparse

representation

目前信號處理領域的研究熱點都是基于過完備字典的稀疏表示理論。所說的過完備字典是一個超完備的冗余函數,其字典中的元素可以稱為原子,信號由原子的基本線性組合構成。不同于常規的字典構造方式,我們將人臉基圖像作為字典的基本元素。所謂的稀疏表示就是在過完備字典A中選擇少量的原子(列向量)來表示信號y,使得解向量x最稀疏。

用第i類人臉樣本構成樣本矩陣

Ai?[vni,1,vi,2,...,vi,nii]?Rm?,其中m為特征維數,

ni為i類樣本數量。那么屬于i類測試樣本y?Rm課

表示為:

y??i,1vi,1??i,2vi,2?...??i,nivi,ni (12)

其中系數

?i,j?R,

j?1,2,...,ni。

由式(12)進而可以構造出一個完備向量矩陣A:

A?[A1,A2,...,Ak]?[v1,1,v1,2,...,vk,nk] (13)

此時屬于i類樣本的測試樣本y可重新表示為:

y?Ax?Rm (14)

其中

x?[0,...,0,?i,1,?i,2,...,?i,ni,0,...,0]T?Rn,n

為第i個人臉的樣本數量。當式(14)中的字典A樣本數量足夠多時,就能通過最小L1范數求得y的一個稀疏解,并且樣本越多解向量x就越稀疏。即, ? x1?argmin||x||1 subject to y?Ax (15) 對于特定的人臉數據庫,假設其中包含L個人,

也就是說該數據庫有L個類,每個類中有n個樣本。首先,我們按照一定的標準,將每個類中的人臉圖像分成訓練樣本和測試樣本兩部分。這樣整個數據庫就被分為了訓練樣本集和測試樣本集,分別記為

X?[x1,x2,...,xm]和Y?[y1,y2,...,yn]。其中xi和

yi均為一個人臉樣本所張成的單位列向量[13]。

對于任意的測試樣本y?Y,首先將其表示成所有訓練樣本的線性組合:

y?a1x1?a2x2?...?amxm (16)

令A?[a1,a2,...,am]T,則上式可以簡化為:

y?XA (17)

否則,

A?(XTX??I)?1XTy (18)

其中,?是一個很小的正常數,I為單位矩陣。 這樣就可以求得測試樣本的分類,從而進行人臉的識別,獲得較高的識別率。

4 實驗結果及分析

本文實驗所用的人臉庫為Yale-B人臉數據庫(圖





pk10冠军百期错一 云南时时彩官网平台 秒速时时彩计划公式 广西快3走势图一定牛 浙江体育彩票舟山飞鱼 青海快3走势图表 子基金配资 一汽富维股票 江西十一选五计划软件 辽宁35选7开奖结果走势图 推荐股票分成是真是假 黑龙江福彩p62走势图 弘业股份股票 广西体彩十一选五舍部 黑龙江6十1开奖号码 中金e配 吉林快三全部玩法