人臉識別有多牛?AIFR 技術分分鐘讓你變“明星”
原創(chuàng)【51CTO.com原創(chuàng)稿件】近日,經常被類似“你最像哪位明星?”、“預測你未來的樣子”、“看看你們的年齡差?”…..這樣的一些基于臉部比對的照片刷屏。
圖[1]
如圖[1]是 “你最像哪位明星?”小應用制作出來的對比照,看到這個對比過程,你肯定比較好奇這背后用到了哪些技術,能想到的就是人臉識別、美顏。但具體細節(jié)就……下面是專業(yè)人士給出的正確姿勢,給同樣感興趣的小伙伴們答疑解惑!
人臉識別技術的基本流程
當下,人臉識別技術的細節(jié)多到數(shù)不清,工程技巧也是多種多樣,但基本流程已成定式:當輸入某張人物照,利用人臉檢測技術找到人臉位置,在這基礎之上對關鍵點,如眼睛、嘴巴等定位,之后經過一些幾何、光學手段的校正等,提取人臉特征,進而做到人臉識別。
各個公司間的差異在于關鍵提取的數(shù)量相,從幾個點到近百點、以及各個環(huán)節(jié)在細節(jié)上的一些追求。
“你最像哪位明星?”這張圖,圖一到圖二,用到的是人臉檢測技術,基于一些算法,把人臉定位提取,也涉及到一小部分關鍵點的檢測技術。這個過程中,如何識別出照片,在不同年齡段的面部圖像是值得考究的點。
人臉識別中的年齡不變在學術界被稱為 age-invariant face recognition(AIFR),AIFR 技術能夠識別出同對象同齡段的臉部圖像。
無視年齡變化,AIFR技術的應用
面部特征隨著年齡的增長產生變化
人的面部特征隨著年齡的增長會產生非常明顯的變化。從圖形學的角度來看,這種變化可以分為輪廓變化和紋理變化。
輪廓變化,指五官和臉型的空間位置和結構特征產生了變化。如嬰兒的臉型普遍偏肥,輪廓平滑圓潤;成年后,則發(fā)展成鵝蛋臉、國字臉和瓜子臉等更加豐富的臉型,五官也變得更為立體。
紋理變化,指人臉皮膚表面的膚質感產生了變化。嬰兒皮膚圓潤、細嫩、平滑,而成人皮膚則往往更加粗糙,多皺紋。
這些輪廓和紋理的變化,往往連人類自身也無法準確理解。今天得益于人工智能技術的發(fā)展,AIFR 技術已逐漸成熟。
AIFR技術的兩大模型
目前,AIFR 技術方向繁雜,但總體上可分為生成模型和判別模型兩種:
生成模型
生成模型的基本思想是假設人臉隨年齡的變化過程具有一定規(guī)律,然后通過數(shù)學方法去求解變化規(guī)律本身。在洞悉規(guī)律后,算法即可通過某一年齡的面部特征,生成其他年齡的面部特征。
以圖[1]為例,具體實現(xiàn)步驟為:
- 分別抽取人臉輪廓特征 S 和紋理特征 T
- 進行校正和均化
- 對面部特征分別建立數(shù)學模型并求解模型參數(shù),獲得生成模型
- 輸入待預測人的面部特征
- 使用生成模型預測此人其他年齡的面部特征
- 將輪廓特征和紋理特征重新合并
- 與實際未來面部進行對比,即可知道是否為同一人或是相似的人
判別模型
判別模型與生成模型不同,判別類模型不尋求解決人臉的變化規(guī)律問題。判別模型假設有一部分人臉特征是不隨年齡而產生變化的,使用這類年齡無關的特征去判斷人臉的身份。
圖[2]
圖[2]顯示了深度學習技術實現(xiàn)了非齡特征的抽取。
第一列是同一個人在不同年齡的照片 S1,S2,S3
通過卷積神經網絡,系統(tǒng)使用固定的特征臉組合 S' 來代表原圖
例如:
特征臉組合再進入如隱藏因子分析器后,只選擇了最接近這張?zhí)卣髂樀慕M合。
例如:
可以看出,第三列人臉相似度已經非常高了。
刷臉時代來了:人臉識別技術的典型應用
除了上面提到的小應用,現(xiàn)在人臉識別的用途越來越廣,各行各業(yè)都在嘗試用人臉識別提升客戶體驗、優(yōu)化服務水平,不過總結起來主要有兩大類:人臉身份識別和人臉身份認證。
二者表面看起來比較接近,但它們的技術原理并不相同:人臉身份識別是從一堆人里識別出你是誰,人臉身份認證是確認你是不是本人。比較典型的應用如下:
人臉身份識別
- VIP人臉識別。這個應用可以自動在人群中捕捉 VIP 客戶,并識別出其身份,同時可以語音歡迎并經后臺通知相關工作人員;
- 人臉黑名單。這個應用可以在重點通道設置人臉黑名單,自動識別重點嫌疑人等,一旦發(fā)現(xiàn)即可自動報警。
人臉身份認證
- 金融行業(yè)。該領域的應用比較多,包括刷臉登錄、遠程人臉開戶、自助人臉開卡等等,最早大規(guī)模應用人臉識別的是民生銀行,在 2014 年初開始布局人臉識別平臺,將人臉識別應用于營業(yè)廳、自助設備、柜臺系統(tǒng)以及移動營銷等。
這些是做身份認證的輔助手段,以往無論是在何種應用場景,身份認證只有兩種模式:人工比對身份證和本人,容易出現(xiàn)比對標準不一致的情況;只認證身份證,容易出現(xiàn)冒用、盜用他人身份證的問題。而人臉識別很好地解決了這些問題。
- 社保行業(yè)。比較典型的就是遠程資格認證,以往為了證明參保人員的生存狀態(tài),需要工作人員實地進行資格認證,對于那些年齡大、出行不便和距離遠的異地參保人員就特別不方便。
而人臉識別可以通過遠程進行人臉身份認證,不過為了防止照片作假,一般會加入活體檢測的環(huán)節(jié)。
- 教育行業(yè)。主要是高考、成人考試、人事考試等,借助指紋識別、人臉識別等生物識別技術確認考生身份,可以確保人證合一,保證考試的公平性。
人臉識別仍存在安全隱患
人臉識別并不萬能,技術的背后仍存在風險和漏洞,比如仿真頭套、全息投影、人臉跟蹤等的不斷出現(xiàn),單一的人臉識別技術存在很大的局限性,安全系數(shù)和科技成分并不成正比。
因此,在涉及隱私、支付等高級別安全場景使用時,一定注意將人臉與聲紋、指紋、虹膜及其他生物認證信號相融合,而不是單一的采用人臉識別技術,這樣安全的系數(shù)就會大大提升。
參考資料:
[1]Park U, Tong Y, Jain A K. Age-invariant face recognition[J]. IEEEtransactions on pattern analysis and machine intelligence, 2010, 32(5):947-954.
[2]Wen Y, Li Z, Qiao Y. Latent factor guided convolutional neural networks forage- invariant face recognition[C]//Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition. 2016: 4893-4901.
李季
CloudIn云英產品經理
澳大利亞 University of Wollongong 計算機系碩士,曾在計算機世界、長河網信等公司出任產品經理和運營經理,有 8 年產品經驗,現(xiàn)就職于北京云英傳奇技術有限公司任大數(shù)據(jù)產品經理。在深度學習和機器視覺領域主導過公安和網信辦相關的多個項目,希望通過人工智能技術為社會創(chuàng)造更多價值。
【51CTO原創(chuàng)稿件,合作站點轉載請注明原文作者和出處為51CTO.com】