- 相關(guān)推薦
人臉信息技術(shù)應用新熱點(diǎn)淺析
摘要:用機器進(jìn)行人臉圖像處理的研究至今已經(jīng)有四十多年的歷史了。在此期間,人們提出了許多具備一定應用前景的算法,商業(yè)市場(chǎng)上也出現了許多有實(shí)用價(jià)值的產(chǎn)品。本文分為三個(gè)部分,第一部分簡(jiǎn)要介紹人臉信息技術(shù)的相關(guān)背景知識;第二部分簡(jiǎn)單分析人臉信息技術(shù)專(zhuān)利申請的整體情況;第三部分對近年來(lái)人臉信息技術(shù)的主要應用熱點(diǎn)進(jìn)行分析。
關(guān)鍵詞:人臉;算法;專(zhuān)利;圖像處理
一、人臉信息技術(shù)
所謂的人臉信息技術(shù)主要包括人臉檢測和人臉識別兩大部分。
1.1 人臉檢測
人臉檢測是指在圖像上檢測人臉是否存在,若有則應判斷出人臉的位置及大小。在各種應用的推動(dòng)下,進(jìn)入上個(gè)世紀九十年代后,人臉檢測技術(shù)逐漸得到了各國研究人員的重視,各種更加有效的算法不斷提出。這十幾年的發(fā)展歷程大致可分為兩個(gè)階段:1999 年以前,基于各類(lèi)知識特征的方法是主導,這類(lèi)方法直觀(guān)易懂、實(shí)現簡(jiǎn)單,但最大的問(wèn)題是魯棒性不強;1999年以后,基于統計學(xué)習的算法占據了主流地位,隨著(zhù)神經(jīng)網(wǎng)絡(luò )、SVM、概率模型等算法的提出,基于統計學(xué)習的算法在魯棒性上得到了很大提高,效率上也可基本滿(mǎn)足實(shí)時(shí)應用的需要。隨著(zhù)相關(guān)研究的深入,人臉檢測技術(shù)在可控環(huán)境下(光照均勻、姿態(tài)端正、背景簡(jiǎn)單),已能獲得可供實(shí)用的檢測率。
1.2 人臉識別
計算機人臉識別技術(shù)是一門(mén)應用技術(shù), 它涵蓋信號處理、數字圖像處理、計算機視覺(jué)、模式識別等多門(mén)學(xué)科的理論知識。由于計算機人臉識別技術(shù)的核心內容是由已知人臉來(lái)確定未知人臉的歸屬問(wèn)題, 因此, 它更應該認為是模式識別的范疇。
它基本上可分為兩個(gè)方面:
一是回答“是不是某人? ”的問(wèn)題, 它是給定一幅待識別人臉圖像, 判別它是否是某人的問(wèn)題, 也就是通常所說(shuō)的身份驗證(A uthentication), 它是個(gè)“ 一對一” 的兩類(lèi)分類(lèi)問(wèn)題;
另一個(gè)是回答“ 是誰(shuí)? ” 的問(wèn)題, 它是給定一幅待識別人臉圖像, 判斷它是誰(shuí)的問(wèn)題, 通常所說(shuō)的人臉識別就是個(gè)“ 一對多”的分類(lèi)問(wèn)題。
對計算機人臉識別方法的研究主要有兩大方向:
一是基于人臉圖像部件特征的識別方法;
二是基于人臉圖像整體特征的識別方法。主要包括基于特征臉的識別,基于最佳鑒別矢量集的人臉識別,基于Bayesian臉的人臉識別,基于傅里葉不變特征的人臉識別,基于彈性圖匹配的人臉識別以及基于神經(jīng)網(wǎng)絡(luò )的人臉識別等。
近年來(lái),隨著(zhù)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,移動(dòng)終端設備、交互式家庭影音設備的不斷升級換代,人臉信息技術(shù)有了更為廣闊的應用平臺和創(chuàng )新空間。
二、人臉信息技術(shù)專(zhuān)利的整體分析
全球專(zhuān)利申請量趨勢:
經(jīng)過(guò)檢索,截止到2014年12月31日,在德溫特專(zhuān)利數據庫(DWPI)中共檢索到7176項基于人臉信息技術(shù)的專(zhuān)利申請。
早期階段,從1995年至2004年,每年的專(zhuān)利申請量都不大,筆者認為,主要是由于早期計算機硬件,特別是攝像頭技術(shù)還不發(fā)達,盡管研究人員在算法支持方面已經(jīng)做出了很多的努力,但人臉信息技術(shù)還沒(méi)有得到較好的應用平臺。從2005年開(kāi)始,該領(lǐng)域申請量出現持續快速地增長(cháng),并在2008年達到最高峰。這個(gè)過(guò)程正是中國專(zhuān)利申請量迅速上升的階段,后面的統計分析也將證明,中國是該領(lǐng)域的非常重要的專(zhuān)利產(chǎn)出國。到了2010年,該領(lǐng)域的專(zhuān)利申請量又有了小幅的回落,但盡管如此,該領(lǐng)域的申請量近年來(lái)還是保持著(zhù)較高的,穩定的數量。并且由于專(zhuān)利申請公開(kāi)的時(shí)延性,導致近幾年的統計數據并不完整。
根據分析發(fā)現,隨著(zhù)以移動(dòng)互聯(lián)網(wǎng)技術(shù)為代表的計算機技術(shù)的發(fā)展,出現了大量的,各種形式的人機交互技術(shù),而許多的人機交互技術(shù)正是基于人臉信息技術(shù)實(shí)現的,因此人臉信息技術(shù)的應用必將越來(lái)越廣,對該技術(shù)的研發(fā)將保持持續的熱度,該領(lǐng)域的專(zhuān)利申請量也將繼續保持穩步增長(cháng)的狀態(tài)。
三、人臉信息技術(shù)專(zhuān)利應用新熱點(diǎn)
隨著(zhù)硬件設備的不斷升級,移動(dòng)互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人臉信息技術(shù)有著(zhù)更廣闊的應用平臺與創(chuàng )新空間,近年來(lái)該領(lǐng)域的專(zhuān)利申請也呈現出許多新的創(chuàng )新熱點(diǎn)。鑒于在人臉信息技術(shù)領(lǐng)域,日韓企業(yè)的申請量占主導地位,優(yōu)勢明顯,我們接下來(lái)將以索尼和三星電子三兩大公司為例,分析這三家公司申請日在2010年至2014年間該技術(shù)領(lǐng)域的專(zhuān)利申請,結合各公司的整體發(fā)展戰略,淺析人臉信息技術(shù)中的新熱點(diǎn)。
3.1 表情識別
在算法層面,主要是在檢測到的人臉基礎上,對人臉進(jìn)行特征提取,得到反映表情特征的關(guān)鍵信息,對得到的表情特征向量進(jìn)行分類(lèi),從而得到所屬表情類(lèi)別。在應用層面,典型的表情識別技術(shù)應用如下:
以申請CN201310059339為例(發(fā)明名稱(chēng):圖像處理設備和方法以及程序,申請人:索尼公司),該圖像處理設備包括臉部檢測單元,所述臉部檢測單元根據輸入圖像檢測臉部;評估值計算單元,所述評估值計算單元針對由臉部檢測單元檢測到的臉部的每一種臉部表情計算表示臉部表情的程度的評估值;和控制單元,所述控制單元基于由臉部檢測單元檢測到的臉部的每一種臉部表情的人的數量和由評估值計算單元計算出的臉部的每一種臉部表情的評估值,改變用于提取圖像的基準,從而容易地提取包括少數人具有的臉部表情的圖像。本申請主要解決的問(wèn)題為,即使當多個(gè)被圖像捕捉的人的臉部表情不同時(shí)也獲得具有高滿(mǎn)意程度的圖像。
以申請CN201310393418為例(發(fā)明名稱(chēng):將音頻和/或圖像與臉部特征和表情相關(guān)的系統和方法,申請人:索尼公司),系統先識別出至少一個(gè)觀(guān)看者的表情,指令使處理器將標識內容的元數據與觀(guān)看者的至少一個(gè)表情關(guān)聯(lián)。該申請可為內容提供商提供更有效的手段以確定他們提供的內容是否使觀(guān)看者滿(mǎn)意和/或確定觀(guān)看者對他們的內容的反應的種類(lèi)。由于照相機與諸如計算機和電視機(TV)的整合已經(jīng)為內容提供商提供了利用此整合實(shí)現諸如此類(lèi)目的的機會(huì ),此類(lèi)目的包括有針對性的廣告投放、提高觀(guān)看者對節目的滿(mǎn)意度等等。
3.2 身份分組
身份分組是通過(guò)提取到的人臉特征信息,根據特征信息得到到對應的身份分組,在此基礎上再提供進(jìn)一步的應用服務(wù)。
以申請CN 201210318981為例(發(fā)明名稱(chēng):以言語(yǔ)方式進(jìn)行交流的面部響應電視設備,申請人:索尼公司),本發(fā)明所教導的電視設備以個(gè)性化的會(huì )話(huà)方式與用戶(hù)進(jìn)行言語(yǔ)交流。該交流是響應于攝像機收集的圖像信息進(jìn)行的,其中,該攝像機與電視中執行圖像處理(例如,包括面部辨認)以識別靠近電視的個(gè)人觀(guān)看者和觀(guān)看者群組的計算機相連接。該系統不僅確定人是否位于電視裝置附近,而且實(shí)際上對這些人的身份進(jìn)行確定,并且交互地利用此信息來(lái)生成個(gè)性化的言語(yǔ)輸出。
3.3 基于人臉位置進(jìn)行圖像裁剪
以申請CN201410003848為例(發(fā)明名稱(chēng):用于在具有相機的裝置中處理圖像的設備和方法,申請人:三星電子株式會(huì )社),本申請提供一種當使用具有相機的便攜式終端或相機裝置進(jìn)行拍攝時(shí)通過(guò)識別人的臉部區域并以識別的臉部區域為中心設置裁剪區域來(lái)裁剪人物照片的設備和方法。本申請還提供了一種在照片中包括多于一人的情況下,通過(guò)設置裁剪區域來(lái)裁剪照片,從而每個(gè)人的臉包括在裁剪區域中的設備和方法。
3.4 根據人臉位置確定人體其他部分的位置及姿勢
由于人臉特性相對于身體其他部位更為突出,更易于檢測,因此在圖像中檢測到人臉后,可以根據人臉與身體其他部位的位置關(guān)系,確定人體其他部位的位置及姿勢。
具體應用示例如下:
以申請CN 201210318981為例(發(fā)明名稱(chēng):以言語(yǔ)方式進(jìn)行交流的面部響應電視設備,申請人:索尼公司),通過(guò)檢測圖像的面部區域、根據面部區域的位置設置至少一個(gè)動(dòng)作區域、將與至少一個(gè)動(dòng)作區域相對應的圖像數據與檢測信息進(jìn)行比較以便確定是否已經(jīng)執行預定動(dòng)作、以及當確定已經(jīng)執行預定動(dòng)作以及接收合作控制信息時(shí)基于合作控制信息而實(shí)行預定處理,實(shí)施設備以及方法。本申請提供的方法,先對人臉進(jìn)行檢測,在檢測到人臉位置的基礎上,再確定如人手之類(lèi)的其他身體部位的位置,從而降低目標識別的計算量。
四、結語(yǔ)
眾所周知,近幾年來(lái),索尼與三星電子在核心產(chǎn)品線(xiàn)上發(fā)展戰略各有側重,相對于三星電子在移動(dòng)終端設備方面表現出的強勁勢頭,索尼的核心產(chǎn)品線(xiàn)更廣泛,包括數碼相機,游戲機,影音產(chǎn)品等。而無(wú)論是移動(dòng)終端設備,數碼相機還是游戲機,人臉信息技術(shù)都得以廣泛的應用,人臉信息技術(shù)出現的新熱點(diǎn),一定程度上反映了兩家公司在產(chǎn)品線(xiàn)研發(fā)布局上的思路。對于上述幾種新熱點(diǎn)應用方向,筆者比較了兩家公司在DWPI庫中關(guān)于各方向的申請量,從相關(guān)數據中不難發(fā)現,索尼和三星電子兩家公司對于上述熱點(diǎn)技術(shù)的側重還是略有不同,索尼公司在涉及圖像運動(dòng)檢測方面申請量更大,而三星公司在表情識別方面的申請更多。筆者認為,這也從側面反映出兩家公司的研發(fā)重點(diǎn),由于索尼公司在數碼相機和游戲機方面的表現更為突出,相應地,在這兩種產(chǎn)品上應用較多的運動(dòng)檢測和運動(dòng)跟蹤的申請更多;而表情識別技術(shù)更廣泛地應用于移動(dòng)終端設備,因此三星公司在這方面的專(zhuān)利申請更多。
綜上所述,科研人員在算法和應用層面都不斷取得突破性的進(jìn)展,人臉信息技術(shù)在未來(lái)有著(zhù)廣闊的發(fā)展前景,人臉信息技術(shù)的專(zhuān)利分析是計算機視覺(jué),安防系統,通信技術(shù)等領(lǐng)域科研人員都值得關(guān)注的課題。
【人臉信息技術(shù)應用新熱點(diǎn)淺析】相關(guān)文章:
淺析新資產(chǎn)減值準則的變化及實(shí)在務(wù)應用02-28
電子信息技術(shù)的應用與發(fā)展趨勢淺析11-18
信息技術(shù)在小學(xué)語(yǔ)文教學(xué)中的應用淺析03-14
淺析新資產(chǎn)減值準則的變化及其實(shí)務(wù)應用03-24
淺析信息技術(shù)在中學(xué)物理實(shí)驗教學(xué)中的應用03-15
淺析PGP軟件及其應用03-20
淺析力學(xué)在機械中的應用05-19
淺析硬盤(pán)播出系統的應用及維護03-18
淺析“板塊模式”的理論及應用12-10