英國劍橋大學(xué)、印度理工學(xué)院和印度科學(xué)理工學(xué)院的一組研究人員發(fā)布研究論文指出,即使是用頭巾、帽子和墨鏡遮擋了面部,軟件仍然可以將人正確識(shí)別出來。
DFI系統(tǒng)識(shí)別面部特征該研究描述了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network)能被訓(xùn)練成所謂的偽裝面部識(shí)別(Disguised Face Identification,簡稱DFI)系統(tǒng)。
英國劍橋大學(xué)工程學(xué)院的阿瑪賈特·辛格周二向外媒透露,DFI系統(tǒng)有助于執(zhí)法機(jī)構(gòu)識(shí)別罪犯,這也是他們研究的主要目的。
研究人員通過數(shù)百張用墨鏡、胡子和頭盔偽裝面部的圖片訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。研究人員在每張照片中識(shí)別出14個(gè)點(diǎn):10個(gè)點(diǎn)標(biāo)記記憶眉毛和眼部區(qū)域,1個(gè)點(diǎn)記憶鼻子,另外3個(gè)點(diǎn)記錄嘴唇。所有點(diǎn)連在一起創(chuàng)建“星形網(wǎng)狀結(jié)構(gòu)”。研究人員分析網(wǎng)絡(luò)中點(diǎn)與點(diǎn)之間的距離和角度了解面部結(jié)構(gòu)。
值得注意的是,系統(tǒng)經(jīng)過訓(xùn)練從模糊面部像素中識(shí)別標(biāo)記,學(xué)習(xí)如何處理遮擋的面部并從中創(chuàng)建“指紋”。
這個(gè)面部“指紋”之后能用來掃描更大的數(shù)據(jù)庫——DFI機(jī)器學(xué)習(xí)系統(tǒng)中的圖片數(shù)據(jù)庫,例如滋事者的駕照圖片或面部照片,并進(jìn)行匹配。換句話講,借助這種訓(xùn)練模型,顯示監(jiān)控錄像的剪裁圖片,系統(tǒng)會(huì)將14個(gè)標(biāo)記置于遮擋的面部,再將這種標(biāo)記模式用于匹配數(shù)據(jù)中的面部。
這種技術(shù)仍在實(shí)踐當(dāng)中,目前仍是PoC。
研究人員在訓(xùn)練中使用了上千張不同程度遮擋的面部照片。 雖然辛格希望系統(tǒng)對(duì)警方有幫助,但專制政權(quán)也可能利用這種技術(shù)針對(duì)無辜平民、合法的抗議者等。
欺騙AI識(shí)別有效數(shù)據(jù)輕而易舉
雖然這個(gè)計(jì)算機(jī)視覺系統(tǒng)的精準(zhǔn)度對(duì)早期研究有幫助,但在實(shí)踐層面的效果可能不盡人意。背景中的建筑物和物體會(huì)將精準(zhǔn)度從85%降低到56%。
面部越模糊,識(shí)別難度就越大。同時(shí)使用帽子、頭巾和墨鏡等遮擋面部,精準(zhǔn)度可能會(huì)降至43%。
實(shí)驗(yàn)與真實(shí)應(yīng)用的巨大差距更為現(xiàn)實(shí)的是,所有訓(xùn)練的圖片都是對(duì)著攝像頭拍攝的清晰圖片,然而監(jiān)控錄像中的圖像通常比較模糊。
另外,還有一個(gè)不容忽視的事實(shí):類似V字仇殺隊(duì)(V for Vendetta)中的全副武裝總能起到愚弄的完美效果。
辛格還表示,由于成本昂貴,訓(xùn)練數(shù)據(jù)集也相當(dāng)有限。當(dāng)前的數(shù)據(jù)集有10種偽裝打扮,主要為印度人和高加索人。辛格指出,需要擴(kuò)大數(shù)據(jù)范圍強(qiáng)化DFI系統(tǒng)的有效性。
到目前為止,DFI還只是一個(gè)實(shí)驗(yàn)系統(tǒng),需要訓(xùn)練更多圖片以便更精準(zhǔn)地識(shí)別面部標(biāo)記,這就要求更高效的算法和代碼。
研究人員目前仍在繼續(xù)這項(xiàng)研究。