今年以來,“人臉識別”的場景在全國各地遍地開花,出行、安防、金融、消費等各大領域紛紛開始試水,這些創新應用不僅刷新了人們的眼界,還在一定程度上帶來了便捷和新鮮的體驗感。實際上,人臉識別在2000年初就有小范圍的落地應用,主要用在簽到打卡機上,但那個時候人工智能并不是很火,這個領域還沒有進入主流的研究視角。直到2012年左右,人臉識別才從實驗室走到某些行業中來。
近期,人工智能受到的關注度堪比盛夏的高溫,火熱程度一浪高過一浪。今年3月,人工智能被作為戰略發展技術寫入政府工作報告。7月20日,國務院向全國各地方政府及各部委和直屬機構印發《新一代人工智能發展規劃》,提出面向 2030 年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施,部署構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國。種種現狀表明,人工智能將成為繼互聯網+之后的下一個風口。
一、人臉識別模式的不足
目前基于深度學習的人臉識別技術,作為人工智能中重要的一個組成部分,最近幾年以來發展迅速,在公安行業應用不斷深入,其成果頻頻見諸報端。現階段,人臉識別已經成為公安行業科技信息化建設中必不可少的建設內容,從追逃布控、走失人員的尋找、嫌疑人員身份確認到以人臉數據為核心的大數據分析來協助案件的偵破,在公安機關相關工作中發揮了巨大的作用。
但是我們同時也應該看到,目前的人臉識別模式仍然有不足之處,具體表現有兩點:一是現階段的人臉識別對場景要求較為苛刻。如果攝像機的高度、角度、光線等要素無法滿足要求,則識別出的人臉質量會比較差,這樣既無法看清人臉,更無法通過人臉進行人員身份的判斷,因此想要進行人臉識別布控,必須新建能滿足人臉識別的前端點位。二是即使能在一些關鍵部位部署人臉識別點位,但畢竟數量不多,目前還無法達到進行全網布控的效果,公安人員依靠人臉識別系統進行定位和追蹤的效果十分有限。
因此,從深度上來講,人臉識別技術對環境的適應性、識別的準確性仍然有很大的提升空間。從廣度上而言,人臉識別的目標對象需要更加豐富,從單一的對人臉進行識別,可以擴展到除人臉之外的其它人體部位和信息要素的識別,比如體型、衣著、朝向等多種要素,這也是本文主要談的人像識別技術。
二、人像識別的關鍵與流程
在現階段,人像識別技術主要是一種狹義上的定義,指的就是以人臉識別為主的分析和識別技術。而從廣義上來說,人像識別技術是指對包括人臉在內的多種人體部位和信息要素的識別與分析,能形成人員更為全面的特征數據信息,實現對人員的定位查找、身份確認。
人像識別中對人體的識別是關鍵,隨著深度學技術的突破,實踐中我們采用深度學習技術,使用大量的在不同場景下的同一個人的不同姿態、不同穿著的監控抓拍照,利用神經網絡去學習這些圖片數據中人員的身體外形特征,從而實現對人體的跟蹤監測,身體關鍵部位的定位以及人體特征的提取和比對。這些人體監控圖片經過訓練過后的神經網絡,會映射成為一個高維的特征向量,這個向量表示了人體的數學特征,對這個高維向量進行數據計算比對,就能達到對不同場景下同一個人的人體識別。通過對人體的識別,再結合對人臉的識別和特征比對,從而形成特有的人像識別技術。
人像識別的具體流程分為包括以下幾個步驟:
視頻采集:人像系統通過接入實時視頻流,獲取人像數據源。考慮到人像檢測相對耗時,所以輸入的視頻流可以設置成隔幾幀進行一次檢測,這樣就可以使得整個系統數據采集實時性更好。
人像檢測:采用基于深度學習的目標檢測方法,對場景內的人臉和人體同時進行檢測。系統中使用的檢測器是基于通用的Faster R-CNN方法,使用類ZF的網絡結構在ImageNet上進行預訓練,并使用實際監控場景視頻數據進行微調(fine-tune),得到系統中使用的人像檢測器模型。
人像跟蹤:基于檢測器得到的檢測結果,在檢測幀之后,對檢測到的目標框使用跟蹤性能較好的KCF方法進行跟蹤。同時,采用深度神經網絡提取表觀特征,采用一個多維的向量來表示,并對圖像質量進行判斷,對同一個人員輸出一張質量最好的圖像。
特征提取:系統通過對檢測到的人員圖片進行分析,對檢測到的人臉和人體分別進行結構化分析和特征提取。
將人臉與人體的結構化分析和特征信息綜合歸納,形成基本特征(性別、年齡段、種族等)、頭部特征(帽子、發型、眼鏡、口罩等)、體態特征(朝向、速度等)、衣著特征(上衣及褲子的類型、顏色等)、攜帶物特征(是否有包、是否抱小孩、是否打傘等)。
數據關聯:系統將識別到的人員的人臉與人體進行圖像關聯,形成包含人臉與人體的特征數據及其關聯關系的人像數據庫。
采用人像識別技術形成人像數據庫后,對人員的身份識別不僅可以采用人臉特征來完成,而且可以依托更為豐富的人體特征來進行識別,擴大識別范圍。
三、人像識別的應用
人像識別之圖像語義檢索應用
人像識別技術具備非常豐富的人像結構化數據,系統通過人像識別技術對抓拍的人臉、人體圖片進行特征提取分析和識別處理,獲取的人員面部特征及體態特征信息,經過關聯處理后形成海量的人像資源數據。公安人員在對具有某些特征的嫌疑人員進行查找的過程中,可直接使用人像識別技術進行語義檢索,例如輸入“男人、中年、戴眼鏡、背包、短袖”屬性,可在系統的抓拍人像中迅速縮小范圍,定位到目標人員,達到視頻偵查業務中快速找人的目的。
人像識別之行人重識別應用
通過普通監控攝像頭,實現對目標人員的追蹤與識別,這就是人像識別技術中的行人重識別應用模式。公安人員即使只有該人員的視頻監控截圖,從截圖中獲取不到清晰的人臉信息,但只要有完整的人體圖像,仍然可以通過人像識別技術在人像數據庫中對該人體圖片進行檢索,匹配到超過設定閾值,相似度最高的人員。通過這種方式,可以更加全面的分析出目標人員更多的行動軌跡、活動范圍等重要信息。
人像識別之人像關聯應用
上文提到,通過人像識別技術,利用攝像頭捕獲人臉和人體(可以是部分人體)圖像,并建立了人像數據庫。
在人像關聯應用中,可利用人像數據庫中采集的人臉圖片特征進行1:N檢索,從后臺人臉布控庫中匹配超過閾值,且相似度最高的人臉,根據該人臉的身份信息,就確認該人員的身份,并建立“人體采集數據—人臉采集數據—后臺布控人臉數據”的關聯關系,形成人像關聯庫。
當該目標人員再次被監控攝像頭捕捉到,攝像頭即使沒有抓拍到清晰的人臉,但仍然可以將抓拍到的人體圖像通過系統進行特征提取后比對,在人像特征數據庫中進行1:N檢索,檢索到匹配的人體后,進而關聯到后臺人臉數據,從而確認該人員的身份信息。
結語
人像識別技術作為人工智能“AI+安防”中的典型應用模式,彌補了人臉識別系統中只能對人臉進行分析的局限性。在現階段,人像識別的技術還處于研究和探索階段,在國家人工智能發展規劃政策的強力推動下,隨著深度學習技術的不斷發展,人臉和人體的識別信息會更加豐富,結果會更加準確,人像識別技術會越來越成熟和完善。再結合車輛信息、手機WIFI信息,進行多維的數據關聯,建立以人像為核心的綜合人像信息數據庫,利用大數據分析技術,對這些關聯數據進行碰撞分析,挖掘其內在的線索和規律。在社會的各個行業,特別是公安部門,用于布控追逃、嫌疑人的追蹤、走失人員的查找等,一定會充分發揮其實戰價值和意義。