臺灣人臉識別技術的研究始于90年代末期,但直到2005年后期一些安全應用的人臉識別系統才開始進入市場。人臉識別核心技術的發展對臺灣安防產業來說算是一個相當重要的技術發展環節,雖然現在人臉識別率已達到90%以上,但周邊環境的變化依然是技術應用的最大問題。
3D感測成主流技術
2D人臉識別技術已經走到瓶頸,這兩年3D人臉識別技術開始冒出,目前較常見的3D感測技術有下列四種:
1、立體視覺(Stereo Vision):透過2個相機模塊拍攝影像,進行三角測量法等運算取得物體距離,是四者中唯一只需RGB相機模塊而不用IR(紅外線)模塊的技術。由于需進行影像運算,通常需要一個額外影像運算芯片輔助,因此有些芯片廠商會推動這項技術。
2、結構光(Structured Light):原理是對目標打出光條紋,再透過打出去的光紋變化來計算形狀和距離,較常見于工業檢測和研究用途。隨著IR發展,Structured Light技術也能透過IR發射光紋,所以基本零組件包括IR發射器、IR相機模塊與RGB相機模塊。
3、光斑圖案編碼(Light Coding):曾被微軟應用在第一代Kinect體感攝影機,其原理是IR雷射發射后會經過光柵,將光平均分布在測量空間中,再透過IR相機記錄每個空間的雷射散斑,設備上需要IR發射器、IR相機模塊與RGB相機模塊。
4、飛行時間測距(Time of Flight,簡稱TOF):為微軟并購的3DV Systems,也是第二代Kinect采用的技術。其原理是透過IR雷射發射,獲得空間中每一點達到觀測點的時間,進而推算出距離,得出3D景深圖。因此需要IR發射器和接收器,并配合RGB相機模塊和感光組件或感應數組。
Stereo Vision和Structured Light都需要圖像分析運算,但Stereo Vision的軟件運算較繁雜,不適合大量多點感測,且光源和鏡頭間的基線長度也得拉長,整體而言并不適合用于3D感測。
相對地,TOF可記錄每個觀測點的時間數據后再進行計算,Light Coding也只需轉換各區域散斑以計算距離,復雜度較低;不過這兩項技術均需IR發射和接收器,也另外需要內存甚至操作數件,故成本較高。此外,兩者的運算原理不同,TOF單點IR只需記錄時間,理論上會比Light Coding先分析散斑圖形再運算來得簡易;而Light Coding是將整個畫面切割測距,要得到概略景深圖較容易。整體而言,TOF的反應速度和精準度最佳,而Light Coding在不需要精細景深圖時的表現較平均,Stereo Vision的成本則較低。
雙技術結合 各有利弊
近年許多人臉識別軟件公司紛紛提出人臉識別結合RFID或Beacon、指紋等相關技術,利用雙重關卡防止誤判或提升辨識速度,但卻忽略了使用人臉識別的主要初衷——原就是不需再攜帶其他身分驗證裝置,故各有利弊。以目前手機App廣泛使用人臉偵測(Face Detection)及特征擷取(Feature Extraction)這兩類服務來說,最常見的就是修圖軟件或是影片屏蔽的應用,許多公司都有提供在線的Web API供大家開發,在行動裝置上亦提供iOS及Android系統的SDK,算是非常普遍的技術支持。