當前情感技術正處于發展中,目前較為常見的情感識別有以下三種:
一是基于人的臉部特征的微表情識別,通過輸入人臉圖像或者視頻流進行檢測,通過心理學面部行為識別符號來映射人像的內心活動,與一般監控視頻抓拍不同,微表情的識別對象是0.2秒內發生的瞬間標簽,同時需要采集的數據點也相對較多,例如除了臉部肌肉數據點之外,還會對皺紋紋路等細微數據進行采集,當前國內已經有不少有成熟的企業,如希亞斯、平安科技等,主要應用在于教育、金融、社區安防領域;
二是基于人工智能語音情感識別技術的語音情緒分析系統,該技術已經在國外嘗試并開展應用,但由于中文發音的特殊性,導致相關的情感算法對中文識別的準確率偏低,同時在針對真是業務環境的場景復雜性、信號高噪性和快速響應等都是需要克服的難題。據網上報道稱,國內已經研發出中文語音情感識別算法,并在國內成功應用,如陽光保險客戶中心語音情緒分析系統,讓計算機對每天的全部通話進行全面自動化機器質檢,標記座席及客戶的負面情緒,協助質檢人員對座席的服務質量進行把關;
三是基于生理心理學,通過人類生理細微變化,觀察多種情緒的特定波動變化的模式(如心電圖、電皮膚活動等),識別人們思想情緒的變化。例如當人們感受到壓力而緊張或有不良企圖以致情緒亢奮時,身體交感神經就會啟動相關必要的機能,例如心跳加速、血壓上升、呼吸變快、體溫增高,乃至于肌肉皮膚顫動等生理變化。
以下重點分析是第三種情感識別方式。據《識破潛在隱藏訊息的VI情緒辨識技術》提到:
當人緊張焦慮時,無法被意識控制的前庭情感反射(VER),會透過頭部與身體的細微振動(物理上做功),以取得人體熱力學能量守恒定律的平衡;肌膚細微振動產生的光點變化,則可透過特殊的攝影機觀察記錄。因此技術是透過量測及演算振動(Vibration)在影像(Image)的變化,比對出相對應的潛在情緒, 故被稱為VibraImage(VI)。在每秒30幀圖像中,分析每張影像中人物的臉部皮膚、眼球、嘴角、眼皮、身體振動的次數,并計算振幅與振動周期, 運算包括頭部及身體的三維振動頻率、振幅、對稱性,以及振動過程總計45個參數,將像素振動速率映像出相關人的隱藏狀態,以判斷出有無緊張、攻擊性、焦躁等精神狀態。
據悉,俄羅斯通過訓練及試用,已經成功應用在世界峰會G7、G20、奧運會等全球最高維安等級的場合,同時也在機場、高鐵站、大型零售商場等公共場所,美國德州也在市區街道導入該技術進行預防犯罪。
應對層出不窮的公共安全挑戰,人臉識別當前已經成為有效應對的手段,但僅僅依賴人臉識別仍然有不少盲點不能處理到,同時該技術也存在不少的誤報率,情感識別或許可以成為有效的輔助手段。未來無論是攝像機與情感識別軟件的結合,還是情感識別的測謊方式,都能有效減少城市管理人員的工作,提高效率,也會對社會治安帶來新的幫助。