發(fā)展至今,大數(shù)據(jù)不再為互聯(lián)網(wǎng)企業(yè)獨有,而是逐漸成為覆蓋各行業(yè)、可以為具體業(yè)務服務的技術。如今,春節(jié)不僅演化成了一年一度的“人口遷徙”大節(jié),還成了交通、安保等領域接受技術檢驗的關鍵時刻,交通疏導以及火車站、汽車站、機場等場所的安全防范工作均是重中之重。人滿則為患,視頻大數(shù)據(jù)分析技術在其中承擔了巨大的作用。
在復雜環(huán)境下對人、車、物的多重特征信息提取和事件檢測,從而有效區(qū)分行人與干擾物體,這種精確的客流統(tǒng)計離不開智能攝像機監(jiān)控。據(jù)悉,元宵節(jié)當天,南京夫子廟先后涌進近70萬觀燈市民,人流峰值曾達到了11.5萬人。(數(shù)據(jù)來源于海康威視)
觀燈會中使用的雙目客流攝像機在雙鏡頭立體成像的基礎上,能夠對游客的徘徊和身高進行過濾,并可以結合后端客流量統(tǒng)計分析系統(tǒng),協(xié)助南京公安及時進行客流管控,一旦客流量統(tǒng)計分析系統(tǒng)檢測出入口客流數(shù)據(jù)增長超出預期,指揮部馬上通知該出入口的民警采取人員引導、限流和組織人墻措施,從而保證賞燈的有序性和安全性。
為什么攝像機能夠自動過濾篩選信息呢?視頻大數(shù)據(jù)分析需要經(jīng)過三個層面的問題,一是目標檢測和跟蹤,二是目標識別, 三是行為識別。設想一下, 在一幀視頻內容里,我們首先要把人從周圍環(huán)境中分離出來(目標檢測),然后分析出這個人是誰(目標識別),最后通過對其肢體動作分析,得到他在干什么(停留還是徘徊,或者其他行為)的結論,甚至推理出他將要干什么(行為理解)。
目標檢測和跟蹤(你在哪兒)
可見,這三個層次是依次遞進的,目標檢測是目標識別的基礎,而行為識別是目標識別的高級階段,這三個層次總體構成了攝像機智能過濾的功能。其中視頻目標檢測和跟蹤具有很強的實用價值,主要應用在視頻監(jiān)控、智能交通、人機交互、機器人導航等領域。
以下是幾種常用的動態(tài)視頻目標檢測方法:
背景減除:背景的建模是背景減除方法的技術關鍵,它一般能夠提供相對來說比較全面的運動目標的特征數(shù)據(jù),但對于動態(tài)場景的變化,如光線照射情況和外來無關事件的干擾等也特別敏感。
時間差分:又稱相鄰幀差方法,利用相鄰幀圖像的相減來提取出前景移動目標的信息,對于動態(tài)環(huán)境具有較強的自適應性,但一般不能完全提取出所有相關的特征像素點,在運動實體內部容易產(chǎn)生空洞現(xiàn)象,只能夠檢測到目標的邊緣,當運動目標停止運動時,一般時間差分方法便失效。
光流:基于光流方法的運動檢測采用了運動目標隨時間變化的光流特性,該方法的優(yōu)點是在所攝場所運動存在的前提下也能檢測出獨立的運動目標。大多數(shù)的光流計算方法相當復雜,且抗噪性能差,如果沒有特別的硬件裝置則不能被應用于全幀視頻流的實時處理。
目標識別(你是誰)
目標識別主要是判斷視頻的內容是什么,如通過人臉識別技術達到判定目的。目標識別的過程是將待識別的目標與指定的目標庫中的特征進行比較,以確定是否與該庫中的某一目標相匹配。其方法主要有:幾何特征法、神經(jīng)網(wǎng)絡法、隱馬爾可夫模型法、利用人臉側面像的輪廓進行識別等。
目前,該技術的難度在于光照條件的改變、 角度的不同、 遮擋,人臉識別技術中還包括人臉表情的變化、年齡增長等帶來的變化。
行為識別(你在干什么)
行為識別即是行為理解,它對數(shù)據(jù)分析結果的應用極其重要,因為其回答了目標“將要干什么”的問題,可以基于理解的結果進行預判。例如,在各種光照變化、人群遮擋等復雜環(huán)境下,相關機構可以通過視頻數(shù)據(jù)分析估計人群數(shù)量和密度,同時檢測人群過密、異常聚集、滯留、逆行、混亂等多種異常現(xiàn)象,實現(xiàn)重大活動、重要區(qū)域的人流統(tǒng)計與控制,并提供實時報警功能。
深度學習(模仿人腦機制解釋數(shù)據(jù))
在視頻大數(shù)據(jù)分析的三個層次中,目前研究熱點主要集中在目標識別和行為理解兩大領域。學術界和產(chǎn)業(yè)界最終的目的是讓計算機具備人類眼睛和大腦的功能,“看到”并“領會”到圖像和視頻上的信息。在具體技術手段上,業(yè)內往往采用計算機視覺技術,特別是以深度學習為基礎的計算機視覺技術近年來在視頻分析中得到廣泛應用。
計算機視覺技術指的是依靠算法,在沒有其他輔助信息的前提下,僅根據(jù)圖片像素信息分析出圖像的語義,一般分為圖像獲取、預處理、特征提取、檢測/分區(qū)和高級處理。