數(shù)據(jù)采集,又稱數(shù)據(jù)獲取,通常有兩種解釋:一種是從數(shù)據(jù)源收集、識(shí)別和選取數(shù)據(jù)的過(guò)程。另一種是數(shù)字化、電子掃描系統(tǒng)的記錄過(guò)程以及內(nèi)容和屬性的編碼過(guò)程。數(shù)據(jù)采集技術(shù)廣泛引用在各個(gè)領(lǐng)域,比如攝像頭,麥克風(fēng),都是數(shù)據(jù)采集工具。
“大數(shù)據(jù)”是指一組數(shù)據(jù)集非常龐大且復(fù)雜,以致于很難利用現(xiàn)有的數(shù)據(jù)庫(kù)管理工具進(jìn)行處理。它有助于統(tǒng)一大型數(shù)據(jù)集,并能夠從分析中得出其它信息,而不是來(lái)自具有相同數(shù)據(jù)總量的單獨(dú)的較小數(shù)據(jù)集。大數(shù)據(jù)時(shí)代的來(lái)臨,帶來(lái)了很多現(xiàn)實(shí)中的難題,為了解決這些難題需要新的技術(shù)變革,需要新一代的數(shù)據(jù)庫(kù)技術(shù),業(yè)界稱之為大數(shù)據(jù)技術(shù)。IDC這樣定義大數(shù)據(jù)技術(shù):大數(shù)據(jù)技術(shù)將被設(shè)計(jì)用于在成本可承受(economically)的條件下,通過(guò)非常快速(velocity)的采集、發(fā)現(xiàn)和分析,從大量化(volumes)、多類別(variety)的數(shù)據(jù)中提取價(jià)值(value),將是IT領(lǐng)域新一代的技術(shù)與架構(gòu)的變革。
由此看來(lái),大數(shù)據(jù)產(chǎn)生的第一步就是大數(shù)據(jù)采集。那么對(duì)于安防行業(yè)來(lái)說(shuō),大數(shù)據(jù)產(chǎn)生的一個(gè)最重要的途徑就是視頻監(jiān)控,監(jiān)控?cái)z像機(jī)也就成為最重要的大數(shù)據(jù)采集工具。
視頻監(jiān)控?cái)?shù)據(jù)有兩個(gè)方面的內(nèi)涵--海量和非結(jié)構(gòu)化。視頻監(jiān)控?cái)?shù)據(jù)量規(guī)模龐大,并且隨著高清化、超高清化的趨勢(shì)加強(qiáng),視頻監(jiān)控?cái)?shù)據(jù)規(guī)模將以更快的指數(shù)級(jí)別增長(zhǎng);與通常講的結(jié)構(gòu)化數(shù)據(jù)不同,視頻監(jiān)控業(yè)務(wù)產(chǎn)生的數(shù)據(jù)絕大多數(shù)以非結(jié)構(gòu)化的數(shù)據(jù)為主,這給傳統(tǒng)的數(shù)據(jù)管理和使用機(jī)制帶來(lái)了極大的挑戰(zhàn)。
“除了上帝,任何人都必須用數(shù)據(jù)來(lái)說(shuō)話”,美國(guó)著名管理學(xué)家、統(tǒng)計(jì)學(xué)家愛(ài)德華·戴明將數(shù)據(jù)提升和上帝平行的高度。視頻監(jiān)控業(yè)務(wù)正是一個(gè)典型的數(shù)據(jù)依賴型業(yè)務(wù),依靠數(shù)據(jù)說(shuō)話。可以說(shuō),大數(shù)據(jù)與視頻監(jiān)控業(yè)務(wù)有著天然的結(jié)合。綜合來(lái)看,大數(shù)據(jù)與視頻監(jiān)控業(yè)務(wù)的結(jié)合主要體現(xiàn)在“存”、“看”、“用”上。
“閃存”:如果類比水庫(kù)蓄水的方式,典型的網(wǎng)絡(luò)視頻監(jiān)控?cái)?shù)據(jù)存儲(chǔ)模型是一個(gè)由小溪匯聚河流、再匯聚到水庫(kù)的蓄水方式。小溪數(shù)量增多、水量增大是水庫(kù)蓄水量的保證,然而傳統(tǒng)方式下蓄水量增大將提高水庫(kù)建造成本和蓄水安全的要求。而采用分布式蓄水模式,在河流中游建立多個(gè)中間蓄水池,不僅可以減少主水庫(kù)蓄水壓力和成本,化整為零也提高了就近用水效率。在大數(shù)據(jù)技術(shù)支撐下,網(wǎng)絡(luò)視頻監(jiān)控?cái)?shù)據(jù)存儲(chǔ)模型可轉(zhuǎn)向分布式的數(shù)據(jù)存儲(chǔ)體系,提供高效、安全、廉價(jià)的存儲(chǔ)方式。
“易看”:在視頻監(jiān)控業(yè)務(wù)中,錯(cuò)看漏看、來(lái)不及看等是常見(jiàn)的困擾點(diǎn)。大數(shù)據(jù)監(jiān)控圖像的回溯給許多安防監(jiān)控管理人員帶來(lái)了生理與心理的雙重挑戰(zhàn)。在大量人力投入的公安案件追溯中,都常常耳聞“看到吐”、“看到暈”等無(wú)奈和感嘆。可想而知一般零售行業(yè)、金融行業(yè)等,對(duì)于視頻監(jiān)控圖像的回溯就更為困難。在視頻監(jiān)控大數(shù)據(jù)趨勢(shì)已經(jīng)來(lái)臨之際,依靠人眼去檢索、查看所有視頻圖像數(shù)據(jù)已經(jīng)不太現(xiàn)實(shí)。通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)視頻圖像模糊查詢、快速檢索、精準(zhǔn)定位,讓看變得簡(jiǎn)單迫在眉睫。
“善用”:視頻監(jiān)控業(yè)務(wù)中,看只是信息采集的方式之一,用才是業(yè)務(wù)應(yīng)用的根本。視頻監(jiān)控業(yè)務(wù)的效率問(wèn)題已經(jīng)成為阻礙產(chǎn)業(yè)發(fā)展的關(guān)鍵瓶頸。隨著視頻監(jiān)控?cái)z像機(jī)覆蓋廣度、密度增大,視頻圖像數(shù)據(jù)量呈指數(shù)級(jí)上升,而視頻監(jiān)控?cái)?shù)據(jù)的使用效率卻在下降。
大數(shù)據(jù)背景下,視頻監(jiān)控遭遇幾大困境
飛速增長(zhǎng)的視頻監(jiān)控?cái)?shù)據(jù),使得傳統(tǒng)視頻監(jiān)控體系架構(gòu)、數(shù)據(jù)的管理方式、數(shù)據(jù)分析應(yīng)用等面臨新的困境。
數(shù)據(jù)量的急劇擴(kuò)大和IT投資之間的矛盾
按照IT產(chǎn)業(yè)的法則:在滿足客戶需求的前提之下,往往技術(shù)成本越低,其生命力往往越強(qiáng)。由于數(shù)據(jù)量的急速擴(kuò)大,以及隨之而來(lái)的大規(guī)模計(jì)算的需求越來(lái)越多,一味采用高配硬件,使得硬件投資成為客戶不可承受之重,客戶越來(lái)越希望在滿足需求的前提下,用中低端的硬件來(lái)替換高配硬件。
海量數(shù)據(jù)和有效數(shù)據(jù)之間的矛盾
攝像頭7X24小時(shí)工作,如實(shí)記錄鏡頭覆蓋范圍發(fā)生的一切,僅僅記錄信息是不夠的,因?yàn)閷?duì)于客戶來(lái)講可能大部分信息是無(wú)效,有效信息可能只分布在一個(gè)較短的時(shí)間段內(nèi),按照數(shù)學(xué)統(tǒng)計(jì)的說(shuō)法,信息是呈現(xiàn)冪律分布的,也稱之為信息的密度,往往越高密度的信息對(duì)客戶價(jià)值越大。
資源利用和效率之間的矛盾,串行計(jì)算和并行計(jì)算的矛盾
視頻監(jiān)控業(yè)務(wù)網(wǎng)絡(luò)化、大聯(lián)網(wǎng)后,網(wǎng)絡(luò)內(nèi)的設(shè)備越來(lái)越多,利用閑置的計(jì)算資源,實(shí)現(xiàn)資源的最大化利用,關(guān)乎運(yùn)算的效率。在視頻監(jiān)控領(lǐng)域,往往視頻分析的效率決定價(jià)值,更低的延遲、更準(zhǔn)確的分析往往是平安城市這類客戶的普遍需求。隨著數(shù)據(jù)量的增加,哪怕對(duì)TB級(jí)別的數(shù)據(jù)進(jìn)行對(duì)視頻內(nèi)容的數(shù)據(jù)分析和檢索,采用串行計(jì)算的模式都可能需要花費(fèi)數(shù)小時(shí)的計(jì)算,已遠(yuǎn)遠(yuǎn)不能勝任時(shí)效性的需求。視頻的分析和檢索,不能依賴于傳統(tǒng)的手段,巨量數(shù)據(jù)的效率優(yōu)化,并行計(jì)算是視頻智能分析的唯一出路。