隨著IT技術的發展,大數據時代正在IT行業內如火如荼的開展著,然而安防行業卻只有一只腳邁入了大數據時代。都說好事多磨,那么阻礙著安防行業真正進入大數據時代的那些“磨難”都有什么?安防大數據又該如何擺脫好事多磨的窘境?本期欄目,就讓我們來探討一下這些問題。
一、大數據的今天
1、應用領域
智能交通
在安防行業內,大數據可進行交通分析,即通過對交通卡口采集的海量過車記錄進行分析,發現車輛的行車軌跡,發現異常行為,為案件研判、交通誘導等提供信息支撐。
平安城市
英我們所居住的城市中有無數的高清攝像頭,涉及治安監控、指揮通信、偵查破案、規范執法、社會服務等,視頻接入規模從幾千到幾十萬,每天產生海量數據。
卡口
目前大數據在安防行業內應用較多的主要還是針對卡口方面的應用,如碰撞分析、隨車分析、假牌套**、初次入城分析等等,這些應用應該說是在實踐中有明確和迫切需要的,且應用起來還是很有效的。
公安執法
此外,大數據不但可為公安偵查提供人、車、物和時空的相關性,在這些信息的分析和比對中發現有價值的線索信息;同時還可利用數據分析進行事前預警防范,如人臉識別比對系統,通過搭建人臉識別比對,建立人臉捕捉數據庫,將人臉信息歸檔,并與個人身份建立關系,在實際運用過程中采用人臉搜索、黑名單布防、陌生人識別等多項智能分析技術,大大提高視頻監控的防范功效,可讓犯罪分子無可遁形。
2、大數據的組成及特征
在安防行業,涉及的數據信息類型很多,以數據的結構類型來看,包括各類非結構化、結構化及半結構化信息。其中,非結構化數據主要包括視頻錄像和圖片記錄,如監控視頻錄像,報警錄像,摘要錄像,車輛卡口圖片,人臉抓拍圖片,報警抓拍圖片等;結構化數據則包括報警記錄,系統日志記錄,運維數據記錄,摘要分析結構化描述記錄,以及各種相關的信息數據庫,如人口信息,地理數據信息,車駕管信息等;半結構化數據則如人臉建模數據,指紋記錄等。
對IT大數據來說,其特征通常用4V(Velocity、Variety、Volume、Veracity)來概括,但對于安防大數據來說,它有自己獨特的特點。首先,安防大數據以非結構化的視頻監控數據為主,因而它更側重于對非結構化數據的信息分析、提取挖掘以及處理能力;其次,就數據容量而言,以視頻錄像為主的安防大數據對傳輸、存儲和計算過程中需要的帶寬以及存儲空間要求都更高;再次,以數據量基礎做比較,安防大數據中的信息價值密度更低,從海量的圖像信息中快速和準確地檢測或者挖掘出有用信息的難度更大;最后,視頻監控數據7×24小時都在持續不斷地更新積累,其時效性更高。
3、應用/實施狀況
截至目前,許多智能化功能和大數據應用已在技術上得到實現,主要包括入侵檢測、徘徊檢測、遺棄物檢測、人流統計、車流統計、車牌識別、視頻診斷等;此外還有未遂檢測、停止檢測、方向檢測、顏色識別等高級智能分析功能,這些技術正在廣泛地運用于安防領域。而目前智能化的市場正在通過部分典型應用進行拓展,例如智能交通的車輛統計和車流分析、公共場所的人數統計和警戒設置、商鋪家居的常規防范等。隨著更多智能化功能的不斷完善,大數據的智能化處理正在從專業市場向民用及商業市場快速推進。
二、安防大數據相關技術
大數據在安防行業的應用使得安防更加智能化,大數據的技術一般分為數據采集、存儲、挖掘和計算(算法)技術。
處理分析工具
安防界大數據的處理和分析工具主要有兩類,一類是對視頻圖像等非結構化信息的處理和分析工具,包括視頻智能分析工具、視頻摘要工具、圖像清晰化工具、視頻清晰化工具、視頻轉碼工具、視頻編輯工具等等;另一類則是對結構化、半結構化信息的大數據分析處理工具,此類處理和分析工具安防界吸取了IT界在處理大數據方面的架構和經驗,比較流行的如Hadoop,Spark大數據處理的框架,以及Mahout、R數據挖掘工具,以對結構化和半結構化的數據可以實現快速和準確的數據分析和挖掘。
英特爾的理念是在端到端的安防行業,全面實現數據價值的挖掘。所謂“端到端”,包括前端視頻采集、分析、存儲以及后端數據中心處理。區別于單個設備的解決方案,英特爾以其優越的性能、靈活的設計為設備制造商和系統集成商提供整套系統化解決方案,從數據獲取、存儲、分析到應用各個層面均有覆蓋。從硬件角度,英特爾提供的全系列處理器涵蓋入門級的凌動、酷睿以及高性能的至強處理器,隨著夸克產品線的推出,在前端的應用將更具性能功耗比優勢。此外,英特爾聚焦于通過GPU進行媒體處理工作負載的整合,如編解碼的硬件加速,從而實現更高密度的視頻流集成,使系統整體性能得到優化。在軟件層面,英特爾擁有多種媒體處理工具,如異步IPP、媒體處理開發套件(Media SDK)以及Open CL開發套件。同時,對于開源大數據基礎軟件Apache Hadoop,英特爾提供了很多算法上的優化,還可根據客戶的特定業務需求對運行Hadoop的基于英特爾至強系列芯片的服務器進行硬件的深度優化,為海量數據的存儲和處理提供靈活支持,使之更適用于交通和安防行業的應用,合作伙伴也可在這個開放的平臺之上自如地融入自己的創新。
核心技術
在筆者問道大數據的核心技術是什么時,受訪人不約而同地給出了同一個答案:智能分析。智能分析是安防大數據區別于IT大數據的根本點,只有利用智能分析技術將安防大數據的非結構化數據轉換為結構化數據,才能將IT大數據成熟的技術體系應用到安防大數據中,充分發揮安防大數據的作用。對于視頻圖像等非結構化數據的分析和處理,目前可能更多地是把它歸屬到智能分析的范疇,這些技術很多已在初期應用中不斷改進和完善,很多更新的智能分析技術仍處在研發過程中,對這類數據的分析和處理也將成為安防大數據的核心價值點。日益豐富的智能算法將大大提高視頻監控攝像機的使用范圍和價值,處于應用初級階段的智能視頻監控,也將隨著智能算法的日益豐富而快速發展。而數字處理芯片、編解碼能力以及壓縮算法,是影響圖像處理技術的重要因素。安防智能化的核心還體現在VA(視頻分析或圖像分析),而VA需要底層算法的支持并運用單元執行,這可提高視頻分析的效率。
此外,對于大數據時代的安防行業來說,存儲技術同樣處于不可或缺的位置。他認為,海量數據必須擁有能夠進行可靠、可保證效率且擁有快速的讀寫以及響應能力的存儲。
三、大數據成長路上的“磨難”
對任何一個新事物來說,它在出現和發展過程中都不可能是一帆風順的,安防大數據在其成長路上又在經歷著哪些“磨難”的考驗呢?
數據共享問題
目前安防行業內各系統以及各領域之間比較孤立,數據與數據之間并沒有互通,從而形成了一個個數據孤島,這導致各個系統按照大數據的方式使用起來比較困難。他認為,如果利用云存儲技術對大數據進行統一管理,把視頻與存儲進行分離并做成一個通用的共享層,對安防大數據來說將不失為一大進步。
篩選有效數據問題
眾所周知,以視頻監控數據為主的安防擁有著海量的數據,然而,在這海量的數據中,可利用的、有價值的數據卻是少之又少的,如何在海量數據中高效地篩選出有效數據便成為一個非常困難的問題。如何在大數據中快速高效地篩選有效信息正是目前安防大數據技術發展的問題所在。他認為,安防的數據量大,且傳統的安防多是事后查證,于是把所有有用無用的數據全存儲下來,其造成檢索查找不便。眾多廠商都在致力于探索如何從安防大數據中提取有價值的數據信息。
大數據的最終目標是盡可能快速地利用各種數據來做出最好的決策。當前需要高效篩選安防數據,依然需要對安防監控關注的業務對象進行人工監督的建模,基于業務對象建模反向指導數據采集匯聚與分析。當前有兩種決策分析模型,一種是基于假設的模型,要關注哪些高價值數據,關注相關領域的數據,關注那些能夠提升效率的數據;另一種模型就是一種不是基于假設的模型,是一種機器學習(如神經網絡算法等)的模型,大數據帶來的變化是分析必須減少對于固有數據的依賴,分析模型將能夠根據數據流中的動態數據自適應。這種模型跟假設模型完全不同,兩種模型暫時無法相互替代。從長期來看,一定會有更多的數據需要我們去關注。對安防大數據來說,它能夠不斷增加安防監控量,幫助我們基于數據做出更合理的決策,這是它的優勢。他認為,經過長時間數據和技術的發展,機器學習方式可能會取代假設模型。
安防廠商想要在大數據中快速高效地篩選出有效信息,需要兩個基礎來保證:于非結構化信息的分析、識別和提取等處理要準確和高效;對大量結構化信息,或者半結構化信息的綜合搜索要準確和快速。因此,安防廠商首先需要提升對非結構化信息的處理能力和效率,準確和快速地處理視頻圖像、人臉特征建模等數據,從里面提取出有用的信息,并且能夠進行信息的某種表述,在大數據的存儲層面上完成數據信息的提取和存儲工作,以便進行后續的數據信息檢索,分析和挖掘業務。其次,通過使用并且針對性地改進目前的大數據處理技術以及平臺框架,提供針對安防數據信息的快速檢索機制,形成有針對性的海量安防數據信息處理架構,從這些大量的結構化和半結構化信息中進行快速檢索和分析。
智能分析困難
在安防大數據中,如何對海量數據進行智能分析是關鍵?,F階段,如何平衡網絡帶寬承載、降低系統存儲成本則成為處理海量數據的前提性要求。在實際應用中,視頻圖像的分析處理需求日益增加,如車牌識別、人臉識別等,對圖像質量提出了更高的要求,也對芯片的解碼能力提出了更大的挑戰。解決方案不單單是一個芯片就可以完成的,它是一個完整的架構。
目前,數據分析往往在數據中心執行,市場缺少一個端到端的計算架構,使不同攝像設備的關鍵信息被快速關聯起來,從而迅速、及時地進行分析。如何有效提取高質量的視頻信息以及實現更高效的數據中心智能搜索和分析正在成為業界的重要訴求。而在前端設備中使用更高性能、整合了GPU(圖形處理單元)的CPU(中央處理器)的芯片,通過相應的開發工具使GPU和CPU的能力得到充分利用,可使前端視頻的解析更有效率;同時,在后端使用對于開源或其它Apache Hadoop商用版(如Cloundera)深度優化的至強系列服務器集群,可以合理地分配系統整體的計算資源,使圖像視頻處理及智能分析得以高效實現。
安防系統性能問題
安防大數據以視頻數據為主,然而視頻數據則對帶寬有著很高的要求,海量視頻數據的快速調取對高分辨率視頻數據的處理能力也有著很高的要求。目前安防行業對圖像信息的分析處理過程中,應用的性能瓶頸雖然會出現在計算層面,但對于大容量的數據上傳而言,下載和調度也是一個重要的瓶頸。
數據安全問題
在IT行業中,數據安全問題很是令人擔憂的,這個問題在安防行業內同樣不容忽視。大華王海豐認為數據安全問題主要分為三個方面:數據丟失、數據篡改以及數據泄露。針對這些問題,除了可采用多副本存儲、算法容錯技術之外,還可采用視頻水印及進行信道加密、存儲加密、數據加密技術等。
對于安防領域而言,數據量大,圖像信息蘊含的信息量更多,且還涉及到個人隱私,公共安全等問題。所以,在系統安全方面更不容忽視。在安防領域,由于其公共安全的特性,除一般的如采用信息加密、傳輸加密、數據冗余、安全賬號控制、系統安全檢測、入侵檢測等信息數據安全措施外,更需要一些特殊保護措施。如從法規層面的保護,即涉及個人隱私和公共安全視頻信息的使用和控制,要加強對重點領域敏感數據的監管,特別是在公安和政府層面,需要明確重點領域數據內容和范圍,制定完善的重點領域數據庫管理和安全操作制度,加強日常對信息數據監管。另外,還需要規劃信息敏感域,做好本域的信息隔離和保護工作,如使用安全邊界接入平臺等方式,切斷直接的數據通訊鏈接,減少甚至避免受攻擊的情況。實際上,數據安全問題的解決,并不是靠一個人,一個企業或者一個行業就能徹底解決的,而是需要整個社會,各行各業的共同努力。
四、大數據如何真正落地安防
大數據如何才能真正落地到安防行業?英特爾顧典為我們分享了他的觀點:
1、由于大數據基礎軟件Apache Hahoop是一個通用的平臺軟件,所以安防行業的廠商如軟件供應商、系統集成商仍需和最終客戶之間有深入的交流,了解需求,根據客戶需求構建新的大數據解決方案。這樣可以把一個通用的數據平臺設計成更加符合安防行業應用的數據平臺,并考慮設計一些標準的API,使系統能夠靈活地應對將來的業務擴展。
2、大數據的應用還涉及到一些新的行業技術標準,如某些視頻信息抽象出的元數據等。有了這些針對數據處理的行業標準才可能使系統在處理海量異構數據時減少由于不必要的數據轉換帶來的系統資源損耗,使系統更加專注于分析、挖掘,從而更有效率地實現數據帶來的價值,如提高應用的實時性。
3、因大數據技術相對較新,產業鏈中包括方案提供商、系統集成商以及客戶本身,都需要增加熟悉大數據軟硬件的技術人才。比如,方案提供商需要有熟悉Apache Hadoop基礎平臺軟件的開發人員,需要有熟悉如何將基于Apache Hadoop的應用與現有的其它業務流程進行系統對接的應用開發人員,而系統集成商和客戶也需要有相應的Hadoop基礎軟件平臺的維護人員。有了這些人才,才能使方案不斷、快速地優化,從而實現穩定及高效運作。
大數據時代,安防企業如何規劃未來發展之路?安防大數據又如何擺脫好事多磨的窘境?還讓我們且行且看!