隨著全球信息化技術飛速發展、大數據和智慧科技時代的到來,更多豐富多彩的大數據源如傳感器、微處理器、視頻及移動終端接入高速網絡,所有的機械或電子設備都可以留下數據痕跡,這些痕跡表明了它的性能、位置或狀態。這些設備和使用它的人,通過互聯網互相交流,又形成了另外一個龐大的數據源。當這些數據和來自其他媒體、無線或有線電話、有線電視、衛星等等來源的數據相結合的時候,更加顯得龐大無比。由此產生的數據及增長的速度將遠遠超越歷史任何時期。伴隨著大數據時代的來臨,如何深入分析各種信息資源和視頻資料,從海量原始數據中提取隱含的、未知的及有潛在應用價值的信息或數據,是公安領域非常關注的問題,掌握大數據來反哺一線實戰,可以提高執法效率與快速反應能力、及時的預防與打擊犯罪行為能力。
數據挖掘 ( Data Mining) , 也稱數據庫中的知識發現( KDD: Knowledge Discovery in Database) ,是指從大型數據庫或數據倉庫中提取人們感興趣的知識,。這些知識是隱含的、事先未知而又潛在有用的, 提取的知識一般可表示為概念( Concepts) 、規則( Rules) 、規律( Regularities) 、模式( Patterns) 等形式。用數據庫管理系統來存儲數據, 用機器學習方法來分析數據, 挖掘大量數據背后的知識, 這兩者的結合促成了數據挖掘技術的產生。數據挖掘是一門交叉性學科, 涉及機器學習、模式識別、歸納推理、統計學、數據庫、數據可視化、高性能計算等多個領域。
當前在以“金盾工程”為載體的公安信息化、數字化建設中,公安部門積累了海量的以不同形式存貯的數據資料, 例如戶籍資料、車輛資料和出入境管理資料等。此外, 公安工作所涉及到的數據類型是相當復雜的, 例如指紋, 其特征抽取相當復雜, 具備串并案和作案規律特點, 其數據聯系是非平面的, 也是非標準立體的。而隨著IT信息化與警用業務日趨緊密的結合,數據量在不斷的增加。為了充分、有效的利用這些數據的價值,傳統數據挖掘方法能夠幫助公安發現數據規律,但它在處理的數據類型、數據量、及處理速度上都有限,難以支撐當前公安的訴求。
Gartner給出了這樣的定義:“大數據”是需要新的處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
華為FusionInsight Miner為公安提供一站式數據挖掘平臺,支持數據分析全流程智能分析,實現“全量數據,關聯分析”數據分析方法,幫助公安實現海量大數據智能挖掘,以發現一些隱含的、潛在的、有用的信息及事件之間的相互聯系, 從而對未來的活動作進一步的預測, 實現快速、準確輔助警務決策, 從而提升警務信息化在打防管控、服務群眾等方面的精度和效能。
· 端到端分析平臺
一站式平臺支撐數據分析全流程;
· 特征工程/社交化
特征復用;支持 1,000萬維度;數據分析師共享知識和社交化協作分析;
· 建模算法
算法并行化效率(T+0);全球分布的數學家, 算法比MLlib快3~5倍;深度學習技術
· 開放性
支持PMML與SAS、SPSS等對接;支持SQL對Operator的擴展性;支持與R對接
· 業務驅動:
基于業務問題驅動的一站式甚至one-Click的閉環解決方案,比如推薦引擎以及其他使能套件
華為FusionInsight Miner通過機器學習自動分析案件犯罪人在作案時的數據特征,在新案件發生時找出具有類似數據特征的嫌疑人,大量縮小嫌疑人范圍并大幅降低破案工作量,快速找出罪犯;同時新案件的偵破又反過來供機器學習,提升查找嫌疑人準確度。根據互聯網行為、社會信息、公安數據刻畫人物特征,構建人物關系網,發現社會團體,并對監控信息進行實時分析及時預警;用于應對重大突發事件安防(如上海踩踏事件),預警于案件萌芽時刻(如昆明火車站暴力恐怖案)。大規模并行計算極大提升了數據處理性能,實時流處理在數據產生時即計算分析,大幅提升信息獲取的效率;在案件碰撞、情報分析等場景甚至避免了傳統計算無法得出結果的困境,能夠幫助公安在實戰應用中實時決策、及時部署、快速響應。
智能警務信息化目前正處在高速發展階段,更加關注的是海量數據的應用、挖掘、碰撞比對,以及各種技術的合成作戰。華為FusionInsight Miner智能分析平臺通過對數據挖掘出更多價值的信息,實現情報信息主導警務戰略,全面提升信息化條件下公安機關維護國家安全和公共安全的能力。