作為互聯網+的重要組成部分,行業大數據應用實踐一向被產業所關注。與金融、醫療、電信、零售等行業大數據技術與實踐不絕于耳的研討相比,公安系統大數據的應用一向難以被大家所認知。直到在IPF2015(浪潮信息全國合作伙伴大會Inspur Partner Forum)的《浪潮大數據及應用分論壇》上,聽到某省公安廳科信處負責人,這位已經在公安信息系統中工作數十年的技術專家的深入分享,才進一步了解與互聯網完全不同。擁有龐大的數據積累和獨特安全需求的公安系統,是如何利用技術進行大數據實踐的。
公安數據狀況分為:
治安類相關業務系統;
刑事類相關業務系統;
經偵類相關業務系統;
交通類相關業務系統;
指揮類相關業務系統;
視頻業務系統。
存儲是最基本的需求,公安系統存儲方面:
數據庫層面有Oracle,SQLServer,Hadoop;
基礎存儲設施層面:各數據庫獨立存儲自己的數據,存儲空間獨立管理,存儲的數據安全性上基本是Hotspare+Raid5;
存儲的區域化特性明顯:以市為單位的系統在市本級存放數據,以省為單位的系統全省統一存放數據,以部為單位的全國統一存放數據。
以目前公安數據使用狀況來看,數據復用分為三個層級:
內部復用:綜合查詢、數據復制、數據庫賬號、全文搜索等;
區域間復用:請求服務、全網搜、核查比對;
外部復用:部門間信息共享、政府網站、服務民生。
可以說,公安IT系統建設是極早的,2006年就已擁有成熟的數據中心。而公安幾乎和所有行業在數據層面都有密切交互。所以,作為特殊的專網,公安的IT系統尤為復雜,如煙囪式垂直應用眾多。
不止如此。移動互聯、物聯網等新技術使得數據元多種多樣,非關系型數據日趨龐大。數據關聯性更加復雜,比如廣東車主在北京違章,這就需要多重數據調取;比如金融詐騙分析中,搜索一個姓名在某個小城市有多少人,也許只有24位。但如果放到全國,這一類完全展開要多少,是無法預估的。而搜索之后,如果在進一步進行數據展示甚至深度挖掘,都會遇到諸多技術問題。新的變化來了新的業務挑戰,而這些已不是傳統技術所能解決的。
公安大數據系統規劃
從Oracle 805一直使用到最新版本的這位負責人對此感受頗深:“在我看來,100萬條數據和1億數據沒有本質區別,公安數據在設計中要面對空間和時間的序列并非線性增長而是指數增長的事實。所以現有的系統軟件的計算模型已經不可實現。傳統技術已經面臨瓶頸的挑戰。尤其在政府希望數據使用日趨開放的現在,如果政府網站建設,需要打通政府和公安內網的部分信息;比如服務民生,車輛違章需要和公安數據打通等。公安大數據系統需要從多方面的數據體系建設。”
數據服務體系建設:解決內部的數據重復采集問題,構建數據服務機制;
數據共享體系建設:構建數據的傳輸和共享機制;
數據技術體系建設:數據抽取技術,數據分析,數據存儲和數據安全;
數據管理體系建設:生命周期管理,數據的描述管理(標準,格式),數據的質量管理,安全管理。
這其中不僅是圖片、圖像、傳統業務數據的累加,還有分布式存儲、全文索引、圖形展現、內存數據庫、MPP數據庫、圖數據庫等技術的使用,與業務解決方案,如串并聯、關系分析、圖形分析與比對等,都是要重點關注的技術要點。
如此龐大的技術需求下,“公安大數據的特殊理解和行業含義決定了在方案層面需要與更多業務軟件開發商,IT供應商的合作。”負責人如此表示。
潮云海大數據一體機
這也正是浪潮的機會所在。浪潮信息總裁助理、云計算產品部總經理張東表示:“計算+是浪潮對于未來智能世界下數據中心計算架構的理解。通過硬件重構,將計算、存儲、網絡等資源融合到一個全新計算形態的設備中,再通過軟件定義表現出計算、存儲、網絡、安全功能,支撐科學計算、存儲、大數據和人機交互等多種業務,對于公安、公安、金融、交通、醫療、能源等行業的大數據應用有著天然的契合度。”
事實上,在浪潮信息副總裁彭震上午的演講中,曾特別提到浪潮服務器已經在80%省份公安系統中得到廣泛使用。浪潮的大數據產品早已走入公安系統。浪潮信息云產品部副總經理李忠旭進一步表示:“以全國八大信息庫為基礎,以五大案件(人、地點、機構、物品、案/事件)要素為基本信息分類,以“大情報系統”建設為突破口,公安可以很快建立起新一代大數據云應用平臺。這其中,面向海量非機構化數據的存儲和分析處理;面向海量數據的在線查詢;面向海量關系型數據的分析挖掘的浪潮大數據一體機和相關解決方案提供商將能提供更多幫助。”