背景介紹
警察作為一個國家的重要機構,肩負著維護社會穩定,打擊違法犯罪的重要職責,面對著越來越狡猾的犯罪分子,警方需要有效提升預防和打擊犯罪的能力,單靠警員人工破案已無法滿足社會需求,因此國家提出“科技強警”的發展戰略,借助高科技裝備、信息化手段幫助警方打擊違法犯罪,“金盾工程”更是將公安信息化建設推向了高潮。然而,隨著信息時代的到來,犯罪分子作案手段越發多變、隱蔽,傳統的信息化手段已很難幫助警方快速分析研判。
近年來,“物聯網”、“大數據”越來越被人們所熟知,著名的“谷歌汽車”、“大數據流感預測”更是成為物聯網技術與大數據預測應用的經典案例。這兩個在幾年前還不為人知的技術名詞,仿佛是在一夜之間闖入了我們的生活,將人們拉入了科幻電影中的場景。那什么是“物聯網”、“大數據”呢?
物聯網技術是利用互聯網等通信技術手段把傳感器、控制器、機器、人與物通過新的方式聯系在一起,形成人與物、物與物互聯,實現信息化,遠程管理控制和智能化的網絡。
作為物聯網之后IT行業又一大顛覆性的技術革命,大數據是信息爆炸時代的產物,人們每天上網、交流、購物、訂票……產生了數以億級的數據,而這項技術的意義并不在于掌握了龐大的數據信息,而在于對這些含有意義的數據進行專業化的預測處理。
警方分析研判的關鍵是挖掘人員、組織、案(事)件、陣地以及物品五要素之間的關聯關系,如果能夠借助物聯網技術獲取五要素信息,那么將大大提升警方獲取線索信息的效率,同時也能避免人為錯誤。而面對龐雜的線索信息,則可以借助大數據分析技術實現深入,高效的挖掘分析,進而快速找出五要素之間的關聯關系。
本文試圖探討構建一套基于物聯網技術的警務大數據分析模型,借以提高警方線索采集和分析研判過程的準確性和效率。
技術架構
基于物聯網技術的警務大數據分析模型是一種利用大數據分析算法對海量警務物聯網線索信息進行深度挖掘分析的系統模型。它包括了物聯感知層、數據傳輸層、數據分析層以及數據展示層,同時,它還要與現有的公安信息網有效融合,實現信息共享碰撞。
物聯感知層
警務物聯網,是指利用感知技術與智能裝置對警務工作關注對象進行自動感知識別,通過網絡,技術處理和智能分析,實現對關注對象狀態和態勢信息的實時掌握,達到對關注對象動態監測、精確管理和科學指揮的目的。目前警方所應用的場景有旅客身份證查驗、警車警員GPS定位、城區視頻監控、道路卡口車輛監控、重點部位報警防范、重點人員手機定位、槍支RFID標簽定位等,可以采集到人員、車輛以及物品的城市時空數據,為警方建立基本要素排查提供大量真實可靠的原始數據。
數據傳輸層
經過移動互聯網、有線網絡等媒介傳輸到系統模型的物聯網數據,具有數據量大,且分布在不同時域,空域的特點,是無法直接使用的,為此需要按照一定的標準規則對它們進行初步的篩選和歸類整合,將其轉化為兼容系統模型的,具有統一規范標準的“元數據”。
數據分析層
經過初步歸類整合的數據依舊是海量且缺乏直觀聯系關系,無法為警方提供研判依據,為此需要借助專業的數據挖掘算法對這些數據進一步分析、整合。同時還要與公安信息網中的線索與情報進行碰撞,以降低單一數據源造成的信息可靠性低等問題。常用的分析算法有分類分析、回歸分析、聚類分析以及關聯分析。
分類分析
根據一定的分類準則將具有不同特征的數據劃分到不同類別的過程。以某地區團伙作案為例,該區域近一段時期是團伙犯罪高發期,警方對該區域以及鄰近區域娛樂場所以及出租屋的人員進行集中排查,采集到大量的身份證信息和手機串號信息。
通過對午夜時段的身份證號以及手機串號進行碰撞,可以篩選出一批經常出入于犯罪高發區的可疑人員名單,進而幫助警方縮小排查范圍。
回歸分析
通過對自變量和因變量做一定的相關性分析,由此建立回歸方程,用以預測變量的依賴關系。加利福尼亞警方曾利用火災預警系統來預測建筑物火情以及分析縱火案。
加利福尼亞警方通過將一年內火災案件與當天天氣,建筑物自身因素等資料數據化,形成了一套火災級別與火災因素的擬合函數,當火災因素點越豐富時,擬合出來的火災隱情擬合函數曲線就越細膩平滑,精準度也就越高,進而形成經驗數據,有效提升火災預警能力。同時,警方也不放過那些異常點,因為往往異常點代表著具有“人為縱火”嫌疑,警方再通過對這些異常點的分析,找出隱藏在火災背后的案情。
聚類分析
不同于分類分析,聚類分析沒有先驗知識,一般是將一堆看似毫無規則的數據根據某種特征進行劃分,不同屬性的數據分到不同的組。警方可以根據時間或者空間為基準屬性,對采集到的身份證號,報警信息,手機串號等進行分組,進而發現可疑線索。
例如,某文物保護單位午夜時分發生文物盜竊案件,通過對該單位近一周內的監控錄像、手機串號等數據的采樣,警方首先將可疑目標鎖定在午夜時段出現的四個手機串號上,因為該時段不可能是正常游客參觀時段,具有可疑性,但由于作案人帶了頭套和手套,未能取得有價值的作案監控錄像。警方再對其余時間進行排查碰撞發現,在案發前三天,可疑目標手機串號出現在文物展覽時段,通過對該時段的監控錄像與手機串號進行排查定位,就可以有效縮小排查范圍。
關聯分析
用于在大量雜亂無章的數據中尋找有價值數據間的相關關系。
通過分析犯罪嫌疑人的基本信息、親朋好友、交通工具、銀行賬戶以及出行記錄等,就能繪制出一張犯罪嫌疑人的關系網,進而為警方快速掌握犯罪嫌疑人動向提供有力線索。
數據展示層
伴隨著大數據應用而出現的技術還有可視化展示技術,它能夠很直觀的將大數據分析產生的晦澀難懂的數據以圖表的形式展示出來,幫助警方根據圖表特征快速研判。本模型針對警務案件研判特點,選取了幾種常見的圖表模型做展示。
關聯關系圖
關聯關系圖與關聯分析算法配套使用,用于展示研判分析結果各元素之間的關系,該圖將各元素分為中心元素和關聯元素,關聯元素圍繞著中心元素展開。通常用于犯罪嫌疑主體與客體之間的關聯關系。【注:中心元素和關聯元素的要素類型可以相同,也可以不同】
時空時序圖
通常與分類分析算法、聚類分析算法配合使用,按照時空屬性,展示行為主體在一定時空范圍內的行為軌跡,通常用于展示犯罪嫌疑人或嫌疑車輛的行為軌跡。
熱點分布圖
通常與聚類分析算法配合使用,用于碰撞挖掘人員行為習慣,關聯關系以及異常行為之間的“共性”。
應用架構
基于物聯網技術的警務大數據分析模型本身不能直接破案,但它可以幫助警方縮小排查范圍,縮短排查用時。由于它需要整合多方信息資源,因此是一套跨部門,跨警種的分析應用模型。
水平維度
警方在辦案過程中經常會遇到多警種配合工作的情況,而各警種獲取線索信息的渠道可能有所不同,導致對同一個目標元素得到不同的數據,這時就需要對大家獲取的信息進行核實,并以某一個或多數人的信息為最終結論數據。(注:依靠物聯網技術獲取的數據會降低數據的差異性概率,但案件線索并非只有物聯網采樣數據,還有很多數據要通過其他渠道獲得)
垂直維度
在應用這套模型時,應該按照不同級別,職能分工使用。基層單位主要負責線索的采集,實際辦案單位則肩負線索采集和分析研判過程,而省廳則作直接利用分析研判結果,對各區域的治安情況,警員的工作情況進行分析考核。
建設難點
雖然物聯網、大數據已經不再是個陌生的技術,它也已經被廣泛應用到各行各業,小到“物品標簽”,大到“百度大數據分析計劃”,似乎這兩類技術無所不能,但事實上,要想充分發揮技術的優勢,還需要一定的條件。
物聯網,它被憧憬的應用形式之一便是連接城市,各種各樣的傳感器,視頻監控無處不在,追中人們的行動并生成大量的數據,從而更高效的管理城市,但物聯網技術的軟硬件缺乏一個統一或者相對統一的標準,很難靠一家技術公司就能對接,整合各家的設備或系統。
大數據,一項偉大的發明,它將“星占卜”變成了“現實”,但從它的詞意就可以知道,它的樣本即全部,需要大量且非單一的數據做支撐,“共享”必不可少,但首先要解決各部門間的信息壁壘,以及跨公安網信息交互引起的信息安全問題。
文章總結
雖然筆者通過理論依據以及工作實踐總結出了這套系統模型,但模型應用到實際,并構建出完整的可實用的軟件系統仍然有很長一段路需要走,這需要公安干警以及相關行業技術從業者的共同努力。
技術手段不可能直接用于破案,但如果能夠科學合理的應用,充分發揮它的作用,就能大大提升警方辦案效率。而這些都是建立在完備的管理機制和人員認識之上的,需要警方、科學工作者以及社會共同的努力。