行業(yè)大數(shù)據(jù)帶來(lái)的變革與機(jī)遇
公共安全一直以來(lái)都是國(guó)家的重要根基,是國(guó)家發(fā)展的前提。隨著國(guó)家對(duì)公共安全的重視、公共安全領(lǐng)域項(xiàng)目的不斷增多和系統(tǒng)的持續(xù)運(yùn)行,積累的各種數(shù)據(jù)日益增多(比如音頻數(shù)據(jù)、視頻數(shù)據(jù)、卡口系統(tǒng)數(shù)據(jù)、DNA、指紋、人像模型、空間位置(GPS)數(shù)據(jù)、報(bào)警數(shù)據(jù)、社交網(wǎng)絡(luò)及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)、射頻(RFID)數(shù)據(jù),以及其他傳感器數(shù)據(jù))。如何將這些數(shù)據(jù)資源充分利用,使數(shù)據(jù)能夠更好地服務(wù)于公安的情報(bào)分析、公共交通、輿情分析等業(yè)務(wù)工作,并更好的驅(qū)動(dòng)業(yè)務(wù)創(chuàng)新,特別是成為應(yīng)急、維穩(wěn)、偵查破案的核心競(jìng)爭(zhēng)力,成為行業(yè)步入大數(shù)據(jù)時(shí)代公安實(shí)戰(zhàn)信息化的首要目標(biāo)。
大數(shù)據(jù)帶來(lái)的變革
首先,犯罪環(huán)境正變得日益復(fù)雜,由案件本身獲取到的數(shù)據(jù),越來(lái)越難以支撐起嚴(yán)密的邏輯推論。辦案人員不得不去想方設(shè)法獲取更多“場(chǎng)外”數(shù)據(jù)以補(bǔ)充證據(jù)鏈條。原本依靠于人腦記憶和檔案搜索的狀態(tài),每一個(gè)線索的提取都需要依靠記憶提取,對(duì)于無(wú)法直接確認(rèn)的線索信息又需要翻查相應(yīng)的檔案,不僅容易出錯(cuò),而且效率極低。大數(shù)據(jù)的匯聚已是必然。
其次,隨著社會(huì)形勢(shì)的發(fā)展變化,傳統(tǒng)“從案到人”偵查模式明顯被動(dòng)滯后。 “由人到案”一直都是“大情報(bào)”建設(shè)的重大課題,也是難題。實(shí)踐證明,“由人到案”是迫切需求,而大數(shù)據(jù)的技術(shù)也使得這種新模式成為可能。
大數(shù)據(jù)與應(yīng)急
大數(shù)據(jù)在進(jìn)入人們視野之初,便是一個(gè)一個(gè)神奇的案例,沃爾瑪超市“啤酒與尿不濕”的故事、天貓商城“雙11”對(duì)于銷量額的精準(zhǔn)預(yù)測(cè)、京東商城通過(guò)數(shù)據(jù)預(yù)測(cè)銷售,提早通過(guò)物流運(yùn)送到附近倉(cāng)庫(kù)、美國(guó)大數(shù)據(jù)公司Palantir憑借其大數(shù)據(jù)分析系統(tǒng),在抓捕本拉登的行動(dòng)中,通過(guò)數(shù)據(jù)分析得出本拉登的藏匿點(diǎn)線索信息。
大數(shù)據(jù)的背后,蘊(yùn)藏著一套“規(guī)則”,也許由于數(shù)據(jù)深度與數(shù)據(jù)廣度超出人類的認(rèn)知能力,我們并無(wú)法推論為什么,但結(jié)果就放在那里不由分說(shuō)。因此,借助大數(shù)據(jù),既可以預(yù)測(cè)某一區(qū)域乃至全國(guó)的某種類型的犯罪趨勢(shì),也可以預(yù)測(cè)某一時(shí)間某一具體地點(diǎn)某種類型的犯罪,還可以預(yù)測(cè)某一個(gè)體的犯罪概率。根據(jù)預(yù)測(cè),我們可以制訂計(jì)劃,優(yōu)化警力配置,提升行動(dòng)效率。
大數(shù)據(jù)之與社會(huì)維穩(wěn)
互聯(lián)網(wǎng)成為人們?nèi)粘=涣鳌⒈磉_(dá)思想和宣泄情緒的重要平臺(tái),也是相關(guān)內(nèi)容安全保障的重要平臺(tái)。網(wǎng)絡(luò)輿論已成為社會(huì)輿論的重要組成部分,越來(lái)越多地引起全社會(huì)的高度重視。
搜索引擎、微博、微信、論壇、貼吧等互聯(lián)網(wǎng)輿論集中的區(qū)域,搜集這些數(shù)據(jù)便獲取到了以往無(wú)法掌握的社會(huì)輿論動(dòng)向,熱度輿論、以及輿論領(lǐng)袖。一些**件、突發(fā)事件和熱點(diǎn)、敏感問(wèn)題在網(wǎng)上被惡意炒作,如“表哥”事件、渭河污染事件等與環(huán)境相關(guān)的輿論形成強(qiáng)大的網(wǎng)上輿論氣候,各種負(fù)面信息通過(guò)互聯(lián)網(wǎng)的各種服務(wù)方式快速、廣泛傳播,嚴(yán)重影響社會(huì)穩(wěn)定和政府單位形象。互聯(lián)網(wǎng)不僅是現(xiàn)實(shí)社會(huì)的虛擬映像,還是現(xiàn)實(shí)問(wèn)題的聚焦鏡和放大器。
通過(guò)輿情機(jī)制,一方面可以加強(qiáng)互聯(lián)網(wǎng)信息監(jiān)管,另一方面,對(duì)于及時(shí)應(yīng)對(duì)網(wǎng)絡(luò)突發(fā)的公共事件和全面掌握社情民意,并對(duì)于及時(shí)發(fā)現(xiàn)社會(huì)蘊(yùn)藏的潛在不穩(wěn)定因素,提早預(yù)防起著重要作用。
問(wèn)題和挑戰(zhàn)
新形勢(shì)下的公安工作離不開(kāi)大數(shù)據(jù)的支撐,公安基礎(chǔ)信息化更是大數(shù)據(jù)的挖掘和深度應(yīng)用。然而,越來(lái)越多的公安科技部門發(fā)現(xiàn),基于新的大數(shù)據(jù)形態(tài),技術(shù)瓶頸逐步顯現(xiàn)。一方面,這些海量數(shù)據(jù)需要強(qiáng)大的存儲(chǔ)和計(jì)算平臺(tái)來(lái)進(jìn)行實(shí)時(shí)處理;另一方面,當(dāng)前數(shù)據(jù)呈現(xiàn)出數(shù)據(jù)量大、數(shù)據(jù)種類多、數(shù)據(jù)增長(zhǎng)快的特點(diǎn),該如何通過(guò)大數(shù)據(jù)挖掘分析改進(jìn)公共安全管理能力,提高政府決策服務(wù)能力,為人民生活提供有價(jià)值的信息服務(wù)。如何在數(shù)據(jù)資源整合的基礎(chǔ)上建立數(shù)據(jù)共享應(yīng)用機(jī)制,利用全警及社會(huì)面資源,形成信息化研判平臺(tái)支撐公安實(shí)戰(zhàn)工作引領(lǐng)大數(shù)據(jù)時(shí)代的公安信息化管理發(fā)展,服務(wù)于人民群眾生活和國(guó)家經(jīng)濟(jì)社會(huì)建設(shè)顯得尤為重要。
數(shù)據(jù)處理
在信息化社會(huì)中,信息可劃分為兩大類,其中能夠用數(shù)字或統(tǒng)一的結(jié)構(gòu)加以表示的為結(jié)構(gòu)化數(shù)據(jù),如數(shù)字,符號(hào);而另一類信息無(wú)法用統(tǒng)一結(jié)構(gòu)表示的則為非結(jié)構(gòu)化數(shù)據(jù);在數(shù)據(jù)的應(yīng)用過(guò)程中,最常見(jiàn)到,也是使用最方便的當(dāng)然就是結(jié)構(gòu)化數(shù)據(jù)了,結(jié)構(gòu)化數(shù)據(jù)可以更好的做數(shù)據(jù)統(tǒng)一和檢索查詢從而更好的進(jìn)行數(shù)據(jù)碰撞和挖掘分析等操作。相對(duì)的非結(jié)構(gòu)化數(shù)據(jù)在檢索和應(yīng)用上就困難很多。
在公安信息化建設(shè)和平安/智慧城市建設(shè)中各類結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),摻雜其中(如系統(tǒng)數(shù)據(jù)庫(kù)數(shù)據(jù)、日志數(shù)據(jù)、監(jiān)控視頻數(shù)據(jù)、卡口圖片數(shù)據(jù)、測(cè)量、圖表等數(shù)據(jù))。現(xiàn)有的公安系統(tǒng)在數(shù)據(jù)應(yīng)用中往往只能將結(jié)構(gòu)化數(shù)據(jù)做簡(jiǎn)單應(yīng)用,雖在借助標(biāo)準(zhǔn)的開(kāi)源大數(shù)據(jù)技術(shù)后,基本可實(shí)現(xiàn)絕大部分對(duì)于大數(shù)據(jù)的應(yīng)用需求。然而,多數(shù)非結(jié)構(gòu)化數(shù)據(jù)則并沒(méi)有發(fā)揮該有的作用。
另外,公安大數(shù)據(jù)是由眾多不同用途,不同結(jié)構(gòu)的系統(tǒng)數(shù)據(jù)匯聚而來(lái)的。在數(shù)據(jù)的匯集管理工作中,如何高效穩(wěn)定的轉(zhuǎn)換數(shù)據(jù),并且建立可視化的數(shù)據(jù)集成系統(tǒng),實(shí)現(xiàn)對(duì)數(shù)據(jù)整合過(guò)程的輕松管理,定將是大數(shù)據(jù)應(yīng)用最為重要的基礎(chǔ)。
數(shù)據(jù)統(tǒng)一
受到信息化建設(shè)階段性特點(diǎn)制約,以前制定的標(biāo)準(zhǔn)大多是從單一業(yè)務(wù)出發(fā),解決局部問(wèn)題,這樣就造成了數(shù)據(jù)缺少統(tǒng)一規(guī)范,數(shù)據(jù)關(guān)聯(lián)性不夠,相互孤立。比如,現(xiàn)場(chǎng)勘查信息與案件信息不關(guān)聯(lián)、案件信息與圖片信息不關(guān)聯(lián)、案件信息與被盜搶車輛信息不關(guān)聯(lián)。無(wú)法實(shí)現(xiàn)案件、人員、現(xiàn)場(chǎng)勘查、痕跡、物品等信息關(guān)聯(lián)查詢。
公安數(shù)據(jù)雖然龐大,但卻分散在不同的部門手中,各組織機(jī)構(gòu)間缺少數(shù)據(jù)的有效管理和打通,造成數(shù)據(jù)不能有效利用。雖然目前隨著政策和觀念的放開(kāi),情況有所改善,但缺少統(tǒng)一的系統(tǒng),信息難以共享,“信息孤島”仍然存在。公安要談大數(shù)據(jù)實(shí)戰(zhàn),需要在機(jī)制和技術(shù)上打通壁壘,統(tǒng)一資源,只有將數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)字段(包含數(shù)據(jù)庫(kù)字段、結(jié)構(gòu)化后的描述字段等)、用戶等資源做好統(tǒng)一,才能真正形成大數(shù)據(jù)資源,為以后的數(shù)據(jù)挖掘、研判分析做出更有效的數(shù)據(jù)支撐。
數(shù)據(jù)分析
目前公安信息化數(shù)據(jù)庫(kù)中匯集有大量的信息數(shù)據(jù),但由于以往的數(shù)據(jù)價(jià)值的忽視和處理手段的欠缺導(dǎo)致數(shù)據(jù)應(yīng)用簡(jiǎn)單,僅僅是對(duì)數(shù)據(jù)的單方面進(jìn)行解讀應(yīng)用,沒(méi)有對(duì)數(shù)據(jù)進(jìn)行多種數(shù)據(jù)源、多途徑以及多維度的串并分析,無(wú)法發(fā)揮出數(shù)據(jù)的潛在價(jià)值。
在公安眾多應(yīng)用場(chǎng)景中,往往需要對(duì)反饋時(shí)間有很強(qiáng)大要求(比如首次入城分析、實(shí)時(shí)熱力分布情況等),這些應(yīng)用場(chǎng)景如果超出要求時(shí)間,不僅無(wú)法提供幫助,反而有可能造成誤導(dǎo)。這就要求對(duì)于上億條記錄的檢索、上千張表的碰撞、幾百個(gè)小時(shí)的視頻分析、以及大量的移動(dòng)互聯(lián)網(wǎng)和社交媒體數(shù)據(jù)處理等應(yīng)用,無(wú)不對(duì)大數(shù)據(jù)系統(tǒng)的數(shù)據(jù)分析能力提出更高的要求。所以,不盲目的采用熱門技術(shù),通過(guò)針對(duì)不同場(chǎng)景,采用不同的數(shù)據(jù)分析模型和算法,才能更好的解決實(shí)戰(zhàn)面臨的數(shù)據(jù)分析要求。
數(shù)據(jù)展現(xiàn)
圖像是視覺(jué)媒體中一種非常重要的表現(xiàn)形式。在人類能夠直接感知的眾多媒體信息中,視覺(jué)媒體是人類最豐富的信息來(lái)源。統(tǒng)計(jì)表明,人類在感知外界信息的過(guò)程中,視覺(jué)獲取的信息高達(dá)65%。數(shù)據(jù)信息是一種具有深層次內(nèi)涵、更易被理解吸收的跨越語(yǔ)種障礙的語(yǔ)言。
在公安的應(yīng)用場(chǎng)景中,需要在城市數(shù)千萬(wàn)人中發(fā)現(xiàn)異常,挖掘關(guān)系,呈現(xiàn)規(guī)律。要在處理海量的數(shù)據(jù)時(shí),原本的文字和數(shù)字無(wú)法呈現(xiàn)的規(guī)律,通過(guò)圖形的方式展現(xiàn)的方式明顯比其它展現(xiàn)方式更直接,更清晰。所以更加美觀、簡(jiǎn)潔、清晰的數(shù)據(jù)展現(xiàn)方式往往比更大量的數(shù)據(jù)堆疊要有意義。
數(shù)據(jù)安全
公安系統(tǒng)中很多數(shù)據(jù)關(guān)系著國(guó)家安全和人民生命財(cái)產(chǎn)安全,大數(shù)據(jù)系統(tǒng)作為整合分析者,匯聚有更大體量的敏感數(shù)據(jù),所以信息泄露帶來(lái)的問(wèn)題將會(huì)是十分嚴(yán)重的。因此,大數(shù)據(jù)在管理上要求要更加嚴(yán)格,從單點(diǎn)登錄、PKI認(rèn)證、數(shù)據(jù)水印、日志審計(jì)等,不論是從底層技術(shù)層面、上層認(rèn)證方式、還是安全管理機(jī)制,都要有相對(duì)應(yīng)的提升,才能保證數(shù)據(jù)安全。
大數(shù)據(jù)公安業(yè)務(wù)應(yīng)用現(xiàn)狀和思路
可以看出大數(shù)據(jù)在公共安全方面的潛力巨大,同時(shí)問(wèn)題也同樣嚴(yán)峻。依靠互聯(lián)網(wǎng)、通訊行業(yè)這些數(shù)據(jù)大戶的“委培”,大數(shù)據(jù)已經(jīng)日益成熟。它能承載數(shù)以千億計(jì)的數(shù)據(jù)量,快速反饋分析結(jié)果。能挖掘PB計(jì)的數(shù)據(jù),發(fā)現(xiàn)潛在的規(guī)則。我們有HADOOP、SPARK、機(jī)器學(xué)習(xí)等的巨人為基礎(chǔ),但還必須站在它的肩膀上遠(yuǎn)眺。
公安有自己的實(shí)際情況,它沒(méi)有互聯(lián)網(wǎng)數(shù)據(jù)如此的數(shù)據(jù)量,也沒(méi)有金融、電商行業(yè)如此大的峰值吞吐量,但卻有極為復(fù)雜的數(shù)據(jù)維度、數(shù)據(jù)源和業(yè)務(wù)應(yīng)用場(chǎng)景。所以,公安對(duì)于大數(shù)據(jù)應(yīng)用的需求,并不是要建設(shè)一套世界最快的平臺(tái),而是根據(jù)數(shù)據(jù)類型選擇最合適的處理工具,根據(jù)用戶業(yè)務(wù)應(yīng)用選擇最實(shí)用的分析和展示幫助研判人員理清思路,挖掘重點(diǎn)。所以公安大數(shù)據(jù)具有其特殊性,理應(yīng)應(yīng)該是一個(gè)“混搭”型模式,不應(yīng)是從標(biāo)準(zhǔn)的開(kāi)源社區(qū)拿來(lái)一套標(biāo)準(zhǔn)架構(gòu)就可以直接套用的。無(wú)論是從數(shù)據(jù)源的結(jié)構(gòu)化、數(shù)據(jù)統(tǒng)一化,到核心的大數(shù)據(jù)運(yùn)算模型,存儲(chǔ)結(jié)構(gòu)。還是應(yīng)用層面的數(shù)據(jù)挖掘、碰撞模型建立、數(shù)據(jù)展示、數(shù)據(jù)安審機(jī)制。每一個(gè)環(huán)節(jié)都需要從公安的核心業(yè)務(wù)出發(fā),只有這樣的大數(shù)據(jù)系統(tǒng)才是公安需要的,能真正幫助公安業(yè)務(wù)發(fā)展的。
正是秉持這一思路,企業(yè)一方面投入大量人力深度研究公安業(yè)務(wù)員和大數(shù)據(jù)技術(shù),力求公安用戶對(duì)于大數(shù)據(jù)應(yīng)用的急迫需求,充分結(jié)合公安數(shù)據(jù)特性,從工具的選擇,開(kāi)源架構(gòu)的優(yōu)化,應(yīng)用的分析模型為核心秉承“最合適的才是最好的”原則,為公安用戶的大數(shù)據(jù)應(yīng)用量身定做。另一方面,基于自身對(duì)于公安業(yè)務(wù)的充分理解,國(guó)家政策的支持和對(duì)市場(chǎng)需求的前瞻,推出公安大數(shù)據(jù)平臺(tái)。
警務(wù)實(shí)戰(zhàn)的發(fā)展必然走向大數(shù)據(jù),但大數(shù)據(jù)并非是完美的終點(diǎn)。大數(shù)據(jù)不是無(wú)所不能,更不能替代干警精英。大數(shù)據(jù)是我們的耳目、觸手,我們希望的是將大數(shù)據(jù)與我們的業(yè)務(wù)直覺(jué)完美融合,借助大數(shù)據(jù)在海量數(shù)據(jù)間任意遨游,使數(shù)據(jù)為我們所用,對(duì)社會(huì)的安定和繁榮發(fā)揮其更大的作用。