大城市不僅僅是人類高度繁華的文化的體現,在其光鮮亮麗的背面,它也是滋養罪惡的溫床,大城市存在著大量的犯罪事件,其犯罪事件遠高于其他區域。因此,大城市的警察部門極其的盼望能夠更好的理解和預測犯罪事件,從而預防和避免犯罪事件給人們帶來的傷害,芝加哥警方就試圖通過數據分析來解決這一問題。
芝加哥警方首先基于芝加哥的城市網站構建了其分析的數據集,這里存放了芝加哥近十年來所有的犯罪記錄。這些數據詳細記錄著犯罪的信息,包括詳細的犯罪記錄,犯罪時間、地點,處理信息和處罰信息等,并基于分析的需要進行了相應的整理,以便進行更進一步的分析。
借助JMP的卓越的探索性分析功能,芝加哥警方對這些數據進行了大量的分析工作,例如,去探索犯罪行為同犯罪地點之間的行為模式,基于時間節點的犯罪類型分析等。基于上述的數據分析,芝加哥警方開展了大量的預防犯罪的工作,從而大大減少了犯罪事件的發生,減低了犯罪帶來的危害。
分析數據準備數據準備的首要任務就是基于犯罪類型對數據進行整理,對于類似的犯罪行為,也會根據危害程度進行更為細致的分組,這些都是進行精確分析的必要準備工作。由于JMP強大的圖形化分析功能,本次項目不僅僅在分析階段大量使用了JMP的圖形化分析,在數據準備階段也大量采用了JMP的快速制圖。例如,由于對犯罪類型進行過多的分類,反而增加了識別趨勢的難度,這時就需要基于分類的情況進行調整,使得犯罪的類型更為合理。
由于周末同工作日也存在著犯罪的差異,因此也需要對日期進行特殊的處理。我們按照星期的周期,將日期進行標注,以便進行休息日同工作日的犯罪情況對比分析。除此之外,數據處理還將一些過多重復標示案例的編碼諸如案件編號,FBI編碼等一些對于分析沒有幫助的信息進行了刪減。
通過對數據進行清洗、刪減和整合,我們得到了分析所需的全部的標準化數據,這將大大幫助我們的后續分析工作。
圖形化的分析JMP豐富的圖形化分析工具,幫助芝加哥進行快速的進行各項犯罪事件的分析。在本次項目中,警方采用了大量的圖形化進行分析工作,如條形圖,折線圖,等高線圖等等。
例如,警方采用柱狀圖和等高線圖進行基于犯罪類型和地理區域的分析工作。通過使用柱狀圖,警方能夠對各種犯罪類型進行分類,這樣就可以很清晰看到不同犯罪類型的情況。
圖:整體犯罪類型分析
如上圖所示,我們通過柱狀圖便可以很清晰的看到不同類型的犯罪類型的數量以及整體對比的情況,使得我們對芝加哥整體的犯罪情況有了一個大致的了解。接下來,我們將通過時間,星期等更多的維度對犯罪情況進行更加深入的分析。例如,我們通過對不同時間段的分解,可以查看不同種類的犯罪類型在不同時段的變化情況。
圖:基于時段的犯罪類型分析
除此之外,我們還可以對日期和經緯度信息對犯罪類型進行分析,查看不同日期和地理信息的地點的各類犯罪的對比情況,從而使得警方對犯罪情況有一個更加深入的認識。
圖:基于日期和經緯度的犯罪類型分析
通過上述的圖形化分析,芝加哥警方能夠對犯罪類型有了更加清晰的認識,具體如下:
盜竊(包括搶劫和偷盜)是最為常見的犯罪,他們多發生在周五和周六;
周二和周五是犯罪事件發生最多的兩天;
不同的區域對于犯罪類型也存在著一定的差異,如,搶劫是第1區域最為普遍的犯罪類型,而人身傷害則在第4區域發生最多;性騷擾在第2區域發生最多;毒品濫用則是在第5區域;其他犯罪則在第1區域發生最多;
犯罪多發時間段為下午3點到12點,不同時間段也存在著犯罪類型的變化。
總結及展望通過JMP靈活的圖形化分析手段,芝加哥警方進行了快速的犯罪事件分析,很快就發現了犯罪事件的相關規律,為更好的進行犯罪事件的預防提供了保障。除了這些常規性的圖形分析之外,JMP還提供了基于六西格瑪質量改善的全套工具,幫助警方能夠快速識別犯罪類型及其原因,從而幫助芝加哥警方有效改善犯罪事件的發生,為創建一個更為安全的都市提供了極大的幫助。