弗吉尼亞大學(University of Virginia)的研究人員證明,如果應用正確的分析方法的話,推特可以預測某些類型的犯罪。
上個月發表在科學期刊《決策支持系統》(Decision Support Systems)上的一篇研究論文稱,對帶有地理標簽的推文進行分析,有助于預測19到25種類型的犯罪,尤其是跟蹤、盜竊和某些類型的襲擊等犯罪行為。
該大學預測技術實驗室的首席研究員馬修·格伯說,研究結果令人驚訝,尤其是考慮到人們很少在推特上直接談論犯罪。
格伯說,即使是那些與犯罪沒有直接聯系的推特,也可能包含與犯罪活動相關的信息。
“人們在twitter上談論的是他們的日常活動,”格伯告訴美國警察聯合會。“這些日常活動會將他們帶入可能發生犯罪的環境。
“所以如果我在推特上說今晚喝醉了,很多人也都在談論喝醉了,那我們就知道有些犯罪與那些導致犯罪的東西有關,這是間接的。”
在這項研究中,格伯和他的同事分析了來自芝加哥的推特信息,這些推特被標記在特定的社區——以每平方公里為單位衡量——以及該市的犯罪數據庫中。
然后,他們查找歷史信息,就能夠對可能發生某些犯罪的地區作出有用的預測——這可能有助于部署警察資源。
該研究稱:“這種方法使分析人員能夠快速地觀察和識別犯罪率歷史最高的地區。”
“未來的犯罪經常發生在過去的犯罪附近,這使得熱點地圖成為一個很有價值的犯罪預測工具。”
近年來,“預測式警務”的理念得到了推動,警務部門開始依靠IBM等公司的“大數據”分析。
這項研究是繼其他研究之后的又一項研究,這些研究顯示如何分析推文來預測選舉、疾病爆發和其他重要事件。
我發送我們的算法
格伯說,Twitter的數據相對容易使用,因為推文是公開的,而且其中很多都帶有位置信息。
此外,研究人員自己也不需要進入高犯罪率地區去研究這些信息。
相反,“我將我們的算法發送到這些地點,看看人們在談論什么,”格伯說。
“計算機算法學習這些犯罪模式并做出預測。”
這項研究是由美國陸軍資助的,格伯說,美國陸軍使用類似的技術來確定伊拉克和阿富汗等地的威脅。
但格伯指出,這項技術也是有局限性的,它需要有足夠的歷史數據,一些犯罪,如綁架和縱火,可能不會具有相同的可預測性模式,原因研究人員也無法解釋。
不過,他說紐約警察局已經與他取得了聯系,他已經開始審查該市的數據,以確定芝加哥的成果是否可以在紐約市被復制。
他希望能夠從其他社交媒體上獲取信息,看看這些信息是否有助于改善預測。
最終,一個重要的目標是弄清楚這項技術是否可以以一種非常實用的方式投入使用。
他說:“我們沒有說明這項技術是否減少了犯罪,那是接下來的步驟之一。”