機器學習是當今最具競爭力的技術產業之一,也是最受關注的領域之一。近日,谷歌宣布正與Propublica進行合作,利用機器學習技術追蹤甚至預測美國各地的仇恨犯罪。這是一個很有意思、也很有實際效用的概念,尤其在這段時間,美國仇恨犯罪在這段時間內一直是個大問題,弗吉尼亞州種族主義暴亂事件鬧得風風火火,事件當天就導致了至少1人死亡、34人受傷。不過,這個基于機器學習的新型商業項目是否改變現狀仍有待觀察。
犯罪記錄保存一直是一個有爭議的概念。經常會有各種各樣的細節從來沒有被記錄下來,或者記錄得不夠準確。找到一個解決這個問題的辦法并不容易。既然我們生活在數字時代,那么大家就會理所應當地認為記錄保存將變得不再困難。但遺憾的是,事實并非如此。在這個領域,即便有完善的文檔存儲管理系統,數據收集的工作也總會有一定的不足。
當涉及到記錄和跟蹤仇恨犯罪的時候。還有很多工作要做。鑒于最近在美國全國范圍內涉及潛在仇恨犯罪的活動,追蹤歷史上這些重要時刻變得更加重要。谷歌和Propublica表示,必須創建一個解決方案,他們也非常希望找到解決方案。這些公司計劃聯合使用機器學習作為記錄這些犯罪的工具。在此之前,人工智能從來沒有被用于這個特殊目的,但它似乎很容易做到這一點。
“仇恨新聞索引”將在網上搜索涉及仇恨犯罪的新聞文章。然后,它將收集這些信息,并試圖建立更大的圖景。它只會使用谷歌新聞文章的原始信息流,然后通過谷歌云自然語言API創建一個可視化工具。這些信息將會不間斷且實時更新。
看看這個工具在未來幾個月和幾年里的表現將會很有趣。基于仇恨犯罪、偏見或辱罵的不同來源的文章,將會產生一些很少有人期望的結果。它還可以指出,許多此類犯罪實際上是在沒有大多數人意識到的情況下發生的。記錄仇恨新聞指數的最終結果將不可避免地讓許多人感到震驚,并可能讓他們感到不舒服。
這個新平臺只能追溯到今年2月的新聞。這個參考點似乎不是很全面,但是現在只有這么多的信息需要聚集在一起。隨著項目的進展,兩家公司都有可能擴大業務范圍。目前,焦點僅集中在收集與前六個月相關的信息。首先要考慮的是,一開始,主流媒體從未報道過許多仇恨犯罪。不過,這個工具可以在較小的博客上找到一些信息,只要它們被谷歌新聞索引。
看到像機器學習和人工智能這樣的新興技術正被用于積極的目的,讓人耳目一新。與其把重心放在金融部門或自動駕駛汽車這些事情上,不如開始著手解決當今社會普遍存在的一些問題。仇恨犯罪是一個非常大的問題,包括美國、中國甚至世界各地,我們希望谷歌的新工具對包括記者和研究人員在內的各方都有幫助。