隨著美國硅谷開始挖掘全球的數(shù)據(jù),人們沒有忘記大數(shù)據(jù)世界是如此的復雜。特別是非洲在世界上許多數(shù)據(jù)集上呈現(xiàn)出一個明顯的空白時,但這個差距究竟有多大?
Facebook公司創(chuàng)始人馬克·扎克伯格表示,F(xiàn)acebook的原始熱門主題Feed幾乎完全沒有來自非洲的新聞來源,這意味著幾乎不可能有來自非洲大陸的Facebook公司用戶,除非他們被美國媒體覆蓋,才會有非洲大陸的大多數(shù)事件。
其余的社交媒體的情況也不是更好,Twitter也沒有真正進入整個非洲大陸。這就很有問題因為定義大數(shù)據(jù)革命的“社交媒體監(jiān)控”領域的大部分都是基Twitte的firehose,因此這意味著將錯過非洲和中東地區(qū)的市場。
2012-2014年期間Twitter大量活動的地點
當涉及到網絡搜索引擎,其市場似乎沒有任何更好的發(fā)展。Google公司的趨勢小組在2016年6月生成了一張地圖,顯示了美國人在2016年搜索全球的每個國家/地區(qū)的頻率。非洲則獨樹一幟,成為搜索次數(shù)最少的大陸。
美國人在Google上針對世界各國搜索的頻率的地圖
這些地圖清楚地說明了人們根本不談論非洲,而且沒有足夠的興趣去探索非洲。這就提出了這樣一個問題:新聞媒體是否同樣不覆蓋非洲大陸,或者是否有大量報道,但它根本沒有與人們產生共鳴。
以下的地圖顯示了2015年3月“紐約時報”和BBC報道中提到的所有地點。雖然非洲當然被提及,但這個地圖清楚地表明,非洲并不是兩個媒體報道的的優(yōu)先事項。
當然,網絡不是唯一的新聞來源,電視新聞仍然在美國發(fā)揮著關鍵作用。然而,如下圖所示,電視新聞在其對非洲的覆蓋不是太好。如果人們觀察每個月在美國電視新聞上提到的所有位置的地圖,人們多數(shù)對非洲缺乏興趣在,往往多個月都沒有提到一個特定國家。
事實上,下面的地圖與Google趨勢地圖有著驚人的相似之處,美國人在哪些國家搜索最多。這并不能告訴人們缺乏媒體關注導致缺乏搜索興趣,反之亦然,但是相似之處是顯著的。總之,媒體沒有覆蓋非洲,人們并沒有尋找非洲事物的興趣。
即使是擁有豐富的資源的美國情報界,似乎對非洲沒有什么興趣。在1994-2004年期間,美國OSINT機構(負責監(jiān)測世界各地的新聞和其他“開放”資源)大部分通過歐洲媒體(如法新社)的報道觀察了非洲大陸,并幾乎沒有實際監(jiān)測非洲各國的站點。事實上,這是美國政府資助的監(jiān)測項目錯過了埃博拉疫情的第一次爆發(fā)的原因之一,因為這些早期警報標志首先出現(xiàn)在美國的法語廣播電臺。
如果人們不在談論非洲,并不在網絡尋找它時,那些西方網絡和電視新聞媒體似乎并不覆蓋非洲大陸。在擁有撒哈拉沙漠,人口密度低的非洲,事實上有相當多的媒體和媒體報道的事件,而這些也被傳統(tǒng)的西方網站和社交媒體錯過。
將這些結合在一起,人們看到“大數(shù)據(jù)”提供了令人難以置信全球社會的一瞥,非洲大陸十分缺乏人們的關注,而對于傳統(tǒng)的大數(shù)據(jù)集,如社交媒體的分析捕獲非洲國家的地方事件和觀點則非常糟糕。然而,由于大數(shù)據(jù)的發(fā)展,以及機器翻譯等技術的應用,有可能使非洲大陸重新回到“大數(shù)據(jù)”分析的視野。數(shù)據(jù)科學界需要的是更加重視確保人們使用的數(shù)據(jù)集在地理上代表整個世界的努力方向。