隨著最不可預知的英國大選的臨近,我們?nèi)绾卫妹襟w報道的大數(shù)據(jù)來分析理解大選呢?一項新的研究首次分析了超過13萬網(wǎng)絡(luò)新聞,試圖發(fā)現(xiàn)2012年美國總統(tǒng)大選時媒體的報道傾向。
布里斯托大選智能系統(tǒng)實驗室(ISL)的學者人工智能教授Nello Cristianni,利用大數(shù)據(jù)的方法分析了2012年美國總統(tǒng)大選時大眾媒體的報道內(nèi)容。這篇論文發(fā)表在《大數(shù)據(jù)和社會》雜志上。
這是首次從大量在線新聞中自動獲取政治立場的科學研究。研究創(chuàng)建的系統(tǒng)使用了更加豐富的文本語言分析法,優(yōu)越于傳統(tǒng)的詞匯聯(lián)想網(wǎng)絡(luò)。
通過分析總統(tǒng)候選人,奧巴馬和羅姆尼的個人活動,研究團隊主要研究了媒體如何報道每一次競選活動,同時發(fā)現(xiàn)了2012年競選期間媒體報道中的一個關(guān)鍵問題是奧巴馬為他的經(jīng)濟政策辯護。
研究結(jié)果表明,媒體聚焦報道的是民主黨關(guān)注美國經(jīng)濟和公民權(quán)利的問題。總的來說,媒體報道內(nèi)容中對民主黨的正面評論多于共和黨,也就是說媒體的報道更傾向民主黨。
研究發(fā)現(xiàn)共和黨比民主黨擁有更多的具爭議性的觀點。競選中最具有爭議性的話題是兩個陣營對于減免稅收和經(jīng)濟問題的不同觀點,同時在同性戀婚姻問題上也存在分歧。
智能系統(tǒng)實驗室(ISL)計算機科學系的研究助理,也是個項目的主要研究人員Saatviga Sudhahar說:“由于先進民主國家言論的自由性,有關(guān)大選的報道數(shù)據(jù)可以稱得上海量,所以覆蓋所有網(wǎng)絡(luò)媒體和紙媒體有關(guān)大選的報道內(nèi)容是一項非常具有挑戰(zhàn)性的工作。”
“我們相信,這項研究所用方法——通過提取相關(guān)數(shù)據(jù)進行本文語言分析是一個重大的進步,幫助我們了解重大事件。”
研究團隊使用了分析文本的語義圖,并將它與識別出的名詞短語和動詞相聯(lián)系。主語——謂語——賓語這三項被用來建立網(wǎng)絡(luò)構(gòu)建塊。這種方法從來沒有應(yīng)用到數(shù)據(jù)量超大的數(shù)據(jù)庫中,要分析數(shù)以百萬計的文件才能完成這項研究。
利用媒體數(shù)據(jù)和關(guān)系圖,研究人員發(fā)現(xiàn)了支持和反對共和黨與民主黨陣營的獨特的、混合的聲音。
研究團隊發(fā)現(xiàn),政治立場的范圍可以從媒體報道的每一個競選者的聲明中可靠地分析出來。網(wǎng)絡(luò)上分裂成的兩大陣營提供了強有力的證據(jù),主要的政治關(guān)系可以通過大數(shù)據(jù)分析這種方法來發(fā)現(xiàn)。