中國科技網3月5日報道(張微 編譯)隨著最不可預知的英國大選的臨近,我們如何利用媒體報道的大數據來分析理解大選呢?一項新的研究首次分析了超過13萬網絡新聞,試圖發現2012年美國總統大選時媒體的報道傾向。
布里斯托大選智能系統實驗室(ISL)的學者人工智能教授Nello Cristianni,利用大數據的方法分析了2012年美國總統大選時大眾媒體的報道內容。這篇論文發表在《大數據和社會》雜志上。
這是首次從大量在線新聞中自動獲取政治立場的科學研究。研究創建的系統使用了更加豐富的文本語言分析法,優越于傳統的詞匯聯想網絡。
通過分析總統候選人,奧巴馬和羅姆尼的個人活動,研究團隊主要研究了媒體如何報道每一次競選活動,同時發現了2012年競選期間媒體報道中的一個關鍵問題是奧巴馬為他的經濟政策辯護。
研究結果表明,媒體聚焦報道的是民主黨關注美國經濟和公民權利的問題。總的來說,媒體報道內容中對民主黨的正面評論多于共和黨,也就是說媒體的報道更傾向民主黨。
研究發現共和黨比民主黨擁有更多的具爭議性的觀點。競選中最具有爭議性的話題是兩個陣營對于減免稅收和經濟問題的不同觀點,同時在同性戀婚姻問題上也存在分歧。
智能系統實驗室(ISL)計算機科學系的研究助理,也是個項目的主要研究人員Saatviga Sudhahar說:“由于先進民主國家言論的自由性,有關大選的報道數據可以稱得上海量,所以覆蓋所有網絡媒體和紙媒體有關大選的報道內容是一項非常具有挑戰性的工作。”
“我們相信,這項研究所用方法——通過提取相關數據進行本文語言分析是一個重大的進步,幫助我們了解重大事件。”
研究團隊使用了分析文本的語義圖,并將它與識別出的名詞短語和動詞相聯系。主語——謂語——賓語這三項被用來建立網絡構建塊。這種方法從來沒有應用到數據量超大的數據庫中,要分析數以百萬計的文件才能完成這項研究。
利用媒體數據和關系圖,研究人員發現了支持和反對共和黨與民主黨陣營的獨特的、混合的聲音。
研究團隊發現,政治立場的范圍可以從媒體報道的每一個競選者的聲明中可靠地分析出來。網絡上分裂成的兩大陣營提供了強有力的證據,主要的政治關系可以通過大數據分析這種方法來發現。