精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

基于網絡大數據的社會心理學研究進展

責任編輯:editor007 作者:樂國安 賴凱聲 |來源:企業網D1Net  2016-11-03 22:15:04 本文摘自:《蘇州大學學報:教育科學版》

以互聯網和信息科學技術的快速發展推動的信息技術革命,使得人類步入了數據充裕的數字化信息時代。在生產、存儲數據的能力獲得了巨大發展的信息化時代,人們生活在一個規模難以想象的龐大數字化世界里。人們在論壇、博客、微博、微信、電子商務交易平臺、搜索引擎等平臺上積累的海量數據,成為大數據時代寶貴的信息資源和財富。目前,大數據已經被廣泛應用于政治選舉、企業(尤其是電子商務公司)戰略布局、金融交易、生物研發、醫療衛生、國防安全、公共管理、社會治安、交通管理、氣象監測等諸多實踐領域。

一、心理學與大數據的相遇

網絡的廣泛應用以及與現實的密切交織,不僅改變了人們的生活方式,也推動了學術研究范式的變革。[1]一方面,海量的(移動)互聯網用戶借助微博、論壇等社交媒體產品和移動互聯網工具記錄自己的生活,并高密度地進行突破傳統時間、空間限制的人際、人機互動,積累了前所未有的海量在線文本、圖片、視頻信息;另一方面,數據挖掘等計算機和信息科學技術的發展,使得高效處理和分析海量人類行為數據成為可能,從而奠定了海量數據挖掘的技術基礎。[2]網絡大數據為社會科學的發展帶來了前所未有的機遇,Lazer等一批來自政治學、計算機科學等諸多跨學科領域的研究者于2009年在《科學》雜志上聯合撰文,正式提出了“計算社會科學”(Computational Social Science)的研究領域。[3]

心理學作為社會科學的重要組成部分,致力于探討人類的心理與行為規律。(移動)互聯網平臺和網絡應用積累的海量網絡大數據記載著大規模人群所思、所想和所感,這為挖掘人類的心理與行為規律提供了龐大、客觀、真實的數據資源。尤其是現代化數據分析技術的發展,例如,開源統計分析軟件R語言、社會網絡分析技術,為數據挖掘和數據分析提供了堅實的技術支撐。受信息科學在生物基因、天文學等領域成功應用的啟發,Yarkoni首次提出了“心理信息學”(Psychoinformatics)這一新穎的交叉學科概念。他把利用計算機和信息科學技術工具來獲取、管理和分析心理學數據的研究領域稱為“心理信息學”。[4]作為一門立足于心理學研究問題的新興交叉學科,心理信息學的研究重點關注如何借助計算機和信息科學技術的優勢,在心理學研究的各個分支領域和研究環節中充分發揮作用,從而為心理學問題提供更為科學、客觀的研究證據。[1]

正如計算社會科學可追溯到社會物理學、社會計算(social computing)等研究領域,心理學與大數據、信息科學的相遇,并非出于歷史的偶然巧合,而是心理學與信息科學為尋求自身發展而產生的必然結合。[1]心理學與大數據、信息科學的結合最早可追溯到1998年Nowak等提出的計算社會心理學(computational social psychology)研究領域。[2]該領域最早的內涵是指利用計算機模擬的技術手段對社會心理學中的群體心理與行為進行建模和仿真模擬,從而揭示社會群體的心理與行為模式和規律特征。但后來隨著計算機科學技術的發展,尤其是社交媒體的發展,信息科學可為心理學提供的不再局限于仿真模擬這樣一種特定的技術手段,而是數據獲取、數據管理、數據分析等全方位的支持。研究者通過計算機數據抓取手段(例如,網絡爬蟲)或由網絡服務商提供獲得的Twitter、新浪微博、Google網絡搜索等網絡大數據,在數據的樣本覆蓋量、時間精度等方面都具有突破性優勢。此外,研究者可以通過(移動)互聯網平臺和以更經濟、更快捷的方式,招募大批量的被試,從而完成在線問卷調查或網絡心理學實驗。例如,比較流行的在線問卷調查平臺“調查猴子”(Survey Monkey),和被試招募平臺“亞馬遜土耳其機器人”(Amazon's Mechanical Turk,MTurk)。有研究證據表明,由于網絡覆蓋面廣、成本低等優勢的存在,通過網絡平臺收集的數據在樣本多樣性、數據質量等方面等同于甚至高于傳統研究方法采用的數據收集手段。[5-6]

心理學與網絡大數據的結合,既為傳統心理學通過具有代表性的大樣本深入挖掘個體層面的心理與行為機制提供了更為廣闊的平臺和機會,也同時為深入挖掘大規模人群在群體層面涌現出來的群體心理行為規律提供了可能。近些年,在心理學等社會科學和信息科學研究者的合作和共同努力下,在應用社會心理學的諸多領域取得了一批具有代表性意義的研究成果。

二、大數據視角下的社會心理學研究進展

(一)大數據與情緒心理學

情緒是心理學研究的重要研究對象之一,也是目前為止和大數據結合最為緊密、成果最為豐富的研究領域。傳統心理學關于個體情緒在日周期水平上的波動節律研究,尤其是主要圍繞積極情緒和消極情緒開展的研究,一直沒有得到較為一致的結果。在分析其原因時,研究者普遍承認目前的研究抽樣存在偏差(主要以美國大學生樣本為主),在實驗室或者通過自我報告的調查等測量方式對情緒的波動節律進行精確測量也均存在較大的偏差。但遵循心理學范式的研究者又暫時無法找到切實可行的,能夠對跨文化大樣本人群進行數周以上以小時為時間精度上追蹤研究的測量方法。考慮到以上研究現狀,美國康奈爾大學心理學家Golder和其合作者Macy認為,社交媒體的興起及其產生的覆蓋跨文化、大樣本、客觀、實時的海量用戶行為數據,為解決這一困境提供了可能。[7]他們發表在《科學》雜志的一項研究分析了2008年2月至2010年1月期間,覆蓋全球84個使用英文的國家,約240多萬用戶產生的5億多條Twitter數據的情緒信息。結果發現,積極情緒和消極情緒在一周七天內的波動節律幾乎一致,積極情緒在周六、周日顯著高于工作日。在日內波動上,積極情緒在早上(大約在人們上班的時間)開始下降,而在晚上(大約在人們下班的時間)回升;而消極情緒則在早上(早上7~9點附近)達到最低點,隨后在一天內均呈上升趨勢,達到0點左右的峰值。這種模式支持了人們可通過一晚上的睡眠恢復情緒的假設。關于積極情緒和消極情緒的關系,研究者發現消極情緒的波動模式并不完全等同于積極情緒的反向波動特征,二者僅呈現出低度相關(r=-0.08)。該證據通過跨文化、地域的大樣本數據為積極情緒和消極情緒是兩個獨立的維度提供了支持。研究者進一步由情緒的日內波動規律拓展到季節性波動規律,并嘗試同樣借助Twitter情緒數據探索當前心理學研究中關于季節性情感障礙的成因的兩種觀點,即光照時間不足的解釋和基于生物晝夜節律的“階段轉換假說”(Phase-shift Hypothesis)。結果發現,絕對日照時長對積極情緒和消極情緒均沒有顯著作用,但相對日照時長卻與情緒有顯著關聯。因此,該結果支持了有關情緒與季節關聯的“階段轉換假說”,而沒有獲得“情緒隨日照時間變化”的競爭假說證據。[7]

情緒傳染和情緒傳播也是社會心理學中關于社會影響領域的重要議題。Kramer等基于Facebook上近69萬用戶的實驗研究發現,人們的情緒狀態會無意識地體驗到與他人相同的情緒狀態,即情緒可通過情緒傳染機制傳播給他人。他們通過客觀實驗的方法證實了僅僅暴露在完全缺乏非言語線索的好友情緒表達的網絡環境中也可以發生情緒傳染效應。[8]Coviello等也探討了類似的問題,研究者抓取了2009年1月至2012年3月期間美國100個大城市Facebook用戶的“狀態”數據,結果發現,下雨天會直接影響人們的Facebook狀態中的情緒水平,有趣的是,這種情緒狀態還能進一步影響到遠在其他城市,沒有直接體驗到下雨天氣的好友的情緒水平。該研究也證實了情緒傳染的傳染機制,并且揭示了在線社交網絡在放大全球情緒同步中扮演的重要作用。[9]Facebook數據已經成為心理學研究者探索大規模人群社會影響作用機制的重要工具。例如,Aral和Walker通過130萬Facebook用戶的隨機實驗,較為系統地揭示了人們在社交網絡中影響力和易受影響程度的規律特征。結果發現:年輕人相對年長者更容易被影響;男性比女性影響力大,但女性對男性的影響力比她們對其他女性的影響力大;已婚人士在新產品決策中最不容易受影響。[10]

(二)大數據與人格心理學

揭示人們心理行為一般規律的人格心理學是心理學的基礎性研究領域。傳統心理學研究主要通過自我報告的線下問卷調查方法對人格結構開展了一系列卓有成效的研究,例如經典的“大五人格模型”(Five-factor Model)。對于人格心理學研究者而言,網絡大數據為刻畫和挖掘人們的心理行為規律提供了新的視角和數據資源。對于計算機科學領域的研究者而言,挖掘用戶的心理與行為規律對于提高技術的準確度、提升產品的用戶體驗具有重要意義。因此,基于大數據的人格心理學研究,也成為了心理學與信息科學結合的重要研究議題。

語言被認為是人們在表達自己內在想法和感受時使用最為普遍、穩定的方式。因此,研究者致力于挖掘人們在網絡上的語言表達與人格特征之間的關聯。例如,Schwartz等基于7.5萬志愿者提供的人格測驗結果,以及從用戶Facebook信息中提取得到的7億條單詞、短語和話題數據,較為系統地探索了用戶在Facebook上的語言表達與其人格、性別、年齡之間的關系。結果發現:外向型的用戶更傾向于提及“聚會”“愛你”等詞匯;開放型的用戶更傾向于提及“音樂”“藝術”“夢想”等詞匯;而神經質的用戶則更傾向于提及“厭煩”“抑郁”等詞匯。研究者采用了開源詞匯技術(open-vocabulary technique)來構建人格預測模型,并在樣本外測試中達到了91.9%的預測準確率。[11]該團隊的Park等進一步通過Facebook用戶的樣本檢驗了該人格預測模型的穩健性,結果證明了基于社交媒體語言表達數據和開源詞匯技術的自動化人格預測模型具有較好的信度和外在效度。[12]

還有不少研究發現,人們在社交網絡上的一些客觀行為,例如Facebook上的點贊行為,也為開發自動化預測用戶人格或其他屬性的計算機模型提供了可能。例如,Kosinski等通過5.8萬Facebook用戶的點贊數據、人格測試等心理測驗數據以及人口統計學調查數據,發現人們在Facebook的點贊數據能自動化地、較為準確地預測出用戶的人格、性取向、民族、宗教信仰、政治觀點、幸福感、物質濫用、年齡、性別等特征和屬性。其中,對開放性人格維度的預測準確性幾乎與標準化的人格測試精度相近,對性取向的預測準確率達到88%,對民主主義和自由主義的政治態度預測準確率達到85%。[13]Wu等通過8.6萬Facebook用戶網絡賬戶信息和人格測試數據發現,基于用戶的Facebook點贊等電子化行為信息構建的機器學習計算機模型對人格具有顯著預測力。尤為有趣的是,基于Facebook點贊數據構建的人格預測模型(與用戶自身的人格測驗相關r=0.56)準確率要比與用戶關系親密的好友通過問卷調查的判斷(r=0.49)準確率還高。[14]

(三)大數據與行為金融學

行為金融學的研究致力于揭示人們的非理性成分在金融決策中的作用,或者說人們在有限理性情境下的決策規律。其中,以情緒與決策之間的關系最具代表性,例如,情緒預測股市的研究。賴凱聲等對情緒預測股市的理論機制,圍繞投資者情緒指標、社會情緒指標的實證研究等多方面進行了較為系統的梳理。[15]他們認為,近些年隨著網絡的普及和信息科學技術的發展,基于網絡大數據的社會情緒研究,為情緒與股市的關系這一遠未形成定論的研究領域注入了新的活力。尤其是考慮到股市走勢是宏觀群體層面市場投資者共同決策的結果,傳統行為經濟學常用的實驗范式難以直接回答宏觀群體心理與金融決策之間的關系。因此,基于人們在網絡環境下留下的客觀行為數據成為挖掘群體心理與宏觀金融決策關系研究的重要線索。

例如,Bollen等利用心理學情緒量表設定的情緒分類標準,分析了2008年美國微博網站Twitter上的海量數據,發現Twitter用戶微博條目中的“鎮定”(calm)類情緒詞匯量變化趨勢可以成功預測2~6天后美國道瓊斯工業指數的升降趨勢,對于指數升降的預測準確率可達到87%。[16]Bordino等的研究發現,納斯達克100指數與其成分股的雅虎搜索量顯著相關,并且在搜索指數的峰值附近有提前1天的預測作用。[17]Preis等系統考察了98個金融相關詞匯的Google搜索數據與美國股市走勢之間的關系。結果發現金融詞匯的搜索數據能提前預測股市的走勢,并且也證明了基于以上規律構建的量化策略的確能跑贏隨機策略。[18]

(四)大數據與健康心理學

隨著人們對健康問題的關注,與健康相關的心理與行為規律也逐漸受到公共醫學、心理學等跨學科領域研究者的關注。大數據應用于健康相關的研究議題,無論是在學術界還是產業界都是關注度非常高的應用領域之一。利用網絡大數據進行健康心理領域研究的基本前提假設是:人們線下的健康狀況、健康行為等特征與其在線上的社交媒體表達、網絡搜索關注等行為之間存在一定的聯系。因此,基于大數據的健康心理學研究,可通過人們在網絡上行為特征來盡可能地揭示、解釋甚至預測人們的健康狀況。

例如,Ginsberg等認為,每年大約有9 000萬成年人會通過網絡搜索引擎搜索特定疾病相關的信息,這為通過網絡搜索引擎數據監測疾病暴發狀況提供了可能。[19]他們利用人們在Google上5 000萬條搜索數據,成功開發了預測季節性流感傳播的模型。相較于傳統的流感預測工作,由于數據收集方法和過程的限制,往往會有1至2周的延遲。因此,他們的預測研究對于監測和預測流感的暴發趨勢,從而為政府相關部門做好流感應急準備和部署具有重要的價值。該研究引領了一大批基于網絡搜索數據預測各種疾病的探索和嘗試。[20-22]此外,社交媒體數據也被證明對于預測健康問題具有重要作用。例如,Eichstaedt等的研究發現,人們在Twitter上的網絡表達對于美國郡層面的心臟病死亡率有顯著預測作用。其中,與負面社會關系、分離和負面情緒(尤其是憤怒)相關的網絡表達與心臟病死亡率正相關;而積極情緒和心理參與相關的網絡表達與心臟病死亡率負相關。[23]

除了疾病預測外,還有一些研究者也開展了一些借助網絡大數據揭示網絡線上行為與線下健康行為(例如,自殺行為)之間關系的研究。例如,McCarthy利用谷歌網站記錄的2004年至2007年間網民對于自殺、自殘類詞匯的搜索量數據,發現其與美國疾病控制與預防中心(the Centers for Disease Control and Prevention,CDC)記載的2004年至2007年期間大眾現實自殺、自殘數據呈顯著統計相關關系。但在大眾群體中呈顯著負相關,在青少年群體中卻呈顯著正相關。[24]

(五)大數據與政治心理學

大數據也被廣泛應用到政治心理學議題中,包括選舉行為及其相關心理規律,與政治意識形態相關的心理學規律。例如,Caldarelli等的研究發現,意大利網民在Twitter上提及各黨派領導人的微博數量及其隨時間的變化特征對于預測全國政治大選具有顯著價值。[25]Markey通過分析2004、2006、2008年美國大選期間,搜索引擎網站Google上美國各州的色情類詞匯搜索量波動趨勢,發現如果某政黨“票倉州”所支持的參選者最終確實獲勝,選舉之后該州的色情類詞匯搜索量會快速上升,顯著高于其他州。該網絡行為現象驗證了進化心理學中著名的“挑戰假說”(Challenge Hypothesis)。[26]

在政治意識形態方面,Bond和Messing的研究證明了通過Facebook數據預測大眾政治意識形態的有效性和可行性,并提出了以此進一步開展政治計劃、政治意識形態結構及其與政治參與率關系研究的研究方向。[27]Wojcik等最近發表在《科學》雜志的一項研究試圖探索到底持保守主義政治意識形態者和自由主義者誰更幸福。結果發現,在自我報告的問卷調查結果中,持保守主義政治意識形態者報告了比自由主義者更高的幸福感,而通過Twitter等社交媒體數據的客觀幸福感指標(例如積極情緒的表達、微笑)看,保守主義者卻顯著地表達了比自由主義者更低的幸福感。[28]

(六)其他富有前景的應用領域

大數據已經廣泛應用于心理學的各分支領域,并不局限于以上列舉的這些應用領域。例如,在文化心理學研究領域,有研究者通過Google Ngram基于Google掃描全球所有已出版書籍中約4%數據集所提供的歷時近200年的大數據來研究文化的變遷[29-30],包括個體主義—集體主義文化的歷史變遷[31-33],美國性別平等文化與女性地位的歷史變遷等[34]。還有其他豐富的數據來源也被巧妙地應用到各研究中。例如,通過15萬歷史名人的出生地、死亡地數據來反映歐洲和北美的文化歷史變遷[35];智能手機的數據被應用于實時刻畫大規模人群的人口分布[36],研究人們對突發事件的集群行為規律。[37]

三、我國的大數據社會心理學研究實踐

我國的社會心理學研究者已經主要就中國微博情緒的在線測量和應用問題,嘗試與信息科學領域的研究者一起展開了一系列的研究和探索。

(一)微博情緒測量工具的開發

微博積累的海量信息為直接測量大規模人群的態度、社會情緒提供了可能。對在線文本進行情感分析一直是信息科學領域的熱點問題,但傳統在線文本分析技術主要以數據驅動或者經驗驅動,例如包含正向情緒和負向情緒的二分法。情緒、情感是心理學領域的經典研究問題,將心理學領域關于情緒相關的研究成果應用于在線文本分析技術,可從理論視角為提升在線文本分析技術的有效性提供支持和幫助。樂國安等對情感分析技術、情緒詞庫的構建與發展、在線文本情感分析技術的實踐應用等問題進行了較為系統的總結和歸納。[38]

詞匯匹配技術是目前分析海量微博客(例如Twitter、新浪微博)使用最為廣泛,也是效果相對較好的方法。該方法的原理主要是通過統計目標文本中與情緒詞庫中特定類型的情緒詞的詞頻多少來計算該文本的情緒定向。[39]因此,情緒詞庫的建設是基于詞匯匹配技術的在線文本情感分析技術的核心。董穎紅等基于心理學經典的基本情緒結構理論,將微博情緒分為快樂、悲傷、憤怒、恐懼和厭惡五種(其中驚奇情緒由于在測試中發現使用頻率較低而未納入詞庫中),構建了包含818個情緒詞(快樂306個;悲傷205個;厭惡142個;恐懼72個;憤怒93個)的標準化微博客基本情緒詞庫(Weibo Basic Mood Lexicon,Weibo-5BML)。[39]

為了檢驗該情緒詞庫和工具的有效性,研究團隊與華東師范大學軟件學院海量計算研究所團隊合作,在160多萬新浪微博用戶2011年7月至2012年11月期間發布的微博文本上進行測試。首先,對五種微博情緒之間的內部相關性進行測試,結果發現:快樂和悲傷、厭惡、憤怒、恐懼情緒均為顯著負相關;而悲傷、厭惡、憤怒和恐懼情緒之間呈現顯著正相關。該檢驗結果與心理學經典的情緒理論,例如效價—喚醒理論,有較好的一致性。其次,通過整理五種微博情緒在一周內(周一至周日)的周變化趨勢,結果發現:快樂情緒在周末顯著高于工作日,而周三的快樂情緒達到最低點。這為探索大規模人群的整體情緒的節律變化提供了新的證據。最后,為了檢驗微博情緒測量工具的生態效度,研究團隊還分析了五種微博情緒對現實社會中重大節日、重大社會熱點事件的反應。結果發現,微博情緒對2011年“7·23甬溫線旅客列車特別重大事故”、2012年“釣魚島之爭”、春節、中秋節、感恩節等重大事件和節假日都呈現出了較為靈敏而合理的反應。例如,2011年7月23日,甬溫線段發生了旅客列車特別重大事故,事故發生當天,快樂情緒開始下降,而悲傷、憤怒和恐懼情緒開始上升。隨后的幾天人們一直沉浸在悲傷、憤怒和恐懼的氛圍中,一直到7月29日悼念活動結束以后公眾的各種基本情緒才逐漸恢復到往日的水平。尤其是在事故發生之初,生命至上、緊急救援是主要問題,因此人們的悲傷情緒首先上升到高點;但隨著時間的推移,事故的處理方式和對原因的調查使得公眾對政府的不滿、憤怒情緒不斷推高。以上檢驗結果表明,研究團隊基于基本情緒結構理論開發的Weibo-5BML微博情緒測量工具,在分析大眾情緒信息時是有效的,這對于實時、高效地感知公眾的社會情緒變化具有重要的意義。[39]

(二)基于微博情緒的應用社會心理學研究

1.預測股市

在發現新浪微博上單個情緒詞(例如“緊張”)與上證指數之間存在顯著關聯的基礎上,為了探索更一般性的微博情緒與股市關系,賴凱聲等基于心理學的情緒理論和情緒測量量表,抓取了新浪微博上2011年8月1日至2012年2月29日期間2 242個情緒詞匯的詞頻數據。結果發現,2242個情緒詞中,有993個情緒詞與上證指數之間存在顯著的相關關系,并且基于這2 242個情緒詞通過相關系數篩選、加權得到的微博情緒綜合指數與上證指數之間的相關高達0.877。進一步對微博情緒綜合指數和上證指數的時間序列構建協整模型發現,二者存在顯著的長期均衡關系,且微博情緒綜合指數能顯著預測下一個交易日的上證指數。[40]

Dong等通過構建的微博客基本情緒詞庫(Weibo-5BML)工具和2012年2月1日至2012年11月30日期間的新浪微博數據,檢驗了不同類型的微博情緒與股市之間的關系。研究結果發現,五種情緒中悲傷情緒能顯著提高上證指數成交量(預測準確率提高2.4%)。考慮到悲傷情緒的喚醒度最低,研究者再把悲傷情緒詞中喚醒度最低的25%作為新的悲傷指數,結果發現對上證指數成交量的預測能力仍然顯著。該研究結果表明,具有低喚醒度的負性情緒與上證指數交易量相關,該結果從群體層面支持了情緒維持假說,并為情緒泛化假說和情緒維持假說的爭論提供了新證據。[41]

2.風險社會預測

處于社會轉型期和全球化進程的中國社會面臨著各種社會風險。個體層面的研究認為,由感知的社會風險誘發的情緒,例如憤怒,可能會引發集體行動。但在宏觀群體層面,由于測量手段和成本的限制,大眾感知的社會風險與社會情緒之間的關系并不明確。為探索大眾對感知的社會風險的情緒反應規律,Dong等的研究通過百度搜索數據來刻畫中國網民的社會風險感知水平(分為社會穩定風險、日常生活風險、資源環境風險、公共道德風險、政府執政風險、國家安全風險、經濟金融風險七大類),通過微博客基本情緒詞庫(Weibo-5BML)工具分析新浪微博數據得到五類基本情緒水平。通過Granger因果檢驗發現,大眾感知的社會風險對社會情緒有顯著的預測力,但不同的風險類型對不同情緒的預測力是不同的。例如,感知的政治執政風險能顯著預測憤怒情緒,資源環境風險感知能顯著預測未來2~5日的悲傷情緒。[42]

另一方面,大眾感知的社會風險對社會穩定和社會和諧有負面影響,因此研究群體層面的大眾情緒能否影響或預測社會風險感知也具有重要意義。Dong等同樣采用百度搜索數據和新浪微博數據,研究了中國網民的社會情緒對大眾社會風險感知的預測效果。結果發現,社會情緒對大眾感知的社會風險具有顯著的預測力,但不同的社會情緒對不同類型的社會風險感知的預測效果是不同的。相比快樂情緒,悲傷、厭惡、憤怒、恐懼四種負性社會情緒是社會風險感知水平更為重要的預測變量。關于社會風險與社會風險感知水平的關系研究表明,通過社會化媒體捕捉和研究大眾心理特征和規律是可行的。[43]

3.精英與大眾的微博情緒關系

關于精英與大眾的關系一直是政治學、社會學、傳播學、心理學等多學科領域學者關注的問題。傳播學的意見領袖研究認為,意見領袖在信息傳播中起著二級傳播的作用,對大眾具有重要的引領作用;政治學領域的研究者認為,政治精英只是強化和激發現存的公共輿論,整體上對公共輿論的影響是“微不足道”的;而另一些研究則反對這種認為影響微不足道的觀點,并給出了一些政治精英利用大眾傳媒操縱公共輿論的證據。隨著社會的發展,精英和大眾之間的關系變得越來越復雜。尤其是互聯網時代,微博等自媒體的發展,精英與大眾互動的頻率和強度都產生了巨大的飛躍,這無疑更加凸顯了探究精英和大眾的關系問題的重要性。精英是因為能準確感知大眾輿論的趨勢,迎合或順應大眾的“民意”,從而獲得大眾擁戴,即“時勢造英雄”;還是因為能憑借自身能力制造、引領時勢,充當大眾引領者的角色,即“英雄造時勢”?

Lai等以微博情緒的分析視角為切入點,借助研究團隊構建的微博客基本情緒詞庫(Weibo-5BML)工具和新浪微博2011-2012年的微博數據,探索了覆蓋房地產、教育等9個行業的894名微博精英和160多萬名大眾用戶之間的微博情緒關系。綜合分析9大領域結果發現:(1)當下中國的經濟資本比文化資本具有更大的影響力。房產、財經和科技類意見領袖(即經濟資本領域)均有顯著領先于大眾情緒的傾向,而傳媒、時尚、藝術、娛樂、教育、文學意見領袖(即文化資本領域)領先大眾情緒的傾向相對更低甚至落后于大眾情緒。(2)不同領域、不同情緒類型下的影響關系不完全相同,但總體來看,“時勢造英雄”的效果要比“英雄造時勢”的效果強些。(3)消極情緒比積極情緒更易傳播。其中,積極情緒中快樂情緒在4個領域的意見領袖群體和大眾情緒中有顯著的領先和滯后關系;而消極情緒中悲傷情緒在8個領域、厭惡情緒在6個領域、恐懼情緒在5個領域、憤怒情緒在2個領域內的意見領袖群體和大眾情緒中有顯著的領先和滯后關系??偟膩碚f,經濟資本和文化資本之間的支配和被支配關系取決于哪類資本占據了相對較高的話語權。基于微博情緒的研究發現經濟資本比文化資本更具影響力的結果在一定程度上能反映轉型期中國文化轉型落后于經濟轉型的社會現狀。[44]

4.厭惡情緒預測地區民族主義

關注情緒的進化意義的研究者認為,厭惡情緒可保護人們免受有毒物質、病菌和疾病的威脅。[45]厭惡情緒在道德決策和意識形態層面的影響作用也得到了研究者的關注。個體層面的實驗和調查證據發現,厭惡情緒與個體的政治意識形態,例如預測保守主義、投票行為,有顯著關聯。民族主義是個體認同或依附于自己民族和國家的一種信仰或意識形態,具有以自我民族中心,以及排斥、貶低外民族的傾向等主要特征。那么,在群體層面的厭惡情緒與地區的民族主義是否有關聯?

高樹青等借助研究團隊構建的微博客基本情緒詞庫(Weibo-5BML)工具來測量2011年中國各省(市、自治區)的新浪微博厭惡情緒表達,并結合包含17萬網民樣本的“中國政治坐標系測試”關于政治意識形態網絡大調查數據,從宏觀層面探索了網絡厭惡情緒表達與地區民主主義之間的關系。研究結果發現:(1)中國各省的厭惡情緒表達與地區民族主義存在顯著相關;(2)在控制了各省的人均GDP、地理封閉性、農村人口比重等變量之后,厭惡情緒表達與地區民族主義之間的相關仍然顯著;(3)進一步的穩健性檢驗發現,5類基本情緒中,有且僅有厭惡情緒與地區民族主義具有顯著關聯。因此,微博厭惡情緒表達與地區民族主義正相關的結果具有較好的區分效度,這為理解群體層面的情緒表達和民族主義傾向之間的關系提供了直接證據。[46]

四、大數據研究存在的問題

(一)大數據“萬能論”與“無用論”

關于網絡大數據的定位問題,尤其是大數據在受到商界熱炒的背景下,如何客觀、理性地看待大數據研究也是一個值得討論的問題。認為大數據能解決一切問題,采用大數據的研究方法就是高質量的研究,這便是推崇大數據“萬能論”;也有觀點認為大數據一無是處,存在數據不精確,結果是偽相關等問題,便是信奉大數據“無用論”。筆者認為,我們既不要盲從于大數據“萬能論”,也不必因大數據“無用論”而望而卻步。客觀來講,大數據更像是一種新范式或者新方法,它有它自己的優勢,例如樣本量大、生態效度高。大數據也有一些缺陷,包括不精確、信度低,難以揭示因果等問題。正如傳統的實驗法有控制嚴格的優點和生態效度低的缺點,而問卷法有被試范圍廣的優點和存在社會稱許性反應的弊端一樣,大數據會存在優點和缺點自然也屬情理之中。因此,將大數據看成一種新的研究范式,研究者可以更好地結合一般方法論、研究范式的優缺點的視角來客觀、理性地評價和應用它。

(二)大數據的因果關系問題

大數據研究具有全體、混雜和相關三大特點。[47]27-96其中,相關指的是大數據研究通常更加關注相關性,而不是因果性。因果關系的確立需要排除很多可能的干擾因素,而大數據混雜的特點很難保證因果關系的推論,要通過大數據來研究因果是比較困難的。很多大數據研究中找到的因果也只是統計學意義上的因果,例如,基于Granger因果檢驗的研究。但統計意義上的因果關系代表的是數據在時間上的領先滯后關系,與邏輯學意義上的因果并不等同。因此,如果需要進一步確定因果關系,建議可再結合傳統的實驗法進行檢驗和確定。值得一提的是,大數據發現的相關,尤其是時間序列上的領先—滯后相關由于具有預測性,因此仍然是具有較強的實踐應用價值的。這也可能是大數據在產業界傳播范圍廣、影響力大的重要原因之一。

(三)大數據的隱私問題

在大數據被廣泛應用于科研、商業和管理等諸多實踐領域的同時,人們也開始思考大數據對人類帶來的威脅和負面影響。其中以對數據隱私問題的顧慮最具代表性。人們在搜索引擎上的搜索記錄、在電子商務網站上的購物記錄、在社交媒體上與好友的互動記錄等,這些數據都被網絡服務商所掌握。這些數據的安全性則成為了網絡信息化社會的一大隱患。尤其是2013年的“棱鏡門”事件更是激發了人們對數據安全、數據隱私問題的關注。關于數據收集者是否有權收集、分析以及使用相關信息也引起了廣泛的討論。例如,傳統社會中,由于社會流動性的存在,對于一些犯過一些過錯的人,往往還具備通過更換環境來重新開啟新生活的權力。但網絡社會信息的全覆蓋,一旦有任何負面的信息發布到網上,幾乎世界上任何有互聯網覆蓋的角落都能知道該信息,并且它可能被永久的記載。換言之,在大數據時代,人們的隱私空間越來越小,這種現象被稱為“被遺忘權”的剝奪。數據隱私權隱患引起了社會各界的大討論,世界各國已經開始著手建設和完善大數據隱私保護相關的法律。對于學術研究而言,大數據研究者可通過建立一個自由、透明的學術共同體,共同遵循和監督在充分保證用戶個人隱私的條件下開展有價值的學術研究的數據使用原則。例如,對個體關鍵信息進行匿名化處理是大數據研究中常用的保護用戶個人隱私的辦法。

五、未來研究展望

近些年圍繞網絡大數據的社會心理學研究展現出了巨大的發展潛力,在研究視角、研究方法的多元化等方面都取得了重大的突破。2013年Watts曾就計算社會科學的研究現狀和面臨的挑戰問題指出,雖然目前已經有了成百上千篇關于社會網絡、金融危機、群體形成等問題相關的計算社會科學研究成果,但這些成果中很少能被傳統社會科學的期刊所認可并發表。[48]換言之,Watts一針見血地指出了當時信息科學領域研究者與社會科學研究者之間的合作仍然不夠充分,從而導致主流社會科學和計算社會科學研究領域之間仍然存在較深隔閡的問題。這也與大多數計算社會科學領域的研究缺乏對傳統社會科學理論和現實重要社會實踐的關注有關。對于大數據心理學研究領域的發展而言,該問題和挑戰同樣存在,并且將長期存在。值得肯定的是,就在最近的幾年發展中,已經開始涌現出一批具有代表性意義的大數據心理學研究,并得到了一些主流心理學期刊的認可。例如,在2014-2015年期間,有多篇基于Facebook、Twitter、Google網絡搜索的大數據研究相繼在社會心理學領域的國際頂級期刊,如美國的《人格與社會心理學》《心理科學》等雜志上發表。這意味著基于大數據的社會心理學研究領域已經逐漸步入主流心理學研究的視野,并開始展示其蓬勃的生命力。筆者認為,要想獲得長足的發展,并且真正獲得主流心理學的認可,研究者在未來研究中不能僅僅只把網絡作為一種人類活動的特定情境來研究網絡用戶的心理與行為規律,更應重視借助網絡大數據相關的研究技術和手段來解決心理學領域的重要理論和現實問題。

尤其是對于國內的研究者而言,國內相關領域的研究總體上仍處于探索期,研究成果和經驗相對較少。這既意味著存在廣闊的發展空間,也意味著面臨巨大的挑戰。數據公開、數據共享也是未來發展的大趨勢。我國作為人口大國,網民用戶群體規模龐大,這為研究者研究轉型期中國人的心理與行為規律提供了鮮活的證據。當前正處于轉型期的中國,在大眾心理與行為層面涌現出許多可供深入挖掘的研究資源。建議國內研究者在延續傳統心理學研究范式,探討網絡化環境下個體心理、社會適應的影響機制研究的同時,也多關注借助網絡大數據探索群體心理和行為問題。這對于及時發現和解決社會問題,從而促進社會的和諧發展具有重要的意義。

建議未來研究多結合心理信息學的視角,將網絡大數據研究技術多應用于解決具有重要現實意義的社會問題(例如,醫療衛生問題、幸福感問題、環境問題),落實心理學服務社會的使命。從已有的研究證據來看,心理信息學的研究范式不但在探索有關個體和群體心理與行為規律的研究問題上展示出了巨大的潛力,還能幫助研究者從理論驅動出發,通過網絡大數據來驗證一些心理學的經典假設,從而為理論假說、爭論提供新的證據。因此,心理信息學有望成為未來心理學發展的重要方向之一。[1]但心理信息學研究的順利開展,需要心理學和信息科學領域研究者的密切配合以及相關資源的全力支持。建議國家多提供一些跨學科領域合作的資源項目,支持和鼓勵開展跨學科領域合作的課題;而研究者自身則應能主動地學習和了解相關領域的知識,打破傳統的學科思維界限,積極投身于跨學科合作實踐中,從而把握網絡大數據時代的機遇。

關鍵字:情緒測量

本文摘自:《蘇州大學學報:教育科學版》

x 基于網絡大數據的社會心理學研究進展 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

基于網絡大數據的社會心理學研究進展

責任編輯:editor007 作者:樂國安 賴凱聲 |來源:企業網D1Net  2016-11-03 22:15:04 本文摘自:《蘇州大學學報:教育科學版》

以互聯網和信息科學技術的快速發展推動的信息技術革命,使得人類步入了數據充裕的數字化信息時代。在生產、存儲數據的能力獲得了巨大發展的信息化時代,人們生活在一個規模難以想象的龐大數字化世界里。人們在論壇、博客、微博、微信、電子商務交易平臺、搜索引擎等平臺上積累的海量數據,成為大數據時代寶貴的信息資源和財富。目前,大數據已經被廣泛應用于政治選舉、企業(尤其是電子商務公司)戰略布局、金融交易、生物研發、醫療衛生、國防安全、公共管理、社會治安、交通管理、氣象監測等諸多實踐領域。

一、心理學與大數據的相遇

網絡的廣泛應用以及與現實的密切交織,不僅改變了人們的生活方式,也推動了學術研究范式的變革。[1]一方面,海量的(移動)互聯網用戶借助微博、論壇等社交媒體產品和移動互聯網工具記錄自己的生活,并高密度地進行突破傳統時間、空間限制的人際、人機互動,積累了前所未有的海量在線文本、圖片、視頻信息;另一方面,數據挖掘等計算機和信息科學技術的發展,使得高效處理和分析海量人類行為數據成為可能,從而奠定了海量數據挖掘的技術基礎。[2]網絡大數據為社會科學的發展帶來了前所未有的機遇,Lazer等一批來自政治學、計算機科學等諸多跨學科領域的研究者于2009年在《科學》雜志上聯合撰文,正式提出了“計算社會科學”(Computational Social Science)的研究領域。[3]

心理學作為社會科學的重要組成部分,致力于探討人類的心理與行為規律。(移動)互聯網平臺和網絡應用積累的海量網絡大數據記載著大規模人群所思、所想和所感,這為挖掘人類的心理與行為規律提供了龐大、客觀、真實的數據資源。尤其是現代化數據分析技術的發展,例如,開源統計分析軟件R語言、社會網絡分析技術,為數據挖掘和數據分析提供了堅實的技術支撐。受信息科學在生物基因、天文學等領域成功應用的啟發,Yarkoni首次提出了“心理信息學”(Psychoinformatics)這一新穎的交叉學科概念。他把利用計算機和信息科學技術工具來獲取、管理和分析心理學數據的研究領域稱為“心理信息學”。[4]作為一門立足于心理學研究問題的新興交叉學科,心理信息學的研究重點關注如何借助計算機和信息科學技術的優勢,在心理學研究的各個分支領域和研究環節中充分發揮作用,從而為心理學問題提供更為科學、客觀的研究證據。[1]

正如計算社會科學可追溯到社會物理學、社會計算(social computing)等研究領域,心理學與大數據、信息科學的相遇,并非出于歷史的偶然巧合,而是心理學與信息科學為尋求自身發展而產生的必然結合。[1]心理學與大數據、信息科學的結合最早可追溯到1998年Nowak等提出的計算社會心理學(computational social psychology)研究領域。[2]該領域最早的內涵是指利用計算機模擬的技術手段對社會心理學中的群體心理與行為進行建模和仿真模擬,從而揭示社會群體的心理與行為模式和規律特征。但后來隨著計算機科學技術的發展,尤其是社交媒體的發展,信息科學可為心理學提供的不再局限于仿真模擬這樣一種特定的技術手段,而是數據獲取、數據管理、數據分析等全方位的支持。研究者通過計算機數據抓取手段(例如,網絡爬蟲)或由網絡服務商提供獲得的Twitter、新浪微博、Google網絡搜索等網絡大數據,在數據的樣本覆蓋量、時間精度等方面都具有突破性優勢。此外,研究者可以通過(移動)互聯網平臺和以更經濟、更快捷的方式,招募大批量的被試,從而完成在線問卷調查或網絡心理學實驗。例如,比較流行的在線問卷調查平臺“調查猴子”(Survey Monkey),和被試招募平臺“亞馬遜土耳其機器人”(Amazon's Mechanical Turk,MTurk)。有研究證據表明,由于網絡覆蓋面廣、成本低等優勢的存在,通過網絡平臺收集的數據在樣本多樣性、數據質量等方面等同于甚至高于傳統研究方法采用的數據收集手段。[5-6]

心理學與網絡大數據的結合,既為傳統心理學通過具有代表性的大樣本深入挖掘個體層面的心理與行為機制提供了更為廣闊的平臺和機會,也同時為深入挖掘大規模人群在群體層面涌現出來的群體心理行為規律提供了可能。近些年,在心理學等社會科學和信息科學研究者的合作和共同努力下,在應用社會心理學的諸多領域取得了一批具有代表性意義的研究成果。

二、大數據視角下的社會心理學研究進展

(一)大數據與情緒心理學

情緒是心理學研究的重要研究對象之一,也是目前為止和大數據結合最為緊密、成果最為豐富的研究領域。傳統心理學關于個體情緒在日周期水平上的波動節律研究,尤其是主要圍繞積極情緒和消極情緒開展的研究,一直沒有得到較為一致的結果。在分析其原因時,研究者普遍承認目前的研究抽樣存在偏差(主要以美國大學生樣本為主),在實驗室或者通過自我報告的調查等測量方式對情緒的波動節律進行精確測量也均存在較大的偏差。但遵循心理學范式的研究者又暫時無法找到切實可行的,能夠對跨文化大樣本人群進行數周以上以小時為時間精度上追蹤研究的測量方法。考慮到以上研究現狀,美國康奈爾大學心理學家Golder和其合作者Macy認為,社交媒體的興起及其產生的覆蓋跨文化、大樣本、客觀、實時的海量用戶行為數據,為解決這一困境提供了可能。[7]他們發表在《科學》雜志的一項研究分析了2008年2月至2010年1月期間,覆蓋全球84個使用英文的國家,約240多萬用戶產生的5億多條Twitter數據的情緒信息。結果發現,積極情緒和消極情緒在一周七天內的波動節律幾乎一致,積極情緒在周六、周日顯著高于工作日。在日內波動上,積極情緒在早上(大約在人們上班的時間)開始下降,而在晚上(大約在人們下班的時間)回升;而消極情緒則在早上(早上7~9點附近)達到最低點,隨后在一天內均呈上升趨勢,達到0點左右的峰值。這種模式支持了人們可通過一晚上的睡眠恢復情緒的假設。關于積極情緒和消極情緒的關系,研究者發現消極情緒的波動模式并不完全等同于積極情緒的反向波動特征,二者僅呈現出低度相關(r=-0.08)。該證據通過跨文化、地域的大樣本數據為積極情緒和消極情緒是兩個獨立的維度提供了支持。研究者進一步由情緒的日內波動規律拓展到季節性波動規律,并嘗試同樣借助Twitter情緒數據探索當前心理學研究中關于季節性情感障礙的成因的兩種觀點,即光照時間不足的解釋和基于生物晝夜節律的“階段轉換假說”(Phase-shift Hypothesis)。結果發現,絕對日照時長對積極情緒和消極情緒均沒有顯著作用,但相對日照時長卻與情緒有顯著關聯。因此,該結果支持了有關情緒與季節關聯的“階段轉換假說”,而沒有獲得“情緒隨日照時間變化”的競爭假說證據。[7]

情緒傳染和情緒傳播也是社會心理學中關于社會影響領域的重要議題。Kramer等基于Facebook上近69萬用戶的實驗研究發現,人們的情緒狀態會無意識地體驗到與他人相同的情緒狀態,即情緒可通過情緒傳染機制傳播給他人。他們通過客觀實驗的方法證實了僅僅暴露在完全缺乏非言語線索的好友情緒表達的網絡環境中也可以發生情緒傳染效應。[8]Coviello等也探討了類似的問題,研究者抓取了2009年1月至2012年3月期間美國100個大城市Facebook用戶的“狀態”數據,結果發現,下雨天會直接影響人們的Facebook狀態中的情緒水平,有趣的是,這種情緒狀態還能進一步影響到遠在其他城市,沒有直接體驗到下雨天氣的好友的情緒水平。該研究也證實了情緒傳染的傳染機制,并且揭示了在線社交網絡在放大全球情緒同步中扮演的重要作用。[9]Facebook數據已經成為心理學研究者探索大規模人群社會影響作用機制的重要工具。例如,Aral和Walker通過130萬Facebook用戶的隨機實驗,較為系統地揭示了人們在社交網絡中影響力和易受影響程度的規律特征。結果發現:年輕人相對年長者更容易被影響;男性比女性影響力大,但女性對男性的影響力比她們對其他女性的影響力大;已婚人士在新產品決策中最不容易受影響。[10]

(二)大數據與人格心理學

揭示人們心理行為一般規律的人格心理學是心理學的基礎性研究領域。傳統心理學研究主要通過自我報告的線下問卷調查方法對人格結構開展了一系列卓有成效的研究,例如經典的“大五人格模型”(Five-factor Model)。對于人格心理學研究者而言,網絡大數據為刻畫和挖掘人們的心理行為規律提供了新的視角和數據資源。對于計算機科學領域的研究者而言,挖掘用戶的心理與行為規律對于提高技術的準確度、提升產品的用戶體驗具有重要意義。因此,基于大數據的人格心理學研究,也成為了心理學與信息科學結合的重要研究議題。

語言被認為是人們在表達自己內在想法和感受時使用最為普遍、穩定的方式。因此,研究者致力于挖掘人們在網絡上的語言表達與人格特征之間的關聯。例如,Schwartz等基于7.5萬志愿者提供的人格測驗結果,以及從用戶Facebook信息中提取得到的7億條單詞、短語和話題數據,較為系統地探索了用戶在Facebook上的語言表達與其人格、性別、年齡之間的關系。結果發現:外向型的用戶更傾向于提及“聚會”“愛你”等詞匯;開放型的用戶更傾向于提及“音樂”“藝術”“夢想”等詞匯;而神經質的用戶則更傾向于提及“厭煩”“抑郁”等詞匯。研究者采用了開源詞匯技術(open-vocabulary technique)來構建人格預測模型,并在樣本外測試中達到了91.9%的預測準確率。[11]該團隊的Park等進一步通過Facebook用戶的樣本檢驗了該人格預測模型的穩健性,結果證明了基于社交媒體語言表達數據和開源詞匯技術的自動化人格預測模型具有較好的信度和外在效度。[12]

還有不少研究發現,人們在社交網絡上的一些客觀行為,例如Facebook上的點贊行為,也為開發自動化預測用戶人格或其他屬性的計算機模型提供了可能。例如,Kosinski等通過5.8萬Facebook用戶的點贊數據、人格測試等心理測驗數據以及人口統計學調查數據,發現人們在Facebook的點贊數據能自動化地、較為準確地預測出用戶的人格、性取向、民族、宗教信仰、政治觀點、幸福感、物質濫用、年齡、性別等特征和屬性。其中,對開放性人格維度的預測準確性幾乎與標準化的人格測試精度相近,對性取向的預測準確率達到88%,對民主主義和自由主義的政治態度預測準確率達到85%。[13]Wu等通過8.6萬Facebook用戶網絡賬戶信息和人格測試數據發現,基于用戶的Facebook點贊等電子化行為信息構建的機器學習計算機模型對人格具有顯著預測力。尤為有趣的是,基于Facebook點贊數據構建的人格預測模型(與用戶自身的人格測驗相關r=0.56)準確率要比與用戶關系親密的好友通過問卷調查的判斷(r=0.49)準確率還高。[14]

(三)大數據與行為金融學

行為金融學的研究致力于揭示人們的非理性成分在金融決策中的作用,或者說人們在有限理性情境下的決策規律。其中,以情緒與決策之間的關系最具代表性,例如,情緒預測股市的研究。賴凱聲等對情緒預測股市的理論機制,圍繞投資者情緒指標、社會情緒指標的實證研究等多方面進行了較為系統的梳理。[15]他們認為,近些年隨著網絡的普及和信息科學技術的發展,基于網絡大數據的社會情緒研究,為情緒與股市的關系這一遠未形成定論的研究領域注入了新的活力。尤其是考慮到股市走勢是宏觀群體層面市場投資者共同決策的結果,傳統行為經濟學常用的實驗范式難以直接回答宏觀群體心理與金融決策之間的關系。因此,基于人們在網絡環境下留下的客觀行為數據成為挖掘群體心理與宏觀金融決策關系研究的重要線索。

例如,Bollen等利用心理學情緒量表設定的情緒分類標準,分析了2008年美國微博網站Twitter上的海量數據,發現Twitter用戶微博條目中的“鎮定”(calm)類情緒詞匯量變化趨勢可以成功預測2~6天后美國道瓊斯工業指數的升降趨勢,對于指數升降的預測準確率可達到87%。[16]Bordino等的研究發現,納斯達克100指數與其成分股的雅虎搜索量顯著相關,并且在搜索指數的峰值附近有提前1天的預測作用。[17]Preis等系統考察了98個金融相關詞匯的Google搜索數據與美國股市走勢之間的關系。結果發現金融詞匯的搜索數據能提前預測股市的走勢,并且也證明了基于以上規律構建的量化策略的確能跑贏隨機策略。[18]

(四)大數據與健康心理學

隨著人們對健康問題的關注,與健康相關的心理與行為規律也逐漸受到公共醫學、心理學等跨學科領域研究者的關注。大數據應用于健康相關的研究議題,無論是在學術界還是產業界都是關注度非常高的應用領域之一。利用網絡大數據進行健康心理領域研究的基本前提假設是:人們線下的健康狀況、健康行為等特征與其在線上的社交媒體表達、網絡搜索關注等行為之間存在一定的聯系。因此,基于大數據的健康心理學研究,可通過人們在網絡上行為特征來盡可能地揭示、解釋甚至預測人們的健康狀況。

例如,Ginsberg等認為,每年大約有9 000萬成年人會通過網絡搜索引擎搜索特定疾病相關的信息,這為通過網絡搜索引擎數據監測疾病暴發狀況提供了可能。[19]他們利用人們在Google上5 000萬條搜索數據,成功開發了預測季節性流感傳播的模型。相較于傳統的流感預測工作,由于數據收集方法和過程的限制,往往會有1至2周的延遲。因此,他們的預測研究對于監測和預測流感的暴發趨勢,從而為政府相關部門做好流感應急準備和部署具有重要的價值。該研究引領了一大批基于網絡搜索數據預測各種疾病的探索和嘗試。[20-22]此外,社交媒體數據也被證明對于預測健康問題具有重要作用。例如,Eichstaedt等的研究發現,人們在Twitter上的網絡表達對于美國郡層面的心臟病死亡率有顯著預測作用。其中,與負面社會關系、分離和負面情緒(尤其是憤怒)相關的網絡表達與心臟病死亡率正相關;而積極情緒和心理參與相關的網絡表達與心臟病死亡率負相關。[23]

除了疾病預測外,還有一些研究者也開展了一些借助網絡大數據揭示網絡線上行為與線下健康行為(例如,自殺行為)之間關系的研究。例如,McCarthy利用谷歌網站記錄的2004年至2007年間網民對于自殺、自殘類詞匯的搜索量數據,發現其與美國疾病控制與預防中心(the Centers for Disease Control and Prevention,CDC)記載的2004年至2007年期間大眾現實自殺、自殘數據呈顯著統計相關關系。但在大眾群體中呈顯著負相關,在青少年群體中卻呈顯著正相關。[24]

(五)大數據與政治心理學

大數據也被廣泛應用到政治心理學議題中,包括選舉行為及其相關心理規律,與政治意識形態相關的心理學規律。例如,Caldarelli等的研究發現,意大利網民在Twitter上提及各黨派領導人的微博數量及其隨時間的變化特征對于預測全國政治大選具有顯著價值。[25]Markey通過分析2004、2006、2008年美國大選期間,搜索引擎網站Google上美國各州的色情類詞匯搜索量波動趨勢,發現如果某政黨“票倉州”所支持的參選者最終確實獲勝,選舉之后該州的色情類詞匯搜索量會快速上升,顯著高于其他州。該網絡行為現象驗證了進化心理學中著名的“挑戰假說”(Challenge Hypothesis)。[26]

在政治意識形態方面,Bond和Messing的研究證明了通過Facebook數據預測大眾政治意識形態的有效性和可行性,并提出了以此進一步開展政治計劃、政治意識形態結構及其與政治參與率關系研究的研究方向。[27]Wojcik等最近發表在《科學》雜志的一項研究試圖探索到底持保守主義政治意識形態者和自由主義者誰更幸福。結果發現,在自我報告的問卷調查結果中,持保守主義政治意識形態者報告了比自由主義者更高的幸福感,而通過Twitter等社交媒體數據的客觀幸福感指標(例如積極情緒的表達、微笑)看,保守主義者卻顯著地表達了比自由主義者更低的幸福感。[28]

(六)其他富有前景的應用領域

大數據已經廣泛應用于心理學的各分支領域,并不局限于以上列舉的這些應用領域。例如,在文化心理學研究領域,有研究者通過Google Ngram基于Google掃描全球所有已出版書籍中約4%數據集所提供的歷時近200年的大數據來研究文化的變遷[29-30],包括個體主義—集體主義文化的歷史變遷[31-33],美國性別平等文化與女性地位的歷史變遷等[34]。還有其他豐富的數據來源也被巧妙地應用到各研究中。例如,通過15萬歷史名人的出生地、死亡地數據來反映歐洲和北美的文化歷史變遷[35];智能手機的數據被應用于實時刻畫大規模人群的人口分布[36],研究人們對突發事件的集群行為規律。[37]

三、我國的大數據社會心理學研究實踐

我國的社會心理學研究者已經主要就中國微博情緒的在線測量和應用問題,嘗試與信息科學領域的研究者一起展開了一系列的研究和探索。

(一)微博情緒測量工具的開發

微博積累的海量信息為直接測量大規模人群的態度、社會情緒提供了可能。對在線文本進行情感分析一直是信息科學領域的熱點問題,但傳統在線文本分析技術主要以數據驅動或者經驗驅動,例如包含正向情緒和負向情緒的二分法。情緒、情感是心理學領域的經典研究問題,將心理學領域關于情緒相關的研究成果應用于在線文本分析技術,可從理論視角為提升在線文本分析技術的有效性提供支持和幫助。樂國安等對情感分析技術、情緒詞庫的構建與發展、在線文本情感分析技術的實踐應用等問題進行了較為系統的總結和歸納。[38]

詞匯匹配技術是目前分析海量微博客(例如Twitter、新浪微博)使用最為廣泛,也是效果相對較好的方法。該方法的原理主要是通過統計目標文本中與情緒詞庫中特定類型的情緒詞的詞頻多少來計算該文本的情緒定向。[39]因此,情緒詞庫的建設是基于詞匯匹配技術的在線文本情感分析技術的核心。董穎紅等基于心理學經典的基本情緒結構理論,將微博情緒分為快樂、悲傷、憤怒、恐懼和厭惡五種(其中驚奇情緒由于在測試中發現使用頻率較低而未納入詞庫中),構建了包含818個情緒詞(快樂306個;悲傷205個;厭惡142個;恐懼72個;憤怒93個)的標準化微博客基本情緒詞庫(Weibo Basic Mood Lexicon,Weibo-5BML)。[39]

為了檢驗該情緒詞庫和工具的有效性,研究團隊與華東師范大學軟件學院海量計算研究所團隊合作,在160多萬新浪微博用戶2011年7月至2012年11月期間發布的微博文本上進行測試。首先,對五種微博情緒之間的內部相關性進行測試,結果發現:快樂和悲傷、厭惡、憤怒、恐懼情緒均為顯著負相關;而悲傷、厭惡、憤怒和恐懼情緒之間呈現顯著正相關。該檢驗結果與心理學經典的情緒理論,例如效價—喚醒理論,有較好的一致性。其次,通過整理五種微博情緒在一周內(周一至周日)的周變化趨勢,結果發現:快樂情緒在周末顯著高于工作日,而周三的快樂情緒達到最低點。這為探索大規模人群的整體情緒的節律變化提供了新的證據。最后,為了檢驗微博情緒測量工具的生態效度,研究團隊還分析了五種微博情緒對現實社會中重大節日、重大社會熱點事件的反應。結果發現,微博情緒對2011年“7·23甬溫線旅客列車特別重大事故”、2012年“釣魚島之爭”、春節、中秋節、感恩節等重大事件和節假日都呈現出了較為靈敏而合理的反應。例如,2011年7月23日,甬溫線段發生了旅客列車特別重大事故,事故發生當天,快樂情緒開始下降,而悲傷、憤怒和恐懼情緒開始上升。隨后的幾天人們一直沉浸在悲傷、憤怒和恐懼的氛圍中,一直到7月29日悼念活動結束以后公眾的各種基本情緒才逐漸恢復到往日的水平。尤其是在事故發生之初,生命至上、緊急救援是主要問題,因此人們的悲傷情緒首先上升到高點;但隨著時間的推移,事故的處理方式和對原因的調查使得公眾對政府的不滿、憤怒情緒不斷推高。以上檢驗結果表明,研究團隊基于基本情緒結構理論開發的Weibo-5BML微博情緒測量工具,在分析大眾情緒信息時是有效的,這對于實時、高效地感知公眾的社會情緒變化具有重要的意義。[39]

(二)基于微博情緒的應用社會心理學研究

1.預測股市

在發現新浪微博上單個情緒詞(例如“緊張”)與上證指數之間存在顯著關聯的基礎上,為了探索更一般性的微博情緒與股市關系,賴凱聲等基于心理學的情緒理論和情緒測量量表,抓取了新浪微博上2011年8月1日至2012年2月29日期間2 242個情緒詞匯的詞頻數據。結果發現,2242個情緒詞中,有993個情緒詞與上證指數之間存在顯著的相關關系,并且基于這2 242個情緒詞通過相關系數篩選、加權得到的微博情緒綜合指數與上證指數之間的相關高達0.877。進一步對微博情緒綜合指數和上證指數的時間序列構建協整模型發現,二者存在顯著的長期均衡關系,且微博情緒綜合指數能顯著預測下一個交易日的上證指數。[40]

Dong等通過構建的微博客基本情緒詞庫(Weibo-5BML)工具和2012年2月1日至2012年11月30日期間的新浪微博數據,檢驗了不同類型的微博情緒與股市之間的關系。研究結果發現,五種情緒中悲傷情緒能顯著提高上證指數成交量(預測準確率提高2.4%)??紤]到悲傷情緒的喚醒度最低,研究者再把悲傷情緒詞中喚醒度最低的25%作為新的悲傷指數,結果發現對上證指數成交量的預測能力仍然顯著。該研究結果表明,具有低喚醒度的負性情緒與上證指數交易量相關,該結果從群體層面支持了情緒維持假說,并為情緒泛化假說和情緒維持假說的爭論提供了新證據。[41]

2.風險社會預測

處于社會轉型期和全球化進程的中國社會面臨著各種社會風險。個體層面的研究認為,由感知的社會風險誘發的情緒,例如憤怒,可能會引發集體行動。但在宏觀群體層面,由于測量手段和成本的限制,大眾感知的社會風險與社會情緒之間的關系并不明確。為探索大眾對感知的社會風險的情緒反應規律,Dong等的研究通過百度搜索數據來刻畫中國網民的社會風險感知水平(分為社會穩定風險、日常生活風險、資源環境風險、公共道德風險、政府執政風險、國家安全風險、經濟金融風險七大類),通過微博客基本情緒詞庫(Weibo-5BML)工具分析新浪微博數據得到五類基本情緒水平。通過Granger因果檢驗發現,大眾感知的社會風險對社會情緒有顯著的預測力,但不同的風險類型對不同情緒的預測力是不同的。例如,感知的政治執政風險能顯著預測憤怒情緒,資源環境風險感知能顯著預測未來2~5日的悲傷情緒。[42]

另一方面,大眾感知的社會風險對社會穩定和社會和諧有負面影響,因此研究群體層面的大眾情緒能否影響或預測社會風險感知也具有重要意義。Dong等同樣采用百度搜索數據和新浪微博數據,研究了中國網民的社會情緒對大眾社會風險感知的預測效果。結果發現,社會情緒對大眾感知的社會風險具有顯著的預測力,但不同的社會情緒對不同類型的社會風險感知的預測效果是不同的。相比快樂情緒,悲傷、厭惡、憤怒、恐懼四種負性社會情緒是社會風險感知水平更為重要的預測變量。關于社會風險與社會風險感知水平的關系研究表明,通過社會化媒體捕捉和研究大眾心理特征和規律是可行的。[43]

3.精英與大眾的微博情緒關系

關于精英與大眾的關系一直是政治學、社會學、傳播學、心理學等多學科領域學者關注的問題。傳播學的意見領袖研究認為,意見領袖在信息傳播中起著二級傳播的作用,對大眾具有重要的引領作用;政治學領域的研究者認為,政治精英只是強化和激發現存的公共輿論,整體上對公共輿論的影響是“微不足道”的;而另一些研究則反對這種認為影響微不足道的觀點,并給出了一些政治精英利用大眾傳媒操縱公共輿論的證據。隨著社會的發展,精英和大眾之間的關系變得越來越復雜。尤其是互聯網時代,微博等自媒體的發展,精英與大眾互動的頻率和強度都產生了巨大的飛躍,這無疑更加凸顯了探究精英和大眾的關系問題的重要性。精英是因為能準確感知大眾輿論的趨勢,迎合或順應大眾的“民意”,從而獲得大眾擁戴,即“時勢造英雄”;還是因為能憑借自身能力制造、引領時勢,充當大眾引領者的角色,即“英雄造時勢”?

Lai等以微博情緒的分析視角為切入點,借助研究團隊構建的微博客基本情緒詞庫(Weibo-5BML)工具和新浪微博2011-2012年的微博數據,探索了覆蓋房地產、教育等9個行業的894名微博精英和160多萬名大眾用戶之間的微博情緒關系。綜合分析9大領域結果發現:(1)當下中國的經濟資本比文化資本具有更大的影響力。房產、財經和科技類意見領袖(即經濟資本領域)均有顯著領先于大眾情緒的傾向,而傳媒、時尚、藝術、娛樂、教育、文學意見領袖(即文化資本領域)領先大眾情緒的傾向相對更低甚至落后于大眾情緒。(2)不同領域、不同情緒類型下的影響關系不完全相同,但總體來看,“時勢造英雄”的效果要比“英雄造時勢”的效果強些。(3)消極情緒比積極情緒更易傳播。其中,積極情緒中快樂情緒在4個領域的意見領袖群體和大眾情緒中有顯著的領先和滯后關系;而消極情緒中悲傷情緒在8個領域、厭惡情緒在6個領域、恐懼情緒在5個領域、憤怒情緒在2個領域內的意見領袖群體和大眾情緒中有顯著的領先和滯后關系??偟膩碚f,經濟資本和文化資本之間的支配和被支配關系取決于哪類資本占據了相對較高的話語權。基于微博情緒的研究發現經濟資本比文化資本更具影響力的結果在一定程度上能反映轉型期中國文化轉型落后于經濟轉型的社會現狀。[44]

4.厭惡情緒預測地區民族主義

關注情緒的進化意義的研究者認為,厭惡情緒可保護人們免受有毒物質、病菌和疾病的威脅。[45]厭惡情緒在道德決策和意識形態層面的影響作用也得到了研究者的關注。個體層面的實驗和調查證據發現,厭惡情緒與個體的政治意識形態,例如預測保守主義、投票行為,有顯著關聯。民族主義是個體認同或依附于自己民族和國家的一種信仰或意識形態,具有以自我民族中心,以及排斥、貶低外民族的傾向等主要特征。那么,在群體層面的厭惡情緒與地區的民族主義是否有關聯?

高樹青等借助研究團隊構建的微博客基本情緒詞庫(Weibo-5BML)工具來測量2011年中國各省(市、自治區)的新浪微博厭惡情緒表達,并結合包含17萬網民樣本的“中國政治坐標系測試”關于政治意識形態網絡大調查數據,從宏觀層面探索了網絡厭惡情緒表達與地區民主主義之間的關系。研究結果發現:(1)中國各省的厭惡情緒表達與地區民族主義存在顯著相關;(2)在控制了各省的人均GDP、地理封閉性、農村人口比重等變量之后,厭惡情緒表達與地區民族主義之間的相關仍然顯著;(3)進一步的穩健性檢驗發現,5類基本情緒中,有且僅有厭惡情緒與地區民族主義具有顯著關聯。因此,微博厭惡情緒表達與地區民族主義正相關的結果具有較好的區分效度,這為理解群體層面的情緒表達和民族主義傾向之間的關系提供了直接證據。[46]

四、大數據研究存在的問題

(一)大數據“萬能論”與“無用論”

關于網絡大數據的定位問題,尤其是大數據在受到商界熱炒的背景下,如何客觀、理性地看待大數據研究也是一個值得討論的問題。認為大數據能解決一切問題,采用大數據的研究方法就是高質量的研究,這便是推崇大數據“萬能論”;也有觀點認為大數據一無是處,存在數據不精確,結果是偽相關等問題,便是信奉大數據“無用論”。筆者認為,我們既不要盲從于大數據“萬能論”,也不必因大數據“無用論”而望而卻步??陀^來講,大數據更像是一種新范式或者新方法,它有它自己的優勢,例如樣本量大、生態效度高。大數據也有一些缺陷,包括不精確、信度低,難以揭示因果等問題。正如傳統的實驗法有控制嚴格的優點和生態效度低的缺點,而問卷法有被試范圍廣的優點和存在社會稱許性反應的弊端一樣,大數據會存在優點和缺點自然也屬情理之中。因此,將大數據看成一種新的研究范式,研究者可以更好地結合一般方法論、研究范式的優缺點的視角來客觀、理性地評價和應用它。

(二)大數據的因果關系問題

大數據研究具有全體、混雜和相關三大特點。[47]27-96其中,相關指的是大數據研究通常更加關注相關性,而不是因果性。因果關系的確立需要排除很多可能的干擾因素,而大數據混雜的特點很難保證因果關系的推論,要通過大數據來研究因果是比較困難的。很多大數據研究中找到的因果也只是統計學意義上的因果,例如,基于Granger因果檢驗的研究。但統計意義上的因果關系代表的是數據在時間上的領先滯后關系,與邏輯學意義上的因果并不等同。因此,如果需要進一步確定因果關系,建議可再結合傳統的實驗法進行檢驗和確定。值得一提的是,大數據發現的相關,尤其是時間序列上的領先—滯后相關由于具有預測性,因此仍然是具有較強的實踐應用價值的。這也可能是大數據在產業界傳播范圍廣、影響力大的重要原因之一。

(三)大數據的隱私問題

在大數據被廣泛應用于科研、商業和管理等諸多實踐領域的同時,人們也開始思考大數據對人類帶來的威脅和負面影響。其中以對數據隱私問題的顧慮最具代表性。人們在搜索引擎上的搜索記錄、在電子商務網站上的購物記錄、在社交媒體上與好友的互動記錄等,這些數據都被網絡服務商所掌握。這些數據的安全性則成為了網絡信息化社會的一大隱患。尤其是2013年的“棱鏡門”事件更是激發了人們對數據安全、數據隱私問題的關注。關于數據收集者是否有權收集、分析以及使用相關信息也引起了廣泛的討論。例如,傳統社會中,由于社會流動性的存在,對于一些犯過一些過錯的人,往往還具備通過更換環境來重新開啟新生活的權力。但網絡社會信息的全覆蓋,一旦有任何負面的信息發布到網上,幾乎世界上任何有互聯網覆蓋的角落都能知道該信息,并且它可能被永久的記載。換言之,在大數據時代,人們的隱私空間越來越小,這種現象被稱為“被遺忘權”的剝奪。數據隱私權隱患引起了社會各界的大討論,世界各國已經開始著手建設和完善大數據隱私保護相關的法律。對于學術研究而言,大數據研究者可通過建立一個自由、透明的學術共同體,共同遵循和監督在充分保證用戶個人隱私的條件下開展有價值的學術研究的數據使用原則。例如,對個體關鍵信息進行匿名化處理是大數據研究中常用的保護用戶個人隱私的辦法。

五、未來研究展望

近些年圍繞網絡大數據的社會心理學研究展現出了巨大的發展潛力,在研究視角、研究方法的多元化等方面都取得了重大的突破。2013年Watts曾就計算社會科學的研究現狀和面臨的挑戰問題指出,雖然目前已經有了成百上千篇關于社會網絡、金融危機、群體形成等問題相關的計算社會科學研究成果,但這些成果中很少能被傳統社會科學的期刊所認可并發表。[48]換言之,Watts一針見血地指出了當時信息科學領域研究者與社會科學研究者之間的合作仍然不夠充分,從而導致主流社會科學和計算社會科學研究領域之間仍然存在較深隔閡的問題。這也與大多數計算社會科學領域的研究缺乏對傳統社會科學理論和現實重要社會實踐的關注有關。對于大數據心理學研究領域的發展而言,該問題和挑戰同樣存在,并且將長期存在。值得肯定的是,就在最近的幾年發展中,已經開始涌現出一批具有代表性意義的大數據心理學研究,并得到了一些主流心理學期刊的認可。例如,在2014-2015年期間,有多篇基于Facebook、Twitter、Google網絡搜索的大數據研究相繼在社會心理學領域的國際頂級期刊,如美國的《人格與社會心理學》《心理科學》等雜志上發表。這意味著基于大數據的社會心理學研究領域已經逐漸步入主流心理學研究的視野,并開始展示其蓬勃的生命力。筆者認為,要想獲得長足的發展,并且真正獲得主流心理學的認可,研究者在未來研究中不能僅僅只把網絡作為一種人類活動的特定情境來研究網絡用戶的心理與行為規律,更應重視借助網絡大數據相關的研究技術和手段來解決心理學領域的重要理論和現實問題。

尤其是對于國內的研究者而言,國內相關領域的研究總體上仍處于探索期,研究成果和經驗相對較少。這既意味著存在廣闊的發展空間,也意味著面臨巨大的挑戰。數據公開、數據共享也是未來發展的大趨勢。我國作為人口大國,網民用戶群體規模龐大,這為研究者研究轉型期中國人的心理與行為規律提供了鮮活的證據。當前正處于轉型期的中國,在大眾心理與行為層面涌現出許多可供深入挖掘的研究資源。建議國內研究者在延續傳統心理學研究范式,探討網絡化環境下個體心理、社會適應的影響機制研究的同時,也多關注借助網絡大數據探索群體心理和行為問題。這對于及時發現和解決社會問題,從而促進社會的和諧發展具有重要的意義。

建議未來研究多結合心理信息學的視角,將網絡大數據研究技術多應用于解決具有重要現實意義的社會問題(例如,醫療衛生問題、幸福感問題、環境問題),落實心理學服務社會的使命。從已有的研究證據來看,心理信息學的研究范式不但在探索有關個體和群體心理與行為規律的研究問題上展示出了巨大的潛力,還能幫助研究者從理論驅動出發,通過網絡大數據來驗證一些心理學的經典假設,從而為理論假說、爭論提供新的證據。因此,心理信息學有望成為未來心理學發展的重要方向之一。[1]但心理信息學研究的順利開展,需要心理學和信息科學領域研究者的密切配合以及相關資源的全力支持。建議國家多提供一些跨學科領域合作的資源項目,支持和鼓勵開展跨學科領域合作的課題;而研究者自身則應能主動地學習和了解相關領域的知識,打破傳統的學科思維界限,積極投身于跨學科合作實踐中,從而把握網絡大數據時代的機遇。

關鍵字:情緒測量

本文摘自:《蘇州大學學報:教育科學版》

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 剑川县| 舟曲县| 垫江县| 武强县| 永德县| 芮城县| 株洲市| 凤翔县| 屏山县| 涟源市| 金乡县| 天等县| 鄂伦春自治旗| 潍坊市| 松溪县| 万源市| 突泉县| 秦安县| 苍南县| 日照市| 德州市| 四会市| 马龙县| 龙海市| 克什克腾旗| 吉首市| 阿图什市| 黑河市| 富顺县| 宝丰县| 泗阳县| 拉孜县| 涡阳县| 玛曲县| 龙海市| 汕尾市| 蓝山县| 翁源县| 阳西县| 唐河县| 嘉荫县|