信息科學技術的發展和互聯網平臺的出現,為及時有效感知社會心理態勢提供了新的契機,使通過網絡數據實現對用戶心理要素的計算預測成為可能。
目前,國內的微博用戶數量已近3億人。不可否認,微博在快速改變傳統網絡輿論格局力量的同時,也逐漸展現出其自身所具有的獨特優勢。用戶在微博平臺上可以真實、自發地表達或分享自己的情感、觀點和社會態度,為社會心理研究提供了大量真實、可靠的潛在數據源。
“我們團隊提出利用微博大數據,開展社會心理態勢感知研究,在對社會媒體大數據分析的基礎上實現社會心理要素識別,并預測相關心理要素的發展趨勢,建立快速準確的社會心理態勢感知系統。”中國科學院心理研究所(以下簡稱心理所)研究員、社會與工程心理學研究室主任朱廷劭告訴《中國科學報》記者。
構建“心理地圖”
描述群體的心理狀態及其發展趨勢,能夠對群體和個體的行為取向進行預測,就是社會心理態勢。朱廷劭介紹說,社會心理態勢主要由社會群體中個體的心理態勢組成,也同時影響著個體心理態勢發展的方向和趨勢。人們對涉及的社會事物,因其是否符合自身物質方面或理念方面的需要,會產生不同的體驗和態度,這些都屬于社會心理態勢的范疇。
一直以來,通過大范圍的問卷測評方法是研究社會心理態勢感知的主要手段。但是該方法受時效性、社會贊許性等因素影響;同時自陳方式的測評周期長、成本高,無法及時大規模獲取用戶的心理狀態,而且縱向追蹤研究不具有實施上的可行性。
為此,該研究組開發的新浪微博應用“心理地圖”在線問卷填寫和調查平臺,可以滿足大規模用戶調查的需求。“走”一圈“心理地圖”大概需要花費15分鐘,這樣就能來一場集中的自我心理問答。其中不少問題都是我們某一時刻心情的寫照。
“心理地圖”具有微博數據抓取的網絡爬蟲功能,其中數據量超過10TB,完全具備了微博大數據的獲取和處理能力。
科學計算識別各類要素
朱廷劭說,社會心理態勢要素包含人格、心理健康、主觀幸福感以及社會態度等多方面的指標。通過網絡數據對這些指標進行預測是社會心理態勢感知的重要組成部分,他們得出了不少新的結論。
首先是人格。人格的定義是代表人際之間存在個性化差異的重要原因與心智基礎,個體的人格特征有助于身份識別。
朱廷劭團隊的研究中,在征求用戶同意的情況下,隨機選取547名微博用戶作為被試者,下載其微博行為記錄,并提取839個行為特征作為預測變量;同時,對全體被試施測大五人格問卷,獲取其在各人格維度上的得分作為結果變量。
他們利用支持向量機與Pace回歸算法分別訓練基于微博行為的人格計算模型。
“研究結果表明,基于微博行為的人格計算模型擁有良好的測量屬性。”朱廷劭說。利用支持向量機模型,微博行為對各人格維度高低得分組被試的分類精度達到84%~92%;利用微博行為建立的回歸模型,基于微博行為的人格預測結果與基于自評問卷的人格測驗結果之間的相關系數達到0.48~0.54。這表明,通過微博行為來預測用戶的人格特征是完全可行的。
再有,針對心理健康的問題,朱廷劭團隊使用新浪微博數據建立心理健康(抑郁)預測模型。利用被試的微博數據,并用機器學習的方法建立模型,通過模型計算得出被試的抑郁狀態評分。
他們抽取1萬個已簽署知情同意書的新浪微博用戶,并施測抑郁測評問卷;同時提取其內容與行為兩方面建立特征,建立了心理健康的回歸預測模型。結果表明,預測模型值與真實值的相關系數接近0.4,達到中等相關水平。
其次是主觀幸福感。指人們對其生活質量所作的情感性和認知性的整體評價。他們采集了1785名已簽署知情同意書的用戶作為被試者,其中649名男性、1136名女性;采用不同的特征集合建立了主觀幸福感的預測模型。
研究結果表明,使用行為特征、內容特征,同時加入年齡、性別、收入和受教育程度等統計信息特征,可以達到最優的預測效果。模型相關性可達到0.31~0.54,表明利用微博數據預測得到的用戶幸福感是可行的。
最后一個研究內容是社會態度。根據先前研究的經驗,將社會態度分為四方面的指標,分別為社會狀況評價、社會風險判斷、經濟發展信心和對政府執政的滿意程度。
該研究團隊在廣東省開展用戶實驗,并采集了2018個已簽署知情同意書的合格樣本,利用微博數據,采用多任務回歸進行群體社會態度的預測。
預測結果和標注結果的平均相關系數達0.41,平均預測誤差率為15.5%。本研究利用網絡數據的可回溯性,能夠描述指定區域群體社會態度隨時間的變化情況。
在社會態度預測結果的基礎上,利用微博數據計算預測出的區域社會態度與宏觀經濟指標高度相關,表明微博預測模型的有效性。具體來說,將結果與廣東省各地市年度經濟指標進行相關性分析。
“結果顯示,地方經濟滿意度和經濟指標顯著相關,而生活滿意度、收入滿意度、社會地位滿意度以及國家經濟滿意度則為弱相關。社會消費品零售總額和批發零售貿易業零售額與社會公平滿意度正相關。”朱廷劭解釋道。
社會心理發展趨勢預測
朱廷劭團隊用時序分析技術預測社會心理發展趨勢,并預判網絡群體事件發生的風險指數,通過多種如新聞媒體等渠道,得到某地發生的群體事件。
針對群體事件數量少的情況,朱廷劭團隊綜合采用多種機器學習方法,利用微博數據預測群體事件風險,實現對群體社會態度臨界狀態的預警,為及時化解可能的群體性事件提供數據支持,助力社會管理創新。
綜上所述,社會心理態勢的感知變化,可設置特定場景,觀察社會心理態勢可能的變化趨勢(事件刺激)。針對不同類型的網絡用戶,可以甄別其社會心理態勢。
“我們研究分析社會心理態勢,可以發現并監測社會不穩定因素,提請國家有關部門及時采取措施,化社會不穩定因素于未然。研究表明,開展社會心理縱向研究,可作為數據智囊為社會管理提供更科學、更客觀的發展報告。”朱廷劭說。