3月29日消息,據VentureBeat報道,當Cambridge Analytica等大數據公司宣稱自己影響到2016年美國總統大選后,它們立刻成為媒體關注的重點。這些公司通過社交媒體貼文和第三方數據推斷出用戶的性格特征,并利用高度可操縱化的廣告影響民意。利用購物習慣、雜志訂閱、Facebook“點贊”以及其他高達5000項輸入等大量數據,Cambridge Analytica等公司可以對美國2.2億成年人的性格作出預測。
有了這些非常詳細的“檔案”,Cambridge Analytica就可以針對你的性格進行“行為微定位”。但是這家公司并非唯一這樣做的機構。財富500強企業的品牌營銷員、數字廣告上以及各種各樣的分析公司,都在通過分析社交媒體和公開貼文尋找影響消費者的更好機會。初步研究顯示,針對消費者性格推出的廣告,在Facebook上獲得點擊率高達63%。
如果你在Facebook或Twitter上非常活躍,你的社交媒體資料可能泄露你的很多信息,這些信息可被廣告商利用。美國賓夕法尼亞大學計算機科學教授萊爾·昂加爾(Lyle Ungar)利用他的職業發展統計和機器學習方法從文本中提取洞見,重點關注你的Facebook和Twitter貼文,特別是與你的健康和福祉有關的內容。
經過對你社交媒體行為進行數年研究,昂加爾及其團隊可以對你做出以下五項推測:
1.年齡和性別
女性來自金星,男性來自火星。當你分析男女在社交媒體上使用的語言時,這種區別就更加明顯。女性更多使用情緒詞匯、第一人稱,更多提及心理和社交過程。而男性大量使用臟話和游戲術語,他們的占有欲更強,比如總會加上“我的妻子”、“我的女友”,女性則只使用丈夫或男友。
在自我表達過程中,男女在年齡方面的差異也很大。即使使用類似短語,也可以看出你是否足夠“成熟”。昂加爾及其團隊在MyPersonality項目中分析了7.5萬份Facebook資料,才得出上訴結論。如果你覺得好奇,可以在昂加爾的網站(http://www.wwbp.org/agegender.html)上嘗試下年齡或性別預測,看看其預測模型是否足夠準確。
2.性格特征
麥爾斯-布瑞格斯性格類型指標(Myers-Briggs)可能很受歡迎,開放性、盡責性、外向性、宜人性以及神經質等五大性格特征,在預測中表現出更高的預測價值。但性格特征畢竟不是實物,你不可能精確到小數點后多少位。在最好的情況下,在進行實際預測時,研究人員會發現“弱陽性”和“負相關性”。
如果你想知道自己在神經質測試中得分多少,IPIP-300是可用到的更全面測試之一。你也可以使用昂加爾的社交媒體資料分析法。除了年齡和性別,性格特征在我們的語言表達中也截然不同。顯然,外向性的人等不及參加派對,而內向性的人多沉迷于動漫、互聯網以及游戲等。
即使個人資料中的照片選擇,也會泄露我們的性格特征。性格非常開放的人更有可能選擇藝術性和非正統性照片,而且這些照片都不是他們自己的面孔。他們也有更好的審美感,選擇對比對、清晰度以及飽和度更高的照片。而盡責性的人則會做出相反的選擇,他們通常張貼自己的正面照,而且只有臉部。外向性的人傾向于張貼自己與其他人的合影。
3.職業
如果你沒有與職業社交網站LinkedIn上的人聯系,你可能不會去看他們的資料和當前職位。事實證明,他們在Twitter上的公開發言也可能隱秘地揭示這個信息。這并不令人感到驚訝。高管們通常會寫有關商業或金融新聞方面的東西,而低級職員會用更多時間討論個人興趣愛好,而非與工作相關的主題。昂加爾的同事丹尼爾·彼得洛(Daniel Preotiuc-Pietro)及其團隊能夠通過分析Twitter上的用語,非常準確地分析出某人的職業。
4.自戀與精神變態者
通過社交媒體語言,你還可以發現令人毛骨悚然的東西。自戀者追求聲望、地位以及其他人的艷羨,而精神變態者缺乏悔念、敏感性,對道德毫不關心。喜好權謀的人故意操縱和利用其他人實現自己的目標。這些人類行為的陰暗面可被合并稱為“黑暗三弦”。正如預期的那樣,精神變態者更多使用攻擊性和暴力語言,比如殺戮、憤怒以及其他負面情緒用語。權謀者大量使用垃圾郵件和廣告貼文。行為分析也可發現這些性格特征。自戀者更有可能發布涉及地理位置的推文,不太可能發布重復性貼文或標簽,這顯示他們對推文進行了精心策劃。
5.死于心臟病的可能性
在2015年研究論文中,昂加爾及其團隊描述了一種模式,只使用Twitter上的數據就能預測心臟病的死亡率,甚至比其他傳統因素(包括人口、社會經濟)與健康危險因素(比如吸煙、糖尿病、高血壓以及肥胖)相結合的方法更準確。在人際關系惡劣和慢性壓力下,心臟病會加重。昂加爾及其團隊追蹤反映負面社會交往、負面情緒(比如憤怒)以及脫離社會的語言,這些標志都是心血管疾病死亡的更精確預兆。