當今時代,大數據泛濫、數據挖掘工具種類繁多,玩弄圖表游戲已經變得不能再容易,管理者需要火眼金睛,秒殺數據間的虛假關系!
舉個例子,隨機選取統計學上相關的兩組數據,Y軸表示數據。
截取Y軸,讓兩條線接近。看,訂閱HBR增加了WidgetCo公司的收入。
是不是感覺被忽悠了呢?!警惕虛假相關,一起新技能get√
我們都知道“相關關系并不意味著因果關系”,但當我們看到兩條線朝同樣的方向傾斜,柱狀圖中數值同時上升,或者數據點在散點圖上聚集在一起時,數據簡直在請求我們找出其中的邏輯,我們也甚至想要相信其中存在某種邏輯。
然而,統計學原則要求我們不能做這個邏輯跳躍。有些圖表利用視覺小把戲,企圖證明事物間存在密切相關性。哈佛法學院法學博士生、《虛假相關》(Spurious Correlations)一書作者泰勒·維根(Tyler Vigen),在他的網站上展示了一些荒唐可笑的“相關性”例子,比如美國人造黃油的人均消耗量和緬因州離婚率。
1 荒謬性
泰勒 維根制作網站就是為了從容量較大的數據組中,找到并描述出數據間荒謬的相關性。以下是三個例子: