糟糕的數(shù)據(jù)是昂貴的。隨著數(shù)據(jù)在人們的生活中做出如此多的決定,不良數(shù)據(jù)的成本真正影響了所有人,無論人們是否意識到這一點(diǎn)。根據(jù)IBM公司的估計(jì),不利的數(shù)據(jù)每年消耗了美國經(jīng)濟(jì)3.1萬億美元左右。處理數(shù)據(jù)的大多數(shù)人都意識到,糟糕的數(shù)據(jù)可能是非常昂貴的,但是這個(gè)數(shù)字是真正驚人的。大多數(shù)企業(yè)分析的數(shù)據(jù)是關(guān)于客戶的數(shù)據(jù),如果企業(yè)依賴于不良數(shù)據(jù),那么其業(yè)務(wù)將很難獲得成功。
信息服務(wù)機(jī)構(gòu)Experian Data公司的研究發(fā)現(xiàn),不良數(shù)據(jù)對美國88%的公司的底線有著直接影響,每個(gè)企業(yè)的平均虧損約占總收入的12%。這些數(shù)字描繪了不良數(shù)據(jù)對人們經(jīng)濟(jì)的負(fù)面影響的真實(shí)情況。
除了不良數(shù)據(jù)的財(cái)務(wù)影響之外,不良數(shù)據(jù)的影響還包括錯(cuò)誤信息的傳播。在歷史上,有很多錯(cuò)誤數(shù)據(jù)和錯(cuò)誤的例子幫助人們塑造了當(dāng)今的世界。
來自Utopia公司的一些數(shù)據(jù)分析師已經(jīng)在一個(gè)信息圖中制定了一個(gè)綜合實(shí)例的列表,顯示了糟糕的數(shù)據(jù)錯(cuò)誤導(dǎo)致了改變?nèi)藗儺?dāng)今生活的歷史和社會歷程的災(zāi)難性決策。讓我們從列表中探索一些更有趣的例子。
(1)2016年美國總統(tǒng)選舉
最近結(jié)束的美國總統(tǒng)選舉陷入了糟糕的數(shù)據(jù)。從無數(shù)的民意測驗(yàn)和民意調(diào)查總結(jié),到預(yù)測網(wǎng)站FiveThrityEight和紐約時(shí)報(bào)高調(diào)的政治預(yù)言,大多數(shù)民意調(diào)查和預(yù)測指標(biāo)都使得這次選舉預(yù)測完全錯(cuò)誤,并預(yù)測了希拉里·克林頓將會獲得勝利。許多民主黨人認(rèn)為這是一個(gè)錯(cuò)誤,導(dǎo)致很多選民在選舉日呆在家里沒有去投票。這個(gè)預(yù)測顯然沒有實(shí)現(xiàn)。
利用先進(jìn)的統(tǒng)計(jì)數(shù)據(jù)分析以前的選舉結(jié)果,并通過使用機(jī)器學(xué)習(xí)和基于選民滾動(dòng)創(chuàng)建“廚房水槽”模型,可以防止這種不良數(shù)據(jù)的傳播。這可能聽起來很復(fù)雜,但它是改進(jìn)民意調(diào)查的基本假設(shè)的確定方式。然而,這些方法對于大多數(shù)民意調(diào)查來說都是昂貴和耗時(shí)的,而是使用在線調(diào)查和公開的在線人口普查數(shù)據(jù)。
(2)2001年的安然公司丑聞
安然公司曾經(jīng)是世界上最強(qiáng)大和規(guī)模最大的公司之一。在二十世紀(jì)初期,他們經(jīng)歷了令人沮喪的高管薪酬下降和股價(jià)飛漲的時(shí)期。然而,大量的欺詐性財(cái)務(wù)數(shù)據(jù)是導(dǎo)致安然公司的垮臺直接原因。
從內(nèi)部舉報(bào)人到安然公司外部審計(jì)人員的文件破解,毫無疑問,提供給股東的數(shù)據(jù)基本上是虛構(gòu)的。安然公司的高管及其審計(jì)機(jī)構(gòu)向股東和董事會提交的年度報(bào)告和財(cái)務(wù)報(bào)告中的數(shù)據(jù)證明是錯(cuò)誤的。
安然公司的一家倫理審計(jì)公司可能會阻止這種金融欺詐發(fā)生。2002年“薩班斯-奧克斯利法案”在安然丑聞之后頒布,這個(gè)法案可以確保審計(jì)師的獨(dú)立性,企業(yè)責(zé)任,財(cái)務(wù)披露,利益沖突和公司上市的監(jiān)督。如果這個(gè)法案早些時(shí)候頒布,也許會阻止安然公司的災(zāi)難發(fā)生。
(3)20世紀(jì)20年代汽油含有四乙基鉛
20世紀(jì)20年代,美國將四乙基鉛加入汽油作為發(fā)動(dòng)機(jī)的抗爆劑,四乙基鉛導(dǎo)致美國超過5000人死亡。這在一定程度上是由天然氣行業(yè)和美國政府的故意欺騙引發(fā)的測試而實(shí)現(xiàn)的。
幾十年來,鉛涂料和含鉛行業(yè)因鉛中毒而相互指責(zé),這兩者都表明其產(chǎn)品對人類是安全的。業(yè)內(nèi)科學(xué)家甚至建議人體自然就擁有鉛,所以鉛處于高水平不應(yīng)該是一個(gè)健康問題。
在首次發(fā)現(xiàn)含鉛汽油的潛在威脅后,應(yīng)對其有害影響進(jìn)行獨(dú)立研究。美國政府和天然氣行業(yè)對此都視而不見,而是依賴不利于他人生命健康的不良數(shù)據(jù)。
(4)哥倫布與美洲發(fā)現(xiàn)
即使美洲的發(fā)現(xiàn)也是數(shù)據(jù)不佳的結(jié)果。克里斯托弗·哥倫布在繪制歐洲和亞洲之間的距離時(shí),就有一些重大的錯(cuò)誤估算。首先,他深受波斯地理學(xué)家Alfraganus價(jià)值觀的影響,希望對希臘地理學(xué)家Eratosthenes進(jìn)行更準(zhǔn)確的計(jì)算。第二,哥倫布認(rèn)為Alfraganus在計(jì)算時(shí)指的是羅馬里程,實(shí)際上他指的是阿拉伯里程。
哥倫布應(yīng)該為糟糕的數(shù)據(jù)負(fù)責(zé)。哥倫布可能會堅(jiān)持一個(gè)地理學(xué)家的計(jì)算,并驗(yàn)證測量他使用的測量單位實(shí)際上是正確的。
人們可以從錯(cuò)誤的數(shù)據(jù)錯(cuò)誤中吸取教訓(xùn)
在歷史上有無數(shù)個(gè)數(shù)據(jù)錯(cuò)誤的例子。更好的數(shù)據(jù)導(dǎo)致更好和更準(zhǔn)確的決策。而依賴不良數(shù)據(jù)會對企業(yè)和整個(gè)社會產(chǎn)生負(fù)面影響。你能想到一些不良數(shù)據(jù)影響了業(yè)務(wù)或個(gè)人生活的例子嗎?