2月3日消息,白宮去年曾發表書面聲明稱,“大數據將作為歷史性的驅動因素,幫助美國持久性地促進社會與經濟活力”,其創造的社會價值與經濟價值得以遵從該國提倡的“隱私、公正、平等、自主”。然而事實真的如此嗎?大數據時代的危害性與局限性又是否會趕超其效益性?
某知名評論人表示,白宮這一努力平衡大數據成本與收益的舉措,實則阻礙了其長遠發展的大局觀。此外,雅虎首席執行官瑪麗薩·梅斯(Marissa Mayer)表示,數據驅動技術僅僅是政府、工業企業、民間社會做出重大決定的因素之一,而誤用或濫用數據甚至比無數據所造成的結果更糟糕。
梅斯還指出,其公司內部許多人總是不斷收集并解釋某些數據,這不僅會導致另外一些重要因素的缺失,還會使被測算的系統發生不好的轉變。
不當負擔
大數據到底是否利大于弊并不是我們現階段所關心的問題,而能否識別其益處的非顯性局限才是技術人員最應該關注的。
大數據支持者的核心主張是,但凡數據,必定有正面價值。然而這個想法是錯誤的,對公司管理層而言,看起來似乎無傷大雅的信息搜尋,卻往往對數據收集的主體帶來了不當負擔。
比如,全球大學排名與聯邦量刑指南是兩大復雜社會系統演變而成的量化值,該方面的相關人員均表示,這樣的全方位大數據歸集整理無疑損害了他們原本系統的秩序。
而第一個提出“大數據時代”這一概念的麥肯錫公司(McKinsey)也曾坦言,“事實上,截至目前,并沒有有效的證據表明數據的強度與特定部門生產力之間存在一定積極的聯系。”在隨后的幾年內,盡管信息量化的浪潮已開足馬力,但相關證據依然少之又少。
易被操控
數據往往比人們想象的更易被操控。據Target前經理表示,公司管理部門曾嘗試通過收集分析顧客問卷打分表以期提升顧客滿意度,然而此舉卻造成員工偽造客戶信息以夸大自己的工作表現。不受監管的可編制數據一旦被偽造,那么用它分析出的結果便不具任何意義。
而先前擁有自主執行權的負責數據編制的員工,此時卻倍感壓力重重,因為他們不得不接受不間斷的中央監控。
不可量化
許多重要的問題是根本不適合也無法定量分析的,它們需要對價值、驅動力、所處環境及其他種種核心因素的評判。而找到一個絕對中立不偏不倚并受眾人尊重信任的人,制定量化指標來對所有因素進行評定打分,是決計無法實現的。這便是一切社會機制中固有的難題。
衡量知識?
新基礎科學知識對經濟結構的影響過于分散和復雜,經濟學家很難進行量化衡量。
當然,社會和經濟制度的定量分析在最近幾年存在系統性的缺陷,但這并不意味著未來的深入研究會遭遇同樣的短板。然而,若是沿襲相同的基礎方法論,那么即便收集再多的數據,這些缺陷也將持續存在。