美國兩本著名學(xué)術(shù)雜志同時關(guān)注大數(shù)據(jù)話題:《外交》雜志5/6月刊將《大數(shù)據(jù)的興起》一文作為封面文章,認(rèn)為大數(shù)據(jù)將改變?nèi)祟愃伎己涂创澜绲姆绞?。而《外交政策》雜志則在網(wǎng)站上發(fā)表微軟研究院首席研究員……
雖然大數(shù)據(jù)概念提出至今的時間很短,但并不妨礙其的發(fā)展速度,從國內(nèi)到國外,大數(shù)據(jù)的話題是全球的焦點。對于大數(shù)據(jù)的應(yīng)用,它的特點就是爆炸式的數(shù)據(jù)增長,對此,沒有有效數(shù)據(jù)分析能力,從中挖掘充分信息的單位來說大數(shù)據(jù)是頭疼的問題。而那些,對于大數(shù)據(jù)看好的人們,對大數(shù)據(jù)的潛力則是嘖嘖稱贊,這樣不免就會引來一些抗議之聲。
這不,美國兩本著名學(xué)術(shù)雜志同時關(guān)注大數(shù)據(jù)話題:《外交》雜志5/6月刊將《大數(shù)據(jù)的興起》一文作為封面文章,認(rèn)為大數(shù)據(jù)將改變?nèi)祟愃伎己涂创澜绲姆绞健6锻饨徽摺冯s志則在網(wǎng)站上發(fā)表微軟研究院首席研究員、麻省理工學(xué)院公民媒體中心客座教授凱特·克勞福德的文章《對大數(shù)據(jù)的再思考》,從五個方面對大數(shù)據(jù)理論提出質(zhì)疑。
大數(shù)據(jù)被稱贊
《大數(shù)據(jù)的興起》一文作者是近期引發(fā)熱議的專著《大數(shù)據(jù)時代:生活、工作與思維的大變革》作者肯尼思·庫克耶和維克托·邁爾—舍恩伯格。在文章中,庫克耶和舍恩伯格肯定了大數(shù)據(jù)對社會的巨大變革能力,稱大數(shù)據(jù)不僅將改變?nèi)藗兊纳詈凸ぷ?,而且將改變?nèi)祟愓J(rèn)識和思考世界的方式。
兩人認(rèn)為,隨著技術(shù)環(huán)境的變化,一方面世界出現(xiàn)“數(shù)據(jù)爆炸”的現(xiàn)象,另一方面人類處理數(shù)據(jù)的能力也大為增強(qiáng)。由此,人們對待數(shù)據(jù)的方式出現(xiàn)了三個變化:第一,人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù);第二,由于是全樣本數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對精確性的追求;第三,人類通過對大數(shù)據(jù)的處理,放棄對因果關(guān)系的渴求,轉(zhuǎn)而關(guān)注相互聯(lián)系。這一切代表著人類告別總是試圖了解世界運轉(zhuǎn)方式背后深層原因的態(tài)度,而走向僅僅需要弄清現(xiàn)象之間的聯(lián)系以及利用這些信息來解決問題。
《大數(shù)據(jù)的興起》列舉了大數(shù)據(jù)在醫(yī)學(xué)、消費品領(lǐng)域的應(yīng)用實例。但作者同時認(rèn)為,大數(shù)據(jù)的影響力絕不僅限于商業(yè)范疇,它將深遠(yuǎn)地改變政府的運作方式和政治的性質(zhì)。他們在文章中寫道,“在推動經(jīng)濟(jì)增長、提供公共服務(wù)或進(jìn)行戰(zhàn)爭等方面,那些能夠有效利用大數(shù)據(jù)的人將擁有勝過別人的巨大優(yōu)勢”。不過,兩位作者承認(rèn),大數(shù)據(jù)應(yīng)用在公共服務(wù)領(lǐng)域比較成功的案例出現(xiàn)在城市這一級,因為在這個級別上獲取數(shù)據(jù)和利用信息進(jìn)行試驗要容易一些。
學(xué)者提出五質(zhì)疑
克勞福德的文章認(rèn)為,大數(shù)據(jù)是當(dāng)前的時髦術(shù)語,但人們是否能依靠海量數(shù)據(jù)揭示人類行為的規(guī)律仍值得懷疑。她針對大數(shù)據(jù)理論從五個方面提出質(zhì)疑。
第一,大數(shù)據(jù)中存在偏見和盲區(qū)。大數(shù)據(jù)的倡導(dǎo)者認(rèn)為,“有了足夠的數(shù)據(jù),數(shù)字就可以自己說話”。但克勞福德認(rèn)為,數(shù)字無法自己說話。不論其規(guī)模有多大,數(shù)據(jù)集歸根到底是人類設(shè)計的產(chǎn)物,而大數(shù)據(jù)的工具并不能使人們擺脫曲解、隔閡和錯誤的成見。當(dāng)大數(shù)據(jù)試圖反映人類所生活的社會化世界時,認(rèn)清這些因素就尤為重要。偏見和盲區(qū)存在于大數(shù)據(jù)中,從大數(shù)據(jù)得出的結(jié)論并不比人為的意見更客觀。
第二,大數(shù)據(jù)在一定程度上可以使城市變得更加智能和高效,但具體效果如何取決于市政官員對數(shù)據(jù)及其局限性的了解。克勞福德稱,大數(shù)據(jù)的倡導(dǎo)者認(rèn)為,“大數(shù)據(jù)將使我們的城市變得更加智能和高效”,在一定程度上確實如此。但另一方面,數(shù)據(jù)在生成或采集的過程中并不都是平等的,大數(shù)據(jù)集存在“信號問題”———即某些民眾和社區(qū)被忽略或未得到充分代表。因此,要想運用好大數(shù)據(jù),市政官員必須對數(shù)據(jù)及其局限性有充分了解。
第三,大數(shù)據(jù)可能導(dǎo)致基于群體的歧視。大數(shù)據(jù)的倡導(dǎo)者認(rèn)為,“大數(shù)據(jù)對不同的社會群體不會厚此薄彼”,其理由是,原始數(shù)據(jù)的分析是在大規(guī)模水平上進(jìn)行的,因而避免了基于群體的歧視。但克勞福德認(rèn)為,實際情況并非如此。由于大數(shù)據(jù)能夠作出有關(guān)群體不同行為方式的論斷,而且其使用的主要目的是把不同個體歸入不同的群體中,因此大數(shù)據(jù)不僅不會避免群體歧視,還可能加重這一趨勢。
第四,隱私泄露是大數(shù)據(jù)應(yīng)用中的重要問題??藙诟5抡J(rèn)為,大數(shù)據(jù)的倡導(dǎo)者關(guān)于“大數(shù)據(jù)是匿名的,因此它不會侵犯我們的隱私”一說大錯特錯。盡管許多大數(shù)據(jù)的提供者盡力消除數(shù)據(jù)中的個體身份,但身份重新被確認(rèn)的風(fēng)險仍然很大。鑒于利用大量公共數(shù)據(jù)集可以推斷很多信息,這使泄露個人隱私成為“日益嚴(yán)重的擔(dān)憂”。
第五,大數(shù)據(jù)為科學(xué)研究提供了新的途徑,但不可斷言“大數(shù)據(jù)是科學(xué)的未來”??藙诟5路Q,大數(shù)據(jù)的研究方法只能統(tǒng)計某件事情發(fā)生的頻率和相關(guān)性,但不能得出因果關(guān)系。將大數(shù)據(jù)策略和小數(shù)據(jù)研究相結(jié)合也許是更好的科學(xué)研究途徑。
小結(jié):庫克耶和舍恩伯格也認(rèn)識到了大數(shù)據(jù)理論的一些內(nèi)在瑕疵。在《大數(shù)據(jù)的興起》一文結(jié)尾,兩位作者表示,大數(shù)據(jù)是一種資源和工具,它的目的是告知,而不是解釋;它意在促進(jìn)理解,但可能導(dǎo)致誤解———關(guān)鍵在于人們對它的掌握程度。他們認(rèn)為,人們必須用一種不僅欣賞其力量、而且承認(rèn)其局限的態(tài)度來接納大數(shù)據(jù)。