《企業(yè)網(wǎng)D1Net》11月22日訊
隨著大數(shù)據(jù)應(yīng)用的深入,大數(shù)據(jù)的影響力,已經(jīng)深入到各個領(lǐng)域,而就在近兩年,大數(shù)據(jù)應(yīng)用突然爆炸,五彩繽紛的創(chuàng)意都變成現(xiàn)實。即使最謹(jǐn)慎的觀察家也承認(rèn),大數(shù)據(jù)的商業(yè)應(yīng)用時代已經(jīng)來臨,正因為它前所未有的能力——準(zhǔn)確預(yù)測。
《大數(shù)據(jù)時代》一書中強調(diào),大數(shù)據(jù)不關(guān)心“因果”,只在乎“相關(guān)”。這一點也被此書的擁躉們反復(fù)強調(diào)。因為大數(shù)據(jù)分析,人們理解世界,不再需要探討“內(nèi)在機理”。大數(shù)據(jù)不是教機器像人一樣思考,而是簡單的數(shù)學(xué)算法用在海量數(shù)據(jù)上,讓數(shù)據(jù)自己說話。
在最難確定因果關(guān)系的人體科學(xué)領(lǐng)域,大數(shù)據(jù)分析同樣屢有斬獲。中英人壽保險公司用幾百種生活方式的數(shù)據(jù),比如愛好、常瀏覽的網(wǎng)站、常看的節(jié)目以及收入等,找出更可能患高血壓、糖尿病和抑郁癥的人。
丹麥癌癥協(xié)會2011年發(fā)表文章,利用1985年以來的全部手機用戶數(shù)據(jù),與同期所有癌癥患者數(shù)據(jù)結(jié)合來看,發(fā)現(xiàn)癌癥跟使用手機并沒有關(guān)系。
還有美國研究者通過16個不同數(shù)據(jù),發(fā)現(xiàn)早產(chǎn)兒穩(wěn)定的生命體征不是病情好轉(zhuǎn)的標(biāo)志,而是暴風(fēng)雨前的寧靜。研究者并不知道具體原因,只知道數(shù)據(jù)顯示出是如此。
有了大數(shù)據(jù),分析不必知其所以然。著名的谷歌翻譯小組,竟然不需要語言學(xué)家。他們完全是讓計算機根據(jù)網(wǎng)上的數(shù)據(jù),去判斷一段英文可能對應(yīng)于哪一段中文。一開始這種翻譯質(zhì)量不會太好,隨著信息量的增加,機器會翻譯得越來越讓人滿意。
有了大數(shù)據(jù),分析也不需要太精確,因為批量處理允許瑕疵存在。英國石油公司在美國的一個煉油廠里,安裝了很多無線感應(yīng)器,因為高溫和電器干擾,不少感應(yīng)器讀數(shù)是錯的,但數(shù)據(jù)一多,這些錯誤就可以彌補。通過隨時監(jiān)測管道承壓,廠方發(fā)現(xiàn)某些原油更具腐蝕性,就可以發(fā)現(xiàn)和防止。
UPS快遞公司在所有卡車上安裝傳感器,如果發(fā)現(xiàn)數(shù)據(jù)異常,他們就提前更換零件,這樣節(jié)省了好幾百萬美元修理費用。他們并不在乎傳感器數(shù)據(jù)是否準(zhǔn)確。但這樣做的確有效。
D1Net評論:
俗話說:“量變引起質(zhì)變”,對于大數(shù)據(jù)來說,這個道理同樣適用,數(shù)據(jù)量極多時,數(shù)據(jù)分析就呈現(xiàn)出我們所不熟悉的屬性——因果關(guān)系淡出;單個數(shù)據(jù)準(zhǔn)確不再重要;而預(yù)測幾乎必然準(zhǔn)確。大數(shù)據(jù)如同巫師一樣的神力,既讓我們陌生,又讓我們激動。