《企業(yè)網(wǎng)D1Net》9月24日訊
隨著大數(shù)據(jù)的發(fā)展,Hadoop也越來(lái)越受到人們的廣泛關(guān)注,作為開(kāi)源傳奇的Hadoop經(jīng)常伴隨著一些流言——這些流言可能會(huì)導(dǎo)致IT高管們帶著樂(lè)觀的心態(tài)去制定策略。
大數(shù)據(jù)關(guān)系到企業(yè)的決策
數(shù)據(jù)體積和數(shù)據(jù)使用在以驚人的速度增長(zhǎng)著,這一點(diǎn)從分析師的分析中不難獲得——IDC今年在數(shù)據(jù)存儲(chǔ)上的增長(zhǎng)速度將達(dá)到53.4%,AT&T聲稱(chēng)無(wú)線(xiàn)數(shù)據(jù)的流量在過(guò)去的5年內(nèi)增長(zhǎng)200倍,如果你著眼自己通信渠道的話(huà),將毫無(wú)疑問(wèn)的發(fā)現(xiàn)互聯(lián)網(wǎng)內(nèi)容、電子郵件、應(yīng)用通知、社交消息以及每天自動(dòng)接收的消息都在顯著的增長(zhǎng)。這也是為什么從McKinsey到Facebook再到Walmart都重點(diǎn)聚焦于大數(shù)據(jù)。
就像我們看到的90年代與2000年代的互聯(lián)網(wǎng)泡沫,大數(shù)據(jù)同樣會(huì)導(dǎo)致一些公司做出糟糕的設(shè)想和決策。
Hadoop毫無(wú)疑問(wèn)是公司為了解決大數(shù)據(jù)需求的主要投資領(lǐng)域之一,而類(lèi)似Facebook這些在大體積數(shù)據(jù)處理上有所建樹(shù)的公司都公開(kāi)的吹捧過(guò)在Hadoop上取得的成功,同樣初入大數(shù)據(jù)領(lǐng)域的公司也必先著眼這些成功的典型。Adam Bloom的一個(gè)MIT(麻省理工學(xué)院)計(jì)算機(jī)科學(xué)校友曾對(duì)他說(shuō):“when all you have is a hammer, everything looks like a nail。”通過(guò)Hadoop的炒作,我們可以避免功能固著(functional fixedness)這種認(rèn)知偏差。
Hadoop是一個(gè)多維的解決方案,可以通過(guò)不同的方式進(jìn)行部署和使用。下面就看一下公司在開(kāi)始Hadoop項(xiàng)目之前必須了解的一些關(guān)于Hadoop和大數(shù)據(jù)的預(yù)先構(gòu)想的錯(cuò)誤理念:
大數(shù)據(jù)只關(guān)系到體積?
在體積之外,許多工業(yè)先鋒還經(jīng)常提到variety(多樣)、variability(可變)、velocity(速度)和value(價(jià)值)。撇開(kāi)所有單詞都押頭韻,關(guān)鍵點(diǎn)在于大數(shù)據(jù)并不是體積上的增長(zhǎng)——它正在向著實(shí)時(shí)分析、結(jié)構(gòu)化和非結(jié)構(gòu)化來(lái)源方向發(fā)展,并被用于嘗試和制定更好的決策。
綜上所述,不是只有分析大體積數(shù)據(jù)才會(huì)獲得價(jià)值。舉個(gè)例子,超時(shí)限的存儲(chǔ)和分析1PB的數(shù)據(jù)的價(jià)值可能比不上實(shí)時(shí)分析1GB的數(shù)據(jù)。從工具集上考慮,你可能需要一個(gè)內(nèi)存數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)的分析,從新鮮的數(shù)據(jù)上獲得價(jià)值,而不是去解剖過(guò)時(shí)的數(shù)據(jù)獲得價(jià)值
D1Net評(píng)論:
自大數(shù)據(jù)概念誕生以來(lái),關(guān)于炒作的質(zhì)疑從來(lái)沒(méi)有停止過(guò),宣傳亦或是炒作只能作為接受新事物的參考,企業(yè)在做決策之前必須進(jìn)行深入的了解和分析。被流言所迷惑而做出錯(cuò)誤的決策,必然會(huì)讓投資陷入危險(xiǎn)的境地。