IDC的大數(shù)據(jù)市場(chǎng)預(yù)測(cè),大數(shù)據(jù)將會(huì)迎來(lái)大時(shí)代。分析公司表示截止到2015年大數(shù)據(jù)產(chǎn)值將達(dá)169億美元。不過(guò)我們尚不明確,這個(gè)市場(chǎng)有多新,或者除了大數(shù)據(jù)新興企業(yè)是否真正會(huì)刮起一個(gè)淘金熱。
這是開(kāi)源的炒作嗎?按大數(shù)據(jù)的風(fēng)格重演?
可能是的。開(kāi)源在科技新聞界風(fēng)行了好幾年,因?yàn)樗兄Z能夠降低成本同時(shí)獲得企業(yè)級(jí)的IT自由度。最終,只有幾個(gè)新興企業(yè)投資(MySQL, JBoss),但是對(duì)于大部分的企業(yè)而言,真正的價(jià)值來(lái)自IT供應(yīng)商和內(nèi)部的IT組織,利用開(kāi)源為他們的軟件項(xiàng)目提供原材料。開(kāi)源越來(lái)越不關(guān)于銷售,而是代碼,這也正是設(shè)計(jì)它的目的所在。
如今,很多的風(fēng)險(xiǎn)投資家將大量的錢投入大數(shù)據(jù)新興企業(yè)希望能夠致富,一些人也確實(shí)做到了。但是請(qǐng)弄清楚:數(shù)據(jù)分析長(zhǎng)久以來(lái)都是技術(shù)產(chǎn)業(yè)的一部分。
現(xiàn)在我們可能把它叫作“大數(shù)據(jù)”,但是它至少是未來(lái)20年來(lái)一個(gè)遠(yuǎn)瞻性的產(chǎn)業(yè),一位博主這樣寫道。
把它叫作數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘、又或者商業(yè)分析。隨便你喜歡叫什么都可以。它并不新,甚至不一定是游戲規(guī)則的改變者,但是很多行業(yè)長(zhǎng)期都需要優(yōu)化數(shù)據(jù)收集和分析,所以技術(shù)提高就變得很有意義了。
然而,這里有兩方面是新的大數(shù)據(jù)(也可以是開(kāi)源)所要注意的:成本和規(guī)模。
這兩個(gè)因素,可能比別的都重要,Hadoop的驚人增長(zhǎng)甚至讓 “數(shù)據(jù)挖掘”失去了昔日的地位。Hadoop使得收集和分析數(shù)據(jù)變得低成本、便于擴(kuò)展,形成商業(yè)化的硬件。在過(guò)去,運(yùn)行信貸業(yè)務(wù)的金融服務(wù)公司,不得不給IBM支付巨額支票用于專業(yè)的硬件和軟件。
不會(huì)再這樣了。Hadoop有大量大眾化的數(shù)據(jù),將其轉(zhuǎn)化為有競(jìng)爭(zhēng)力的市場(chǎng)。
Hadoop不是憑空出現(xiàn)的。各種其它的事情,例如包括提升基礎(chǔ)設(shè)施、移動(dòng)設(shè)備和社會(huì)數(shù)據(jù),都將使與Hadoop高度相關(guān)的人群受益。重要的是,在開(kāi)源以前,Hadoop和大數(shù)據(jù)移動(dòng)的真正價(jià)值被企業(yè)內(nèi)部所有,而沒(méi)有支付給不同的供應(yīng)商。是的,這對(duì)于Hadoop新興企業(yè)會(huì)有很好的出路,但是更大的贏者是內(nèi)部的Hadoop專業(yè)知識(shí)獲得發(fā)展。
總之,大數(shù)據(jù)就是大。但是它并不新,創(chuàng)新的地方是通過(guò)處理大量數(shù)據(jù)而降低數(shù)據(jù)倉(cāng)庫(kù)的花費(fèi)。與開(kāi)源相似,大部分大數(shù)據(jù)的價(jià)值被內(nèi)部團(tuán)隊(duì)所用,讓他們知道如何將專業(yè)知識(shí)應(yīng)用于他們所收集的數(shù)據(jù)。好消息是,一些企業(yè)將會(huì)從大數(shù)據(jù)的“淘金熱”中致富。
更好的消息是,大部分富起來(lái)的企業(yè)還將繼續(xù)使用Hadoop和大數(shù)據(jù)技術(shù)。