“大數(shù)據(jù)”這個提法通常指的是數(shù)量、速度和種類都會急劇倍增的數(shù)據(jù)。根據(jù)Enterprise Strategy機構(gòu)最新研究,大數(shù)據(jù)分析平臺正在模仿這種定義:供應(yīng)商產(chǎn)品發(fā)布數(shù)量在增長,產(chǎn)品增強功能迅速翻倍,現(xiàn)在有多種部署選擇支持。
Julie Lockner是ESG的一位高級分析師,也是《穩(wěn)固的大數(shù)據(jù)分析平臺》一書的作者,她說企業(yè)在考慮他們?nèi)绾伟?strong>大數(shù)據(jù)技術(shù)整合到他們的架構(gòu)中——尤其是當(dāng)它變得價格可負擔(dān),并且可擴展時。
部分苦惱源自于大數(shù)據(jù)技術(shù)和術(shù)語的流動性,這帶來了市場混亂的糾結(jié)。Lockner把她的研究命名為“市場前景報告101”,她相信這種糾結(jié)可以通過內(nèi)部評估和培訓(xùn)來撫平。
這么做意味著從頭開始,也就是從定義開始。
大數(shù)據(jù)有很多選擇
根據(jù)ESG的報告:“大數(shù)據(jù)分析項目如雨后春筍般冒了出來,有的甚至還沒有理解清楚大數(shù)據(jù)真正的含義就開始做了。”
根據(jù)個人對這一定義理解的差異,這一術(shù)語的含義有可能擴大或者縮小。事實上,它的定義已經(jīng)變得很寬泛了,ESG給出了他們自己的解釋:“超出正常處理能力邊界和大小的數(shù)據(jù)集,迫使你采取非傳統(tǒng)的方法。”
Lockner表示,問題是數(shù)據(jù)量將會發(fā)展到TB級,當(dāng)前系統(tǒng)上會開始出現(xiàn)“應(yīng)力性骨折”,常規(guī)用途的技術(shù)在大數(shù)據(jù)以及大數(shù)據(jù)分析面前將不能保證成本高效的方法。那才是企業(yè)應(yīng)該考慮擴展他們數(shù)據(jù)中心的時候。此前,許多大型跨國公司都在做這樣的項目,但現(xiàn)在有更多可以支付得起的選擇。不管是預(yù)算,還是技能集。”
目前,企業(yè)都使用了大量大數(shù)據(jù)部署方案,有定制開發(fā)的方法,大規(guī)模并行處理數(shù)據(jù)庫,云計算服務(wù)或者一些可用工具的組合。開源Apache Hadoop項目的加入更激起了持續(xù)增長的興趣,該開源項目支持大數(shù)據(jù)集分布式處理。
Lockner評價說:“我不記得自HTML誕生之后還有另外哪一種技術(shù)可以產(chǎn)生這么大的影響了。”
像IBM和EMC這樣的供應(yīng)商都想搞清楚如何把Hadoop整合到他們產(chǎn)品服務(wù)中。例如,在1月9日甲骨文推出了大數(shù)據(jù)機,它包含了與Hadoop經(jīng)銷商Cloudera的合作伙伴關(guān)系。現(xiàn)在的情況是,如果哪家廠商談大數(shù)據(jù)時沒有提到Hadoop,你就都不好意思發(fā)布新的產(chǎn)品。
盡管Lockner看到了Hadoop的許多許諾,并且相信今后它將在大部分企業(yè)數(shù)據(jù)中心中存在,但她的研究表明它仍然是一種新興技術(shù),應(yīng)該被用于特定的場景。
大數(shù)據(jù)開始了
企業(yè)要探索在大數(shù)據(jù)分析平臺上進行投資,需要審查供應(yīng)商對大數(shù)據(jù)的定義,并了解他們的產(chǎn)品與大數(shù)據(jù)的相關(guān)性,這是一個很好的開始點。Lockner說:“當(dāng)你與供應(yīng)商交流時,要弄清楚他們產(chǎn)品定位以及能解決的問題是什么?”
例如,EMC公司有多款大數(shù)據(jù)產(chǎn)品,比如Greenplum數(shù)據(jù)庫軟件,Greenplum數(shù)據(jù)計算設(shè)備和Isilon。這三款產(chǎn)品處理的都是不同類型問題。Lockner說:“你必須真正把洋蔥層層剝開,并做一些功課。”
首先,Lockner推薦客戶依靠他們有良好關(guān)系的供應(yīng)商,要求查看他們大數(shù)據(jù)分析平臺的演示。這些都是免費信息。因為這個企業(yè)中的人們會盡力理解他們想做的事,他們應(yīng)該可以對供應(yīng)商施加壓力。
她推薦客戶也要學(xué)習(xí)針對他們業(yè)界其它廠商的案例使用情況。這種信息可以幫助看清楚哪些供應(yīng)商是真正的意見領(lǐng)袖,哪些不是。
企業(yè)應(yīng)該依靠他們內(nèi)部的IT部門和他們更有技術(shù)悟性的員工,來幫助做一些功課。Lockner說:“通常情況下,一些實驗室項目之類的會研究新技術(shù),而且如果企業(yè)可以找到那些專家組并與他們集思廣益討論如何做的話,那是一個相當(dāng)不錯的開始。”
但是要真正剝離這些層次,企業(yè)應(yīng)該判斷什么是真正的需求,供應(yīng)商的產(chǎn)品如何能滿足這些需求。據(jù)該報告認為,這意味著要估量清楚內(nèi)部可用技能,數(shù)據(jù)將從哪里來,分析行為需要多快完成,哪些內(nèi)容需要與新平臺整合。Lockner表示:“理解業(yè)務(wù)需求比擁有出色的技術(shù)更重要。”