大數(shù)據(jù)現(xiàn)在可能是無(wú)處不在,但大數(shù)據(jù)比以往任何時(shí)候都更重要。
最近,我與一加領(lǐng)先的商業(yè)刊物編輯吃午飯時(shí),他問(wèn)我,“你沒(méi)有看到大家都在反對(duì)大數(shù)據(jù)嗎?大家都聽(tīng)倦了這個(gè)詞。”
這似乎是一個(gè)公平的問(wèn)題,考慮到過(guò)去三年內(nèi)大量關(guān)于大數(shù)據(jù)的各種文章以及媒體覆蓋率,但我的反應(yīng)仍然是“NO”。
在2013年的夏天,NewVantage對(duì)財(cái)富1000強(qiáng)的合作伙伴公司高層管理人員進(jìn)行了一項(xiàng)調(diào)查,其中包括美國(guó)運(yùn)通、CVS藥店連鎖,摩根大通,強(qiáng)生,Kaiser Permanente,大都會(huì)人壽,旅游者和富國(guó)銀行(Wells Fargo)等。
我們的調(diào)查發(fā)現(xiàn),91%的高管表示:他們目前有一個(gè)大數(shù)據(jù)計(jì)劃計(jì)劃或正在進(jìn)行大數(shù)據(jù)部署,其中60%報(bào)告顯示已經(jīng)在實(shí)施大數(shù)據(jù)計(jì)劃。
無(wú)可厚非,大數(shù)據(jù)正在成為科技主流的一部分,那讓我們考慮一下造成這一現(xiàn)象的主要三個(gè)原因。
1、大數(shù)據(jù)是關(guān)乎所有行業(yè)的數(shù)據(jù),而不僅僅是社交媒體、非結(jié)構(gòu)化或大規(guī)模數(shù)據(jù)。
我有時(shí)告訴企業(yè)高管,他們沒(méi)有大數(shù)據(jù)需要,因?yàn)樗麄兊淖⒁饬Σ辉谏缃幻襟w數(shù)據(jù)、 非結(jié)構(gòu)化數(shù)據(jù)或大規(guī)模數(shù)據(jù)集。其實(shí)這是一個(gè)關(guān)于大數(shù)據(jù)常見(jiàn)的誤解。盡管大家討論大數(shù)據(jù)多集中在從新的數(shù)據(jù)來(lái)源(包括社會(huì)媒體、傳感器和視覺(jué)數(shù)據(jù))所帶來(lái)的利益和機(jī)會(huì),但是大部分的主流企業(yè)仍專(zhuān)注歷史數(shù)據(jù),如COBOL和大型機(jī)數(shù)據(jù)源。
累積歷史數(shù)據(jù)是大數(shù)據(jù)時(shí)代之前的大多數(shù)公司在做的事情之一。當(dāng)各種數(shù)據(jù)公司被問(wèn)到如何整合并使用大數(shù)據(jù)時(shí),大多數(shù)受訪者表示目標(biāo)大數(shù)據(jù)積累重點(diǎn)是仍然是客戶(hù)交易記錄和財(cái)務(wù)數(shù)據(jù)。對(duì)于公司來(lái)說(shuō),有效的數(shù)據(jù)是端與端的連接、交易、 客戶(hù)交互等數(shù)據(jù),因?yàn)檫@些數(shù)據(jù)最終能力洞察客戶(hù)說(shuō)什么和他們做什么之間的關(guān)系。
同樣,大數(shù)據(jù)不僅僅是關(guān)于大海量數(shù)據(jù)。通常認(rèn)為,大數(shù)據(jù)完全就是捕捉非常大量的數(shù)據(jù)。但是大數(shù)據(jù)也在集成多個(gè)數(shù)據(jù)源(品種)數(shù)據(jù)的同時(shí),也有著大量的垃圾數(shù)據(jù)或者說(shuō)是無(wú)效的數(shù)據(jù)。正如巴布森學(xué)院的湯姆 達(dá)文波特在2012年博客的一篇文章說(shuō)的那樣,“即使很小的數(shù)據(jù)可以提高你的組織的判斷。”
大數(shù)據(jù)是關(guān)于所有行業(yè)細(xì)分領(lǐng)域的海量數(shù)據(jù)簡(jiǎn)稱(chēng),包括大數(shù)據(jù)和小數(shù)據(jù)、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)、新的和歷史數(shù)據(jù)等等。在我們的調(diào)查中,多數(shù)受訪者表示,整合和分析現(xiàn)有數(shù)據(jù)源中的數(shù)據(jù)是他們最大的優(yōu)先事項(xiàng)。簡(jiǎn)而言之,任何組織,擁有任何規(guī)模、形態(tài)和種類(lèi)的大數(shù)據(jù)都在未來(lái)?yè)碇幸粋€(gè)潛在的大數(shù)據(jù)的機(jī)會(huì)。
2、大數(shù)據(jù)將改變所有數(shù)據(jù)應(yīng)用程序的時(shí)間和成本
對(duì)于很多主流的企業(yè)而言,大數(shù)據(jù)已不再是實(shí)驗(yàn)。一些背景和歷史可能有助于解釋為什么。
大數(shù)據(jù)是一種新的數(shù)據(jù)分析和挖掘技術(shù),比如說(shuō)Hadoop,Google、Facebook和雅虎都在使用Hadoop框架處理社交媒體大量的數(shù)據(jù)信息。
速度被通過(guò)縮短周期從數(shù)據(jù)訪問(wèn)對(duì)分析結(jié)果的能力。通過(guò)大數(shù)據(jù)進(jìn)行高效管理和降低成本的兩個(gè)方法:
A、減少前期的數(shù)據(jù)準(zhǔn)備工作和昂貴數(shù)據(jù)工程。這通常占80%的時(shí)間和成本;簡(jiǎn)而言之就是不用計(jì)劃到每一步,先行動(dòng)起來(lái)再說(shuō)。
B、使用低成本的Hadoop大數(shù)據(jù)平臺(tái),可以用Hadoop的開(kāi)源版本來(lái)構(gòu)建。成本通常是傳統(tǒng)數(shù)據(jù)庫(kù)平臺(tái)的費(fèi)用的一小部分。
大數(shù)據(jù)正在成為主流大型企業(yè)不可或缺的一部分,因?yàn)樗麄兠靼祝褂么髷?shù)據(jù)分析,不僅可以獲得市場(chǎng)洞察力,還更可以更精確的為高層管理人員提供決策參考。對(duì)于這些公司來(lái)說(shuō),大數(shù)據(jù)意味著更快的上市時(shí)間和快速響應(yīng)客戶(hù)需求所帶來(lái)的利益,加速了企業(yè)的成長(zhǎng)速度、價(jià)值的敏捷性。
3.大數(shù)據(jù)是一個(gè)術(shù)語(yǔ),它捕捉到了時(shí)代精神。
愛(ài)它還是恨它?其實(shí)大數(shù)據(jù)只是一個(gè)術(shù)語(yǔ)。讓我們忘了語(yǔ)義,關(guān)注效益。盡管大數(shù)據(jù)有著揮之不去的誤解,但大數(shù)據(jù)將轉(zhuǎn)變?nèi)藗兊乃季S,由原來(lái)的利益驅(qū)動(dòng)業(yè)務(wù)模式,轉(zhuǎn)變?yōu)閺臉I(yè)務(wù)數(shù)據(jù)驅(qū)動(dòng)價(jià)值的產(chǎn)生。