引言:時至今日,大數(shù)據(jù)時代的發(fā)展,已經(jīng)進入了快車道,目前,一部分人認為大數(shù)據(jù)的價值在于幫助企業(yè)各部門獲得新的洞察力并付諸行動;另一部分人認為大數(shù)據(jù)不過是天花亂墜的宣傳而已。那大數(shù)據(jù)到底是機遇還是空談,劃分著兩種觀點之間神秘的界限到底是什么?
目前,人們對大數(shù)據(jù)及其價值的認知各有不同。一部分人認為大數(shù)據(jù)的價值在于幫助企業(yè)各部門獲得新的洞察力并付諸行動;另一部分人認為大數(shù)據(jù)不過是天花亂墜的宣傳而已。這兩種觀點都有可取之處,而有趣的是,這兩種觀點都成立。盡管外界對大數(shù)據(jù)大肆宣傳,人們還是很快了解到大數(shù)據(jù)真正價值與空談之間的區(qū)別。
弄清這種區(qū)別將非常有助于了解大數(shù)據(jù)價值(最好考慮投資大數(shù)據(jù))并認清仍對大多數(shù)企業(yè)發(fā)展構(gòu)成主要阻礙的挑戰(zhàn)。姑且假設(shè)未來相關(guān)技術(shù)將逐漸成熟,并能通過釋放其潛力創(chuàng)造價值。這種預(yù)測已在以往多種技術(shù)上都得到證實,大數(shù)據(jù)技術(shù)應(yīng)該也不例外。制約大數(shù)據(jù)技術(shù)發(fā)展的主要瓶頸在于它自身的問題:人們會忽略大數(shù)據(jù)的嚴重依賴性,或認為這種依賴性僅僅是我們?yōu)閯?chuàng)造價值而必須接受的前提。
這種依賴性是指用戶認為在創(chuàng)造價值前,必須保持數(shù)據(jù)一致性,或在數(shù)據(jù)庫等持久保存數(shù)據(jù)的系統(tǒng)內(nèi)實現(xiàn)數(shù)據(jù)標準化,這需要企業(yè)大張旗鼓,投入數(shù)十億美元,卻導致效率低下和重復(fù)勞動。因此,在沒有創(chuàng)造任何價值前,企業(yè)的項目投入已達到70%,用于數(shù)據(jù)識別、采集、遷移、存儲及優(yōu)化。雖然過去十年間分析技術(shù)已取得多次重大突破,而分析技術(shù)終端及平臺數(shù)量激增,但與過去30年相比,企業(yè)分析解決方案開發(fā)及部署模式仍未發(fā)生變化。
令人關(guān)注的是,在利用大數(shù)據(jù)技術(shù)真正創(chuàng)造價值的行業(yè)內(nèi),大數(shù)據(jù)市場正呈現(xiàn)出不斷細分的趨勢,且這一趨勢已逐漸明朗。我們最好從這些細分市場入手,深入了解大數(shù)據(jù)價值與空談之間的區(qū)別。
能夠體現(xiàn)大數(shù)據(jù)價值的領(lǐng)域
大數(shù)據(jù)技術(shù)在數(shù)據(jù)探索、趨勢分析、調(diào)整機會分析等領(lǐng)域已獲得成功應(yīng)用。這看上去毋庸置疑,而以下兩個共同點卻不明顯,但大數(shù)據(jù)技術(shù)在符合這些共同點的領(lǐng)域內(nèi)已具有切實的可行性,并已站穩(wěn)腳跟。
·全新的海量交互信息:基于Web的購物與數(shù)字化零售、移動端活動、社交媒體互動信息及互聯(lián)網(wǎng)搜索條件。換言之就是全新的海量同類數(shù)據(jù)。
·重視營銷機會:為產(chǎn)品銷售提升潛在客戶識別成功率,這種技術(shù)應(yīng)用通常由大眾化營銷與媒體費用承擔。
無法體現(xiàn)大數(shù)據(jù)價值的領(lǐng)域
隨著數(shù)據(jù)同類性降低,導致獲得洞察力的成本相應(yīng)增長,大數(shù)據(jù)的價值開始降低,而對于大數(shù)據(jù)綜合價值因素的炒作也導入歧途。在談到典型的企業(yè)問題時,大數(shù)據(jù)鮮有成功案例。原因何在?
·業(yè)務(wù)問題已是老生常談。這已經(jīng)無需再議,可能在過去5-10年內(nèi)使用“新型”數(shù)據(jù)是大數(shù)據(jù)技術(shù)順利部署的成功因素之一。
·解決方案使用不同類型的組件。企業(yè)數(shù)據(jù)面臨的挑戰(zhàn)是它廣泛分布在各種不同的技術(shù)和數(shù)據(jù)平臺上。例如,數(shù)字化零售、電信業(yè)及社交媒體使用結(jié)構(gòu)化數(shù)據(jù),其表現(xiàn)形式相似;而企業(yè)數(shù)據(jù)則分布在主機、ETL(提取、轉(zhuǎn)換和加載)工具、虛擬層、關(guān)系數(shù)據(jù)庫、商業(yè)智能(BI)數(shù)據(jù)庫、交易數(shù)據(jù)庫以及數(shù)百種其它組件中,這些技術(shù)在過去30年中已不斷發(fā)展。更糟糕的是,每種應(yīng)用程序使用不同的數(shù)據(jù)模型,導致數(shù)據(jù)與其相關(guān)技術(shù)平臺整合越來越復(fù)雜,因此,利用當前大數(shù)據(jù)工具訪問企業(yè)數(shù)據(jù),難以創(chuàng)造直接的價值。
這就是企業(yè)大部分業(yè)務(wù)問題與大數(shù)據(jù)無關(guān)的原因。這些業(yè)務(wù)問題實際上是分布式數(shù)據(jù)問題:在這種模型下,信息、數(shù)據(jù)、價值和分析廣泛分布在不同的位置、技術(shù)平臺和數(shù)據(jù)源內(nèi)。但我們?nèi)岳^續(xù)使用與以往相同的集中式模型來解決這一日趨嚴重的分布式問題。當用戶能夠通過常見的界面外觀穩(wěn)定地訪問數(shù)據(jù)時,這些集中式模型能夠發(fā)揮很大的作用,這在社交媒體、數(shù)字化零售等行業(yè)新的成功案例中屢見不鮮。但集中式模型卻無法解決銀行、保險、醫(yī)療行業(yè)及其它廣泛的業(yè)務(wù)問題。
目前,企業(yè)實現(xiàn)大數(shù)據(jù)價值需對多種不同數(shù)據(jù)及功能體系進行數(shù)據(jù)整合及標準化規(guī)劃。如不改變現(xiàn)有數(shù)據(jù)管理機制,那么企業(yè)解決方案采用越多的分布式組件,項目回報率越低。
大數(shù)據(jù)技術(shù)促進深度分析及分析性能取得技術(shù)突破,其價值毋庸置疑。但這種價值卻被數(shù)據(jù)提取和/或整合成本破壞,導致價值/炒作的底線被輕易沖破。目前,市場在數(shù)據(jù)價值上多少存在一些分歧,其中一部分行業(yè)尚處于初創(chuàng)時期,可保持技術(shù)一致性,因此,這些行業(yè)可以暫時解決分布式數(shù)據(jù)的問題。
由于技術(shù)孤島仍將持續(xù)存在,且數(shù)據(jù)仍保存在不同的位置,預(yù)計到2017年,90%的大數(shù)據(jù)項目仍無法發(fā)揮它們的作用。Doug最近總結(jié)到,雖然數(shù)據(jù)復(fù)雜性、企業(yè)內(nèi)外部數(shù)據(jù)的分布和離散度不斷提升,但也不會因為大數(shù)據(jù)技術(shù)作出的各種承諾而承認系統(tǒng)及數(shù)據(jù)大規(guī)模整合項目的合理性,它們只是大數(shù)據(jù)價值的體現(xiàn)。
我們只有意識到大數(shù)據(jù)技術(shù)雖已占有一席之地,但仍受到分布式數(shù)據(jù)源的直接影響,才能盡早通過真正具有成本效益的途徑,根據(jù)數(shù)據(jù)復(fù)雜度和分布情況,充分利用數(shù)據(jù)價值。
D1Net評論:
對于企業(yè)而已,大多數(shù)企業(yè)可靈活使用雙重數(shù)據(jù)策略:運用大數(shù)據(jù)技術(shù)對大量同類數(shù)據(jù)進行深入分析及機會辨別;或運用分布式數(shù)據(jù)應(yīng)對運營、風險、管理等復(fù)雜但已為人所了解的挑戰(zhàn)。人們將能夠接受這種雙重數(shù)據(jù)管理策略,充分發(fā)現(xiàn)、挖掘并管理大數(shù)據(jù)技術(shù)的價值,并在行業(yè)內(nèi)實現(xiàn)不斷靈活創(chuàng)新,認識到這些,就可以明確劃分機遇和挑戰(zhàn)之間的界限了。