此前,援引外媒消息稱,Gartner預測,2017年將有60%的大數據項目在試驗階段就會失敗,并最終會被放棄。
在大數據正熱的當下,這一結論無疑給眾多的熱心者潑了一道冷水。
隨著企業努力在數字時代實現數據驅動,我們的生態系統正在發生重大變化。不光是企業應用程序生成的海量數據日增,在企業外部廣泛的用戶和難以數計連接的各種“事物”所產生的數據也呈指數級遞增。這都導致企業圍繞數據的洞察會變得越來越復雜。
我們不僅要問,企業在將數據資產鏈接到戰略價值的這一過程中究竟出現了什么問題?
有專業人士認為,二者之間的主要障礙是缺乏技能或專業知識,以及技術戰略與整體公司需求之間不匹配。
專業差距
我們都知道,大數據并非新近事物。早些年,當大數據處于起步階段時,當時可用技術并不成熟。一些早期發展起來的知名網絡公司,如谷歌、Facebook等不得不從根本上建立基礎設施來處理相關問題。他們的成功也因此引來了更多的追隨者,許多企業試圖用自己基于Hadoop的大數據項目來效仿前者。
效仿的結果是,后者的IT和數據專業人員對Hadoop作為一個技術工具包能夠做什么,以及對產生結果需要多少時間的預期出現偏差。Gartner的一項調查結果顯示,在受訪者中近半數公司缺乏部署這種技術的技能。
研究人員認為,當前大數據已經過于依賴技術。許多大數據項目之所以失敗,是因為它們需要大量的前期資源,企業要為之部署剛性架構,而一旦項目進行中,其靈活性很難提高。
成功的大數據項目應該是從企業想要解決的業務問題和希望獲得的價值的深刻理解開始。否則,無論企業想實現什么目標,項目都將無法達到預期或提供足夠的投資回報,最終結果就會被放棄。
第二點是需要建立一支專業團隊,將IT、數據科學和業務線的視角緊密結合在一起。研究人員給出的建議是,業務專家可以通過數據計劃確定需要解決的主要業務挑戰。IT專家可以提供訪問數據和精確定位,以及執行項目所需的基礎設施技能。最后,數據專家可以提供分析和提取洞察所需的數學和定量技能。圍繞這些技能建立的團隊對項目能否成功至關重要。
第三點是短時間值。團隊越早組建,并產生具體和可衡量的價值,企業組織和高級管理層就越容易在這個項目持續投資。
而研究表明,大多數基于Hadoop的項目在這三個方面都是失敗的。更多的項目太過專注于技術本身的工作。此外,難以找到足夠的技能,并且需要太多的時間和精力來建立基礎設施。最后,初始投資太高,交付投入時間太長,使得很難快速試驗和迭代成功。
一個更好的方法
那么,是不是失敗的局面就很難扭轉呢?觀察者留意到這樣一個趨勢,在大數據項目中,企業嘗試通過采用基于云的數據倉庫和數據湖解決方案作為Hadoop項目的替代品。從云中獲得價值,而不是在基礎設施建設上過多投資,會使大數據項目變得將更容易和更快。
正確的云解決方案可以避免過多的前期資本支出,而且也可以獲得相對輕松和有效的擴展,并以高度管理的解決方案的形式將技術負擔轉移給技術供應商。
因此,如果企業自身沒有足夠的經驗和技能,建設考慮云方案,避開成本高昂的基礎設施。