作為大數據技術的典范,Hadoop一直為采用大數據的企業祝福并詛咒著。Hadoop功能強大,卻非常復雜,這使得很多企業都寧愿等待更容易的東西問世,再推出大數據項目。
等待已經結束。Hadoop在穩步前進,來自諸如Hortonworks和Cloudera等廠商顯著的易用性增強,使得Hadoop的學習曲線已經減少了一半。企業正越來越多擁抱大數據和Hadoop,目的是從基本的ETL工作負載遷移到先進的數據分析。
但更多人不知道的是,企業使用Hadoop處理大數據的訣竅,其實就是從小處著手。
小?這似乎是與Hadoop關系不大的一個詞。但它完全符合大數據的現實。我們往往談論Hadoop在PB級和ZB級數據的優勢,但大部分企業其實并不具備PB級規模的問題。至少,他們現在還不清楚怎么去管理這種級別的問題。
相反,大數據咨詢公司NewVantage Partners的一項調查顯示,企業首先關注的是掌握新類型的非結構化數據。Gartner證實了這一點,它指出:“許多組織發現大數據的多樣性比大體量或實時性的挑戰更大。”
因此,聰明的Hadoop廠商正在修正他們的策略,幫助企業從小規模部署著手,并從那里成長。Hortonworks企業戰略副總裁Shaun Connolly在接受記者采訪時表示:
“我們已經看到可重復的采用模式,從側重于一個新的數據類型開始,并建立或增強有針對性的應用程序,圍繞新的數據類型。這些新的應用程序通常由一個業務線驅動,并從以下新類型之一的數據開始:社交媒體,點擊流,服務器日志,傳感器和機器數據,地理定位數據和文件(文本,視頻,音頻等)。
“最終部署更多的應用和新的數據類型導致更廣泛的現代化數據架構。但成功的客戶開始從特定類型的數據釋放價值,然后沖洗,并從那里重復他們的旅程。”
對于證明Hadoop的價值,從小的、可衡量的項目啟動,這是一個偉大的方式,不強迫企業在前期就吞下整個大象。這是一個聰明的策略,讓強大的技術可以很容易地被采納。
這樣一來,Hadoop正在變成人們真正想要談論的“房間里的大象”。雖然更多的人都在談論大數據,但實際推出重要的大數據項目的組織要少得多,Gartner強調,只有8%的企業已實際部署大數據項目,盡管64%的企業宣稱他們打算這么做。這些公司看重的是Hadoop大數據項目帶來的實質性增長,可實現的商業價值,而不是Hadoop的炒作。
事實上,今天大多數大數據項目,往往以現有用例的增量改進為重點,例如,更好地了解客戶的需求,使流程更加高效,進一步降低成本,或更好地檢測風險。對于所有的關于大大改變一個企業的業務的談論,大部分的大數據以及由此延伸的大多數的Hadoop的部署,重點是逐步改進,而不是徹底改變的項目。
這是有道理的。企業首先小步驟地采用Hadoop實施可以實現的項目,然后掌握該技術,然后再做大。
在2014年,我們將看到Hadoop被加速采用。Hortonworks的Connolly和Cloudera的Mike Olson都看到了他們的業務在2013年獲得迅速的發展,且最后兩個季度的發展節奏更快。這樣的加速度反映了他們對營銷信息的改善,已圍繞企業如何更容易地從Hadoop真正獲得價值,同時也表明,企業從Hadoop獲得價值的門檻已經降低。
最后再次重復,Hadoop越專注于小規模部署,最終用于大規模部署的可能性越大。