對于試圖分類和整理大數據科技,特別是 Hadoop的那些企業,這是一個振奮人心的全新信息圖。這個對Hadoop的分析,也許能幫助公司的決策領導者更好地了解該技術平臺。
1什么是Hadoop?
Apache Hadoop是2005 年(由Apache Software Foundation)開發的開源軟件框架,特別為大數據和大規模數據處理量身定制。它包含四個主要模塊:
1. Hadoop Common: 包含其它Hadoop模塊所需的所有庫和功能。
2. Hadoop 分布式文件系統(Distributed File System),簡稱HDFS。它是一個文檔儲存系統,能夠在數據集群間提供高帶寬。
3. Hadoop Yarn: 管理計算機集群中計算資源的平臺,并利用這些資源做應用調度。
4. Hadoop MapReduce:處理大規模數據的程序模塊。
小貼士
超過170家公司正在致力于發展Hadoop,當前Hadoop框架的估值為20億美元。
2企業中的Hadoop
使用Hadoop管理數據,2014年,每4家企業就有1家;2012年,每10家公司才有1家。
前5大應用行業:計算機制造業、商用服務、金融、零售和批發、教育和政府部門。
使用Hadoop的5大原因:低成本,計算性能,規模可伸縮性,存儲靈活性,數據保護。
超過60%的公司表明,Hadoop補充或取代了他們現有的數據環境。
3Hadoop的未來
61%的機構計劃在不遠的未來部署、或已經部分部署了Hadoop。
對基于Hadoop技術的全球銷售額:截至2020年將達到50.2億美元。
高德納咨詢公司(Gartner)表示:
“對Apache Hadoop使用對增長,正在促進著結構化數據的增長,引領企業去理解如何再利用數據,賦予數據新的用途,并從數據中獲得至關重要的深入理解 。”
4
完整信息圖
來源:
http://insidebigdata.com/2014/10/18/current-state-hadoop-inforgraphic/