Apache軟件基金會宣布了分布式計算開源軟件框架第三版。Apache Hadoop 3.0是自2013年Hadoop 2.0發布以來的第一個主要版本。
Apache Hadoop 3.0的項目經理Andrew Wang表示,Hadoop 3.0是該項目的一個重要里程碑,也是迄今為止最大的發布版本。它代表了自Hadoop 2.0以來五年中數百名貢獻者的共同努力。他很期待用戶可以從該版本的新功能中獲益,從而提高平臺的效率,可擴展性和可靠性。
Apache Hadoop以其能夠在大數據生態系統的大型硬件集群上運行和管理數據應用程序而聞名。最新版本包含HDFS erasure編碼,YARN Timeline Service版本2的預覽,YARN資源類型以及云存儲系統周圍的改進功能和性能增強,包括Hadoop Common,用于支持其他Hadoop模塊,Hadoop分布式文件系統,Hadoop YARN和Hadoop MapReduce。
Apache Hadoop副總裁Chris Douglas表示,該平臺隨著硬件趨勢不斷發展,并適應批量分析以外的新工作負載,特別是實時查詢和長期運行服務。與此同時,眾多開源貢獻者已經將Apache Hadoop應用于廣泛的部署環境,包括云。
Apache Hadoop廣泛部署在Adobe,AWS,Apple,Cloudera,eBay,Facebook,Google,Hortonworks,IBM,Intel,LinkedIn,Microsoft,Netflix和Teradata等企業。此外,它還促進了其他Hadoop相關項目,如:Apache Cassandra,HBase,Hive,Spark和ZooKeeper等的發展。