精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

Hadoop 2造就大數據發展中實質飛躍

責任編輯:editor004 |來源:企業網D1Net  2013-10-22 17:38:25 本文摘自:網界網

新的Hadoop不僅能夠進一步刺激為Hadoop編寫應用程序,同時也將在Hadoop內創造全新的數據處理方法,這在此前的架構限制下是根本不可能實現的。總之,這是好東西。

一直以來是什么限制著Hadoop的發展?更重要的是,Hadoop的未來發展會是怎樣?

對于Hadoop的各種批評主要圍繞在其擴展限制,而這里最大的問題是其工作處理。Hadoop中的所有工作都是通過被稱為JobTracker的守護程序進行批處理,這制造了一個可擴展性和處理速度的瓶頸。

而在Hadoop 2,這種JobTracker的方法已經消失。Hadoop使用了全新的工作處理框架,使用兩個守護程序:ResourceManager—管理系統中的所有工作,以及NodeManager—在每個Hadoop節點上運行,并讓ResourceManager知道節點上發生的情況。每個正在運行的應用程序也有自己的管理程序—ApplicationMaster。

MapReduce也與之前完全不同,Apache給了它一個全新的名稱:YARN,或者Yet Another Resource Negotiator,另一種資源協調者,新的MapReduce運行作為其很多可能的組件之一。事實上,Apache聲稱,任何分布式應用程序都可以在YARN上運行,雖然需要一些移植。為此,Apache提供了一份與YARN兼容的應用程序列表,例如社會圖標分析系統Apache Giraph(Facebook在使用)。

Apache明智地決定不破壞向后兼容性,因此,MapReduce 2仍然將采用相同的API,現有的工作只需要重新編譯就能正常工作。

YARN讓Hadoop可以與其他Apache項目實現更多的跨平臺兼容性,來處理大數據。如果你使用其中一個平臺,那么使用其他平臺就會變得更加容易。Hadoop的這種改進將幫助推動Apache的其他項目。

這里最大的改進就是,MapReduce本身成為通過Hadoop挖掘數據的很多方式的一種。Apache自己的Spark(移植到YARN的另一種方式)可能比MapReduce更適合某些類型的工作,Hadoop 2給了你更多選擇,讓你選擇最合適的引擎。

兩個大型供應商Cloudera和Hortonworks對于YARN的重要性有著共同的看法,雖然他們從完全不同的方向使用Hadoop。Cloudera的Impala允許對HDFS存儲的數據運行低延遲性SQL查詢,這使其非常適合實時分析;而Hortonworks選擇使用Apache的原生Hive技術,該技術非常適合大數據倉庫操作(例如有很多連接型操作的長時間運行的查詢)

移植應用程序到YARN并不是簡單的工作,Hadoop在這方面帶來的回報將取決于YARN在新框架內的部署情況。Cloudera和Hortonworks都是Hadoop 2的堅實支持者,他們并沒有轉向其他技術或者堅持上一代技術,從這一點來看,Hadoop 2并不只是煙霧或者上一代的鏡像。

關鍵字:HadoopHDFSHiveImpala

本文摘自:網界網

x Hadoop 2造就大數據發展中實質飛躍 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

Hadoop 2造就大數據發展中實質飛躍

責任編輯:editor004 |來源:企業網D1Net  2013-10-22 17:38:25 本文摘自:網界網

新的Hadoop不僅能夠進一步刺激為Hadoop編寫應用程序,同時也將在Hadoop內創造全新的數據處理方法,這在此前的架構限制下是根本不可能實現的。總之,這是好東西。

一直以來是什么限制著Hadoop的發展?更重要的是,Hadoop的未來發展會是怎樣?

對于Hadoop的各種批評主要圍繞在其擴展限制,而這里最大的問題是其工作處理。Hadoop中的所有工作都是通過被稱為JobTracker的守護程序進行批處理,這制造了一個可擴展性和處理速度的瓶頸。

而在Hadoop 2,這種JobTracker的方法已經消失。Hadoop使用了全新的工作處理框架,使用兩個守護程序:ResourceManager—管理系統中的所有工作,以及NodeManager—在每個Hadoop節點上運行,并讓ResourceManager知道節點上發生的情況。每個正在運行的應用程序也有自己的管理程序—ApplicationMaster。

MapReduce也與之前完全不同,Apache給了它一個全新的名稱:YARN,或者Yet Another Resource Negotiator,另一種資源協調者,新的MapReduce運行作為其很多可能的組件之一。事實上,Apache聲稱,任何分布式應用程序都可以在YARN上運行,雖然需要一些移植。為此,Apache提供了一份與YARN兼容的應用程序列表,例如社會圖標分析系統Apache Giraph(Facebook在使用)。

Apache明智地決定不破壞向后兼容性,因此,MapReduce 2仍然將采用相同的API,現有的工作只需要重新編譯就能正常工作。

YARN讓Hadoop可以與其他Apache項目實現更多的跨平臺兼容性,來處理大數據。如果你使用其中一個平臺,那么使用其他平臺就會變得更加容易。Hadoop的這種改進將幫助推動Apache的其他項目。

這里最大的改進就是,MapReduce本身成為通過Hadoop挖掘數據的很多方式的一種。Apache自己的Spark(移植到YARN的另一種方式)可能比MapReduce更適合某些類型的工作,Hadoop 2給了你更多選擇,讓你選擇最合適的引擎。

兩個大型供應商Cloudera和Hortonworks對于YARN的重要性有著共同的看法,雖然他們從完全不同的方向使用Hadoop。Cloudera的Impala允許對HDFS存儲的數據運行低延遲性SQL查詢,這使其非常適合實時分析;而Hortonworks選擇使用Apache的原生Hive技術,該技術非常適合大數據倉庫操作(例如有很多連接型操作的長時間運行的查詢)

移植應用程序到YARN并不是簡單的工作,Hadoop在這方面帶來的回報將取決于YARN在新框架內的部署情況。Cloudera和Hortonworks都是Hadoop 2的堅實支持者,他們并沒有轉向其他技術或者堅持上一代技術,從這一點來看,Hadoop 2并不只是煙霧或者上一代的鏡像。

關鍵字:HadoopHDFSHiveImpala

本文摘自:網界網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 林芝县| 四子王旗| 涟源市| 长治县| 扶绥县| 沧州市| 大安市| 扬中市| 武川县| 大姚县| 临清市| 磴口县| 重庆市| 罗田县| 都安| 铜鼓县| 拉萨市| 锡林浩特市| 东至县| 东兴市| 高碑店市| 怀化市| 亚东县| 宜兰市| 读书| 通道| 囊谦县| 开阳县| 宜章县| 丰城市| 白城市| 德令哈市| 喀什市| 虎林市| 米泉市| 芜湖市| 当雄县| 弥勒县| 三穗县| 资中县| 翁源县|