11月20日 新聞消息:在上個月發布的Apache Hadoop 2.2的基礎上,大數據應用程序平臺專家Concurrent今天推出了新版本的Cascading——其大數據應用框架。
Concurrent公司還推出了Cascading Lingual 1.0,這是提供全面ANSI SQL接口的開源項目。
Cascading是一個獨立的開源Java應用程序框架,它被設計作為MapReduce的替代API。Cascading讓Java開發人員可以使用他們現有的技能在Hadoop上構建大數據應用程序。
Cascading創造者Concurrent公司創始人兼首席技術官Chris Wensel表示:“我創建Cascading完全是因為憤怒,在我使用MapReduce后,我發誓決不再使用它了。”
這個最新版本Cascading 2.5增加了對Hadoop 2.2的支持,該版本包括Hadoop 2.2版本中引入的新的YARN架構。Apache Hadoop YARN(另有一個資源管理器)作為Hadoop操作系統,利用單一用途數據平臺來進行批處理,并將其發展成為多用途平臺—可進行批處理、交互式、網絡和流處理。
YARN作為存儲在Hadoop分布式文件系統(HDFS)上數據的主要資源管理器以及訪問調解器,讓企業可以將數據存儲在一個地方,然后以多種方式與這些數據進行交互,具有一致的服務水平。
企業現在可以使用Cascading來利用針對單一大數據處理應用程序的Java、傳統SQL和預測建模投資。
Hadoop 2的遷移路徑
Concurrent公司首席執行官Gary Nakamura表示,Cascading并不專門利用YARN,但它可以讓用戶無縫地遷移其應用程序到Hadoop 2,并利用YARN。Scalding、Cascalog和PyCascading等域特定語言(DSLs)也可以無縫地遷移到Hadoop 2。同樣地,當Cascading位于Hadoop堆棧時,它將支持Apache Tez。
Concurrent還為復的連接操作提高了性能,并優化了動態分區,以及更有效地在HDFS上存儲經過處理的數據。
除了Cascading,Concurrent還宣布Cascading Lingual 1.0開始發售,該產品能夠幫助已經投入巨資到商業智能(BI)工具(例如Pentaho、Jaspersoft和Congnos)以及培訓的企業快速訪問存儲在Hadoop上的數據。Lingual允許用戶利用他們現有的SQL技能以及系統來在Hadoo上創建和運行應用程序。
Concurrent公司的Wensel表示,Lingual讓任何熟悉SQL的人可以立即利用其JDBC兼容的BI或者首選桌面工具來訪問存儲在Hadoop上的工具。
亞馬遜云計算服務亞馬遜彈性MapReduce(EMR)集團總經理Steve McPherson表示:“Cascading是大數據應用程序開發生態系統的重要組件,Lingual是讓其更容易構建大數據應用程序的另一個重要進展。”
“現在,亞馬遜彈性MapReduce客戶可以利用Lingual來整合亞馬遜云計算服務上不同的數據存儲與亞馬遜S3和Redshift等服務,并且,它們可以處理這些數據,并通過標準ANSI SQL命令將其存儲在亞馬遜EMR中,”McPherson表示,“這讓客戶可以更容易的使用自己喜愛的BI工具來查詢數據。”