Ashish Thusoo, Qubole的CEO和聯合創始人,最近在 Enterprise Data World Conference (EDW)上談到了作為一種服務產品的“云中巨象” Hadoop 。大數據作為服務而不是一個產品會成為一個趨勢,Hadoop作為一種服務提供,旨在幫助機構處理大規模運行的Hadoop服務的挑戰和成本。這些基于云服務的解決方案也可以從云服務的其他功能中獲益,如動態配置、計算和存儲的靈活性以及在多個地區的可用性。
Ashish在開始談論時說到,現在數據的性質,包括海里的交互數據,都是非結構化的。而不僅僅是我們長期以來傳統應用程序里處理數據結構化數據。
分析的性質也發生了改變。Ashish談到了分析值從描述性向規范性分析的發展。
描述性分析(發生了什么?)診斷性分析(為什么發生?)預測性分析(將會發生什么?)規范性分析(我們怎樣才會讓它發生?)云提供很多好處,如按需和彈性擴展架構,高可擴展的對象存儲和處理,和自適應的基礎設施。使用云大數據平臺提供更快的生產時間、敏捷和基礎設施的靈活性以及顯著降低成本。
Virtual Private Cloud (VPC)提供隔離訪問計算和存儲,以及提供安全實踐。VPC的安全性包括云存儲中的數據和網絡數據,以及基于訪問計算和存儲的角色加密選項。
現代數據處理平臺包括多個處理引擎,可以處理各種案例,如下面列舉出:
復雜批次處理SQL,Hive數據科學,Spark簡單交互SQL查詢,Presto批量數據清洗(ETL),Map ReduceAshish 還談論了基于云平臺的大數據參考架構,包括多租戶數據訪問、引擎統一、云計算服務和可移植性服務等。他總結報告說,Hadoop作為一種服務提供在大數據架構決策時是一個吸引人眼球的選擇。
查看英文原文:Elephant in the Cloud - Hadoop as a Service