Cloudera公司提供了一組用于統(tǒng)一數(shù)據(jù)管理的工具,這亦使其成為目前第一家提供此類工具的公司。此外,Cloudera還將其SDX架構(gòu)稱為該平臺的“秘制醬汁”。
目前,企業(yè)對數(shù)據(jù)在不同環(huán)境中的可移植性和使用方式靈活性的需求日益旺盛。
該項需求亦驅(qū)使相關(guān)企業(yè)獲取一套明確的解決方案。對Hadoop陣營主力Cloudera而言,這一解決方案正是SDX,全稱為“共享式數(shù)據(jù)架構(gòu)”。
然而,在本次于紐約召開的Strata數(shù)據(jù)大會上,該公司創(chuàng)始人兼首席技術(shù)官Amr Awadallah在接受采訪時表示,對于Cloudera公司而言,SDX不只是一種“架構(gòu)演習(xí)”。
Amr Awadallah表示:“該架構(gòu)的性能已經(jīng)有目共睹。Cloudera平臺將憑借其“秘制醬汁”——SDX架構(gòu)——一舉超越我們的競爭對手。”
Awadallah解釋稱,推出此項目在一定程度上是為了引導(dǎo)客戶認知。對此,他補充稱,多數(shù)客戶還沒有意識到企業(yè)需要投入大量工作以確保數(shù)據(jù)管理工作的跨平臺統(tǒng)一。
Awadallah補充道:“在單一項目中,平均40%,甚至可能達到50%的工程時間都用于研究如何確保跨平臺統(tǒng)一。目前,我們已經(jīng)從開源社區(qū)中選取了大約30個項目,并開始嘗試為這些項目提供相同的授權(quán)與處理方式。”
“我們過去未能意識到跨平臺統(tǒng)一的關(guān)鍵性,而客戶現(xiàn)在需要同時具備靈活性與互操作性的架構(gòu)……如果不能達到跨平臺統(tǒng)一,客戶將只能夠?qū)崿F(xiàn)個別要素的逐一開源。”
SDX架構(gòu)支持多種公有云、私有云與內(nèi)部部署形式,且允許客戶以不同方式使用并分析其數(shù)據(jù),具體包括用于機器學(xué)習(xí)的Spark與用于分析的Impala。
Awadallah表示,“企業(yè)希望實現(xiàn)可移植性,實際上是希望獲得在本地與云之間、云與云之間自由移動的能力。這表明企業(yè)不愿意被鎖定于Azure、亞馬遜或谷歌等某一家供應(yīng)商身上,而是希望能夠以不同的方式靈活地提取數(shù)據(jù)價值。”
“跨平臺統(tǒng)一還意味著在不同計算與存儲的混合體系中存在相同的訪問控制、策略、合規(guī)性以及元數(shù)據(jù)管理機制。”
考慮到Cloudera公司的首要客戶為金融機構(gòu)與政府部門,所以該公司推出的SDX架構(gòu)將安全性、治理能力與合規(guī)性視為重中之重。
該架構(gòu)提供了授權(quán)方式,具體涵蓋系統(tǒng)訪問、細粒度訪問控制、高敏信息加密等,并且還可審計訪問信息人員的身份、所在位置以及具體時間點。
Cloudera在此次大會上宣布,為了讓其產(chǎn)品與平臺獲得盡可能多受眾群體的青睞,該公司旗下的平臺即服務(wù)方案Altus現(xiàn)已正式登陸微軟Azure云。
今年6月,Cloudera與亞馬遜合作推出Altus,而隨后加入的Azure版本與前者基本相同。Awadallah表示,預(yù)計明年該公司還將會推出Altus的Google Cloud版本。