肯睿Cloudera亞太區首席技術官Daniel Hand
挑戰1:提高創新力和業務敏捷性
第一項挑戰來自于如何提高創新力和業務敏捷性,包括如何實現數據和數據資產平權。這能夠幫助企業避開數據關守(Data Gatekeeper),以便更好地利用他們所擁有的數據。
創新的另一個要素是幫助企業快速擴展并向新的市場提供數據產品和服務。如果需要在數據中心建立一個新的分析集群,尤其是在一個新的國家,則往往需要延長周期。在公有云中管理數據和運行分析可以大幅加快價值變現周期,但需要應對風險和運營復雜性。
以近乎實時的方式獲取洞察與傳統的批量分析方法存在明顯的區別。從數據中獲得的洞察,其價值會隨著時間的推移而減少,因此企業越來越需要通過近乎實時的流處理來增強批處理分析。
挑戰2:管理運營風險
第二項挑戰來自于管理運營風險,包括企業如何確保在每個所支持的環境中統一、可靠地實施安全政策和控制。
這方面的另一個變量因素是需要在整個數據生命周期中捕獲數據沿襲和來源。如果企業無法了解數據來源以及誰在數據生命周期中訪問并改造了數據,那么從數據中獲得的洞察價值就會降低。
隨著所采集的數據量成倍增加,企業越來越需要對數據進行自動剖析、分類和采取適當的控制手段,比如新的數據集是否包含敏感的個人身份信息(PII)數據等;此外,另一個相關的挑戰是如何高效地管理和分析高達PB量級的海量數據。
為了應對監管和治理變化,企業還可能需要在不同環境之間安全、高效地移動數據和應用。這不僅包括將數據從云遣返到本地,還包括當平臺被監管機構認為缺乏足夠的控制手段來應對政策變化時,在公有云供應商之間移動數據。
挑戰3:管理運營復雜性
最后一項挑戰是管理各種數據集和分析工作負載所帶來的運營復雜性。若在每個公有云平臺和本地均采用不同的解決方案,那么不論是承擔運營費用或是維系一支具備合適技能的團隊,都會帶來沉重負擔。這些因素綜合起來將引發并增加運營風險,影響敏捷性。
基于以上三項挑戰,以下是一些指導原則和政策,以幫助企業在構建強大的數據戰略時克服障礙。在考慮采用何種技術時,企業應牢記:在支持混合云、多云基礎架構和處理引擎開放生態的同時也應留有余地。這樣,在整個數據生命周期便可以部署集成分析服務集,也可以規定安全策略和控制手段,使其在任何受支持的環境中都能統一一致地執行。
理想情況下,該技術應該可以進一步擴展,不但能夠支持當前的數據管理和分析需求,還能夠支持未來幾年可預測的需求。并且,該技術最好是專為云而設計,以實現計算和存儲能夠獨立擴展。
總結
支持數據編織、湖倉一體、數據網格等現代化數據架構的功能繼續影響著當前提供給企業的解決方案。因此,企業可以采用一個能夠在多種環境中統一管理不同數據集的平臺,結合數據湖和數據倉庫的統一化,以及支持數據產品、域所有權和自助服務。Cloudera Data Platform(CDP)與其他企業數據平臺解決方案的不同之處在于,其能夠在整個數據生命周期內借助共享安全和治理結構持續實現這一點。對于幫助全球各大企業制定和實施靈活的數據戰略來說,這項能力是不可或缺的。