云計算和大數據是目前比較流行的技術,可是這兩者之間存在什么聯系呢?云計算為大數據提供了基礎設施,大數據需要靈活的計算環境,而后者可以快速、自動地進行擴展以支持海量數據。基礎設施云可以精準地提供這些需求。
當在大數據使用案例中提及云安全策略時,我們希望任何安全解決方案都能夠在不影響部署安全性的情況下提供與云一樣的靈活性。可是靈活性和安全性有的時候是不能兼顧的,所以如何實現安全性和靈活性的平衡是云計算提供商和大數據提供商需要深入思考的。
部署云加密措施被認為是首要步驟,但是它們并不適合所有的解決方案。一些加密解決方案需要本地網關加密,這種方案在云大數據環境下無法很好的工作。此外云計算提供商提供了密鑰加密技術,用戶在享受基礎設施云解決方案提供的優勢的同時又可以將密鑰保存在自己手中,讓密鑰處于安全狀態下。為了能夠讓你的大數據環境獲得最佳的加密解決方案,建議使用密鑰加密。
在大數據當中,結構的每一個組件都應該能夠擴展,云安全解決方案也不例外。在選擇云安全解決方案時,用戶需要確保它們在所有跨地區云部署點中都能夠發揮作用。此外,它們在大數據基礎設施當中必須要能夠高效地擴展。但是由于硬件安全模塊不具擴展能力并且無法靈活適應云模式,因此它們不適合大數據使用案例。為了獲得必要的擴展性,建議使用專門針對云計算設計的云安全解決方案。
為了讓云安全策略盡可能地實現自動化,用戶應當選擇虛擬工具解決方案,而不是硬件解決方案。用戶需要明白可用的API也是云安全解決方案的一部分。虛擬工具加上閑置的API能夠在云大數據使用案例中提供所需要的靈活性和自動化。
在涉及大數據安全性時,用戶應當根據數據的敏感程度進行分類,然后對它們采取相應的保護措施。并不是所有的大數據基礎設施是安全的,如果處于風險當中的數據非常敏感或是屬于管制數據,那么用戶可能需要尋找替代方案。
以上我們說的是數據安全,其實大數據安全還包括以下幾個方面:
規模、實時性和分布式處理:大數據的本質特征(使大數據解決超過以前數據管理系統的數據管理和處理需求,例如,在容量、實時性、分布式架構和并行處理等方面)使得保障這些系統的安全更為困難。大數據集群具有開放性和自我組織性,并可以使用戶與多個數據節點同時通信。驗證哪些數據節點和哪些客戶應當訪問信息是很困難的。別忘了,大數據的本質屬性意味著新節點自動連接到集群中,共享數據和查詢結果,解決客戶任務。
嵌入式安全:在涉及大數據的瘋狂競賽中,大部分的開發資源都用于改善大數據的可升級、易用性和分析功能上。只有很少的功能用于增加安全功能。但是,你希望得到嵌入到大數據平臺中的安全功能。你希望開發人員在設計和部署階段能夠支持所需要的功能。你希望安全功能就像大數據集群一樣可升級、高性能、自組織。問題是,開源系統或多數商業系統一般都不包括安全產品。而且許多安全產品無法嵌入到Hadoop或其它的非關系型數據庫中。多數系統提供最少的安全功能,但不足以包括所有的常見威脅。在很大程度上,你需要自己構建安全策略。
應用程序:面向大數據集群的大多數應用都是Web應用。它們利用基于Web的技術和無狀態的基于REST的API。雖然全面討論大數據安全的這個問題超出了本文的范圍,但基于Web的應用程序和API給這些大數據集群帶來了一種最重大的威脅。在遭受攻擊或破壞后,它們可以提供對大數據集群中所存儲數據的無限制訪問。應用程序安全、用戶訪問管理及授權控制非常重要,與重點保障大數據集群安全的安全措施一樣都不可或缺。
總之,只有為數據建立了最為嚴格的安全標準,大數據才能夠不斷地享受著由云計算提供的可擴展性、靈活性和自動化。