在大數據的世界里,云計算扮演著很重要的角色,特別是在那些短期工作和應用程序當中,因為這些領域的很多數據已經在云計算中。
對于大部分的人來說,云計算是一個很大、模糊且有點遙不可及的夢。一些人在看待大數據戰略時,會將其等同于將大數據放入云端,但是這樣的說法是真的有遠見還是只是簡單的重復行業會議中的觀點。
實際上,大數據和云計算有很大的重疊和交集,所以企業很可以很明確的宣稱自己正在利用內部部署的Hadoop、NoSQL或者是企業數據倉庫環境進行基于云計算的大數據戰略。同時還要提醒大家:云計算被廣泛的認為是包括除了“私有部署”以外或者是代替公有云、SaaS和多租戶托管環境。
但如果你將云計算的定義限制為公共訂購服務,你就會遇到一個核心問題:需要確定哪些大數據應用更為適合公有云/SaaS環境或者是傳統的內部部署。換句話說:通過外部的服務提供商的管理,何時才能提高大數據的可擴展性、彈性、效能以及成本效益、可靠性。以下是四個關于大數據遷移至云端的用例,幫助辨別你的大數據是否已經處于云端了。
企業應用已托管在云中
對于很多企業來說,特別是中小企業來說,如果你用的是外部服務商提供的基于云計算的應用程序,實際上企業中的大部分交易源代碼已經在公有云當中。如果你有很多的歷史數據都在云計算平臺中,也許已經累計構成大數據了。
此時,利用外部服務提供商或者是其合作伙伴提供的數據分析增值服務比完全依靠企業內部的資源更有效,服務包括客戶流失分析,營銷優化,或異地的客戶數據的備份和歸檔服務。
高容量的外部數據源則需要預處理
舉個例子,若是你正在通過收集社交網絡來進行客戶的情緒監控,也許你的企業內部沒有服務器、存儲和帶寬能夠全面的監測這些數據,但是通過基于公有云的大數據服務,你就能夠很簡單的利用社交媒體過濾服務來對客戶的情緒變化進行監控。
企業內部無法承受的戰略應用
若是企業內部已有一個基于應用程序的大數據平臺,如專用的Hadoop集群的高容量ETL非結構化數據源,通過公有云來解決新的應用程序是比較可行的,例如,多渠道營銷,社交媒體分析、地理空間分析、可查詢歸檔和彈性數據等。對于不適合當前平臺的應用程序來說,一個按需收費的服務的成本效益是最好的。
事實上,企業如果想要盡快處理PB級規模的多種結構的流媒體的大數據,公有云是唯一一個可行的解決方案。
分析沙箱的彈性配置
若是你需要進行數據探索的是一個生命周期較短的項目,訂單量又是數量級的時候,云計算可能是唯一可行的或經濟實惠的選擇。你可以快速的為項目配置基于云的存儲和計算能力,當項目結束的時候,企業可以快速的取消這些配置。這種模式可以稱之為“泡沫集市”部署模型,可以說是為云量身定制。
只要你遇到以上任何一種情況,基于云計算的大數據戰略問題也就會隨之而來,隨著云計算和大數據服務的成熟,價格,性能,可擴展性,靈活性和可管理性都將會得到改善,但這個問題仍然還是會存在,只不過階段不同了。再過幾年,越來越多的應用和數據遷移到公有云之后,利用你現在的服務器來運行你的大數據應用似乎也不太實際了。所以企業要懂自己的大數據戰略,同時還要搞清楚企業數據是不是已經在云端了,并及時做好戰略的調整。