就在幾年前,影響云計(jì)算應(yīng)用的兩個最大障礙是云計(jì)算的安全性和可靠性。隨著時間的推移,人們已經(jīng)了解到云計(jì)算可以像內(nèi)部部署一樣安全(甚至更安全)。雖然花費(fèi)多年時間才建立起良好的記錄,但人們現(xiàn)在知道云平臺通常更可靠。
但這并不是說采用云計(jì)算是萬無一失的。仍然有大量的重大停機(jī)事件。2019年的趨勢是有趣的:停機(jī)事件突出了企業(yè)依賴單個云平臺的風(fēng)險。
云風(fēng)險以及寡頭壟斷市場
云計(jì)算市場仍由少數(shù)行業(yè)巨頭主導(dǎo)。AWS公司引領(lǐng)市場發(fā)展,在2018年第四季度占據(jù)32.3%的市場份額,其中微軟Azure占第二位,占16.5%,谷歌云占第三位,占9.5%。其他市場的組合構(gòu)成了其他市場,其中包括阿里巴巴和IBM等幾家大公司。
市場的形態(tài)帶來了風(fēng)險分散和風(fēng)險集中的相互沖突
企業(yè)分散業(yè)務(wù)風(fēng)險是因?yàn)椴粌H僅依賴于辦公室中的單個服務(wù)器機(jī)房或數(shù)據(jù)中心。企業(yè)IT團(tuán)隊(duì)可以位于其他地方,降低了與該位置相關(guān)的風(fēng)險。
其次,大多數(shù)企業(yè)不只是使用一種云計(jì)算服務(wù)。即使是那些聲稱將業(yè)務(wù)遷移到單一云平臺以獲得單一平臺和批量折扣的企業(yè),也可能會使用其他SaaS服務(wù),如客戶關(guān)系管理(CRM)和人事工資管理系統(tǒng)(Payroll)。這應(yīng)該意味著企業(yè)的風(fēng)險會進(jìn)一步降低,因?yàn)樗邢到y(tǒng)一次性失敗的可能性很小。但情況并非總是如此。
一些主要云計(jì)算提供商帶來的問題是,許多基于SaaS的云計(jì)算服務(wù)可能托管在同一平臺上。從表面上看,企業(yè)正在分散風(fēng)險,但也可能將所有雞蛋放在一個籃子里。2017年2月的AWS公司的云服務(wù)中斷影響了Spotify、Dropbox和Trello等服務(wù)。2018年的AWS云服務(wù)中斷影響了Atlassian、Twilio和Slack的運(yùn)行。因此,云計(jì)算安全性并不像人們預(yù)期的那樣安全。
超大規(guī)模的云計(jì)算提供商已經(jīng)構(gòu)建了他們的基礎(chǔ)設(shè)施,讓客戶可以使他們的系統(tǒng)和應(yīng)用程序可以在AWS、Azure和谷歌云的公共云服務(wù)提供獨(dú)立隔離的可用區(qū)域運(yùn)行。如果企業(yè)至少在兩個區(qū)域構(gòu)建基礎(chǔ)設(shè)施,則可以減少或消除單點(diǎn)硬件故障。
這種隔離應(yīng)該使重大問題不能影響多個區(qū)域,因?yàn)椴⒉豢偸前l(fā)生突發(fā)事件。獨(dú)立的數(shù)據(jù)中心可以防止電力中斷或極端天氣等風(fēng)險,但不能抵御平臺范圍內(nèi)的問題。
云計(jì)算只是使用別人的電腦
而谷歌公司在美國的一些服務(wù)6月2日發(fā)生中斷,其針對單個區(qū)域中的少量服務(wù)器的配置更改影響了多個相鄰區(qū)域中的大量服務(wù)器,其結(jié)果是導(dǎo)致這些區(qū)域超過一半的可用網(wǎng)絡(luò)容量停止使用。這不僅影響了谷歌公司自己的搜索服務(wù),對Gmail和YouTube等服務(wù)也產(chǎn)生了影響,還影響了使用谷歌云的客戶。
今年早些時候,谷歌云平臺又出現(xiàn)了這類問題。代碼更改導(dǎo)致谷歌云控制臺和Cloud Dataflow出現(xiàn)問題,從而導(dǎo)致全球谷歌云存儲出現(xiàn)錯誤。今年,由于DNS遷移錯誤,微軟Azure遭遇了一次全球性中斷。這個小問題擴(kuò)展到計(jì)算、存儲、廣告標(biāo)識服務(wù)和SQL數(shù)據(jù)庫。
2019年,云計(jì)算服務(wù)提供商遇到的數(shù)據(jù)中心問題并不多,但人們看到的是幾個平臺范圍的問題,通常是由于人為錯誤。有人說,應(yīng)用云計(jì)算就是使用別人的電腦,但“別人”也會容易出錯。
Databarracks公司進(jìn)行了10年以上的年度IT調(diào)查,發(fā)現(xiàn)數(shù)據(jù)丟失的主要原因始終是硬件故障和人為錯誤。云計(jì)算讓企業(yè)構(gòu)建自己的系統(tǒng)來處理硬件故障,但是不可能消除人為錯誤。
云安全:建議管理供應(yīng)商風(fēng)險以限制云風(fēng)險
首先,了解云計(jì)算服務(wù)的托管位置。知道某些服務(wù)托管在同一平臺上并不一定意味著需要替換它們,可能只是面臨一定的風(fēng)險。至少通過調(diào)查,企業(yè)知道涉及云計(jì)算提供商的事件會受到什么影響。
對于其他領(lǐng)域,這意味著要做出改變。緊急或批量通知工具不能使用與生產(chǎn)系統(tǒng)相同的云,因?yàn)樗瞧髽I(yè)在中斷期間進(jìn)行通信所依賴的平臺。在這里,企業(yè)需要深入了解第二個和第三個云計(jì)算供應(yīng)商,以了解使用了哪些云計(jì)算服務(wù)。緊急通知工具可以托管在一個云平臺上,但也可以使用第三方短消息工具(如Twilio)來提供服務(wù)。
使用多個云計(jì)算提供商的服務(wù)
最終的建議是企業(yè)使用多個云計(jì)算提供商的云服務(wù)。即使企業(yè)已在一個云平臺上的系統(tǒng)中構(gòu)建了彈性,使用多個可用性區(qū)域甚至區(qū)域也意味著企業(yè)始終至少擁有這個云平臺之外的數(shù)據(jù)備份副本。
或者,企業(yè)可能希望跨多個云計(jì)算提供商構(gòu)建彈性。需要確保不依賴于特定于平臺的專有工具,并始終將應(yīng)用程序構(gòu)建為可遷移的。容器和基礎(chǔ)設(shè)施代碼方法意味著企業(yè)可以快速、可重復(fù)地構(gòu)建和破壞環(huán)境。這一方法將更加有效,但其提供好處不僅僅是彈性。企業(yè)還可以利用云計(jì)算提供商之間的定價或性能差異,更自由地在云服務(wù)之間切換。