亞馬遜的企業級云服務EC2上周發生的故障,這給眾多企業CIO在簽署云服務級別協議(SLA)的時候注意:“別把所有的雞蛋都放在一個籃子里面”。 對于企業的CIO們來說,在采用外部云應用的時候必須考慮到供應商提供的云服務的安全性、性能以及冗余性這些至關重要的關鍵點。
“在采用供應商的這種云服務的時候,必須要明白不是所有的企業應用都可以被云服務實現,”美國科羅拉多州郎蒙特市的Ptak, Noel & Associates LLC的合伙人及首席分析師Audrey Rasmussen這樣評價。
Rasmussen進一步建議在采用供應商們提供的云服務之前,企業的CIO們應該仔細的調查研究這些云服務的基礎架構設計及技術細節,并且一定要在簽署云的服務級別協議的時候,把自己需要的功能作為服務需求列明其中。相比一般的業務應用,重要的業務系統對更高級別的冗余性及故障切換能力的依賴性顯然更高。當然,高級別的服務協議開銷相對而言更為昂貴,所以IT需要在開銷、風險以及收益之間做出明智的選擇。
云服務級別協議的挑戰
至少對于IT的執行者而言,這種挑戰是需要付出相當的勇氣。
一家紐約的財務服務有限公司,Baron Capital的網絡技術部經理Henry Mayorga認為“去尋找百分之百的可用性就像找傳說中的圣杯一樣不現實”,因為“當你越增加冗余性設備到你的系統的時候,那么你的系統復雜度會越來越高。如果一切設備以及配置都確實被正確的連接并設置到位,那么理論上的高可用性是存在的。但是,一旦錯誤設置了系統中的任何一個部分或者任何一個組件沒有按預期工作,那么發現錯誤原因的困難度會成倍數的增加并且恢復系統的難度也同樣成倍數的增加愛”。
但即便如此,出于對風險管理的麻煩之處,洛杉磯的一家信息律師事務所的合伙人Tanya Forsheit,一名云服務的專家,依然認為IT執行者依然必須堅持采用更高級別的保護措施,而放棄考慮那些不能真正滿足企業需要的方案。 “企業的需求并不盡相同,所以每一個企業的每一個需求都需要經過談判確認后量身定制,而不是去接受那些大部分云服務供應商提供的千篇一律的服務模式”。
在簽署云服務級別協議之前,必須明確故障對自己業務的影響程度
一家專注于系統集成咨詢方案的科技公司首席技術主席,Phil Kramer,認為企業的CIO必須事先對云服務供應商所提供的服務,一旦發生中斷后造成的影響以及損失做出評估。
Kramer舉例到:“除非服務器也同時死機了,如果僅僅是用戶的服務器列表目錄一晚上沒有被執行備份,這是一個很低風險的故障;但如果是用戶的珍貴信息呢?在沒有備份的情況下存儲該信息的服務器崩潰了,后果可想而知。如果你的供應商的云服務級別協議不能確保你的數據訪問,這絕對是一個非常錯誤的選擇。”
“如果你所采用的云服務僅僅用于測試和程序原型開發,那么高級別的冗余性就不是那么重要”,位于麻省諾福克市的Hurwitz & Associates LLC咨詢公司的總裁兼首席運營官Judith Hurwitz這么認為,“但如果公司采用供應商提供的云服務來支撐面向客戶的企業服務,那么公司就必須確保該服務有正確的備份策略和業務連續性解決方案”。
一旦公司明確了每一個應用程序對于可靠性級別的需求,那么就可以開始尋找相應的解決方案了。新澤西州的一家網絡基礎架構服務提供商,Vector公司的數據服務產品經理Vinoo Jacob提醒道:“有一系列方案都可以選擇,包括傳統的站點內備份恢復到在多個供應商之間做快速故障切換以保障業務連續性”。
亞馬遜的云服務故障事件迫使客戶對他們的服務提供商提出更高的需求,Jacob認為“雖然只是一個短時間的故障,但這有助于在未來澄清云服務的定義和評價;這不是關于是否決定采用云服務的問題,而是關于如何評估并采用基于云方案后如何設計系統架構的問題”。
事實上云服務和服務級別協議已經改變了CIO們的角色,Ptak, Noel‘s Rasmussen認為“不再像以往那樣僅僅管理他們的企業內部提供的IT服務,現在CIO們必須同時監管內部以及外部提供的IT服務,并且確保業務所需的必要功能及相應的服務級別都得以無縫對接”。
有關于簽署云服務級別協議時建議考慮的幾個問題
云服務不可用的情況下你將如何得到通知?服務是否可以自動重啟?
你的云服務供應商如何確保服務質量以保障你的業務?
供應商是否提供負載均衡或者可靠性保證?
你對供應商的RPO(數據恢復點)和RTO(服務中斷時長)的要求是什么?
供應商可以提供什么方式來讓你管理你的應用程序性能以及解決故障?
譯者注:Amazon的EC2 (Elastic Compute Cloud) 服務類似于Google的Instance虛擬企業云服務,是一個讓用戶可以租用云電腦運行所需應用的系統。EC2借由提供web服務的方式讓用戶可以彈性地運行自己的Amazon機器鏡像文件,可以在這個虛擬機上運行任何自己想要的軟件或應用程序。
用戶可以“彈性”使用EC2所提供的服務,隨時創建、運行、終止自己的虛擬服務器,按使用時間計費。EC2讓用戶可以控制運行虛擬服務器的主機地理位置,這可以最大化的降低業務延時,例如,為了讓系統維護時間最短,用戶可以在每個時區都運行自己的虛擬服務器。