為什么說公有云是帶刺的玫瑰呢?我想這應該從公有云的價值和可靠性問題兩方面來說。價廉,付費即用、彈性收縮,不用采購設備,不管運維,這就是公有云的價值,也是公有云發展的推動力;現在很多企業都把自己的業務系統搬到云上,當然大部分上云客戶都是選擇核心上私有云,邊沿業務上公有云。最近AWS、Azure頻頻事故,可靠性、數據控制力和安全一次次給用戶敲響警鐘,下面我們來談談公有云的可靠性和用戶應該如何應對。
說起公有云服務和市場,我們不得不提稱霸整個公有云市場的龍頭老大Amazon,它位于華盛頓州的西雅圖。亞馬遜成立于1995年,其云數據中心采用中心和邊緣架構,28個中心云數據中心,52個邊緣數據中心,目前向全球11個區域提供業務無差異體驗的公有云服務。
在云計算和公有云領域,Amazon很多服務都成了事實上的標準(主要包括S3和EC2),其云數據中心硬件設施(如數據機房、制冷、供電、存儲、服務器、網絡和監控等) 規范也被當做教科書被不同云服務廠商參考,AWS服務業務涵蓋了整個IaaS、PaaS和SaaS層。
然而,從公有云出現到今天,市場的競爭局面雖未曾消減,但在激烈競爭和市場的洗禮之下,公有云的市場格局已日趨明顯。引領整個公有云市場的依次是Amazon的AWS、微軟的Azure、IBM的SoftLayer和Google的Cloud Platform,Oracle Cloud公有云服務業緊跟其后;阿里云也成為國內本土云服務領導者。公有云服務和技術發展和市場份額增加,也使得傳統IT硬件廠商市場空間縮水。但是從目前來看公有云真的可靠嗎,離我們所需的可靠還有多遠路要走,包括成熟的公有云管理規范。
其實,公有云一直以來倍受爭議和競爭激烈的市場,公有云服務廠商包括IaaS、PaaS和SaaS服務猶如雨后春筍,在市場格局還沒有定格的情況下,客戶對服務的選擇也是一頭霧水。
2013年由于公有云服務提供商Nirvanix在競爭中失利,強迫近1000家客戶在短時間取回或遷移原來保存在Nirvanix云中的數據,Nirvanix突然停業給客戶業務帶來不小動蕩和影響。
該說說公有云的可靠性了,我們就那老大Amazon來說,基本每年都有比較的可靠性事故發生。2017年3月,US-EAST-1地理區域的S3存儲服務發生中斷,依賴S3服務的Imgur、Medium和Docker Registry Hub,以及Runkeeper、Trello和雅虎網絡郵箱等紛紛發生中斷。
2016年3月云服務巨頭亞馬遜再一次發生了嚴重服務停機事故,前后維持了20分鐘,將造成巨大經濟損失。在事故發生時,亞馬遜電子商務主網站無法訪問,其他的服務業受到了波及,其中包括對外部服務的亞馬遜云計算服務,以及面向包郵會員提供的音樂等數字內容服務。
2015年7月亞馬遜Web服務(AWS)出現大規模宕機情況,導致Slack、Asana、Netflix、Pinterest等多款APP、以及多家使用AWS服務的網站出現無響應的情況。
2012年10月,亞馬遜位于北弗吉尼亞數據中心的云計算平臺再度宕機,導致多家知名網站長時間無法訪問,知名網站和信息服務商也受到這次宕機的影響。這是過去一年半中亞馬遜云計算的第五次宕機。
微軟云Azure公有云服務在3月16日也發生服務中斷,在全部28個數據中心中有26個受到影響。所影響區域的用戶無法創建、更新和刪除數據資源。但慶幸的是Azure云服務已恢復正常。2012年,Azure云服務也曾發生重大故障,當時持續了半天時間才恢復正常服務。
阿里云也是事故頻頻,2016年7月6號上午,藍鯨TMT曝出消息稱阿里云北京機房內網發生故障,近一個小時才恢復正常,導致大量互聯網公司業務受到影響。阿里云的故障已有多次,2015年9月,阿里云由于客戶正常文件被誤隔離,導致所有基本命令都不能運行。2015年6月,阿里云在中國香港也發生超過12小時停止服務的事件。其實在此之前,阿里云發生過多起網絡故障問題。
種種停機事和服務中斷故說明,現階段共有云在可靠性上存在很大問題,當然用戶和服務商不能回避云計算自身的問題,不能因為一次故障就全盤否認;但也不應該過渡追捧云計算。為了使公有云能更好服務大眾,共有云服務商可以考慮從技術手段做出改進,用戶也要重新審視什么樣的業務才適合共有云。
對云服務提供商來說,除了要考慮數據備份、容災,針對不同業務提供不同等級服務外,也要考慮重大災難或停止服務時,提供有效的數據應急手段,確保客戶能取回或遷移重要的數據。通過安全技術保證數據被泄漏的風險。通過提供專業服務能力,制定數據回遷策略和優先級。
此外,還要考慮如何短期內給客戶找一個數據新家(新云服務提供商)來存儲、保護這些云上數據;這也就要求云服務提供商首先是比較開放的,可以實現跨云數據共享和數據遷移。
對企業和組織客戶來說,在向公有云上部署業務、購買云服務時不能只依賴于一個服務商,需要介入多個云來實現更好的靈活性;確保數據在多個地區有多個副本,在保證數據可靠性的同時,享受數據本地化訪問的性能優勢;建議數據通過混合云的方式連接公有云,公有云只作為備份或非關鍵業務。
公有云服務對企業、組織用戶來說確實是個好事物,它既能提供廉價、免運維的低成本投入,也能按需投入、按需分配滿足不同業務要求。但凡是都有兩面性、公有云也是一把雙刃劍。要更好的使用公有云服務,那對客戶和云服務廠商都比要承擔自己的責任和義務。