存儲群集失去電力支撐和Azure閃變是導致此次故障的原因。
在本周三、周四,使用微軟Azure存儲服務的用戶在提供新資源或訪問他們現有資源時遇到了困難,故障時間長達8個小時。周三晚上,Azure存儲也進行了短時間的“罷工”。
第一次降壓嚴重影響了其服務所覆蓋的美國東部地區,微軟的狀態頁顯示:“它影響了虛擬機Azure媒體服務、應用程序洞察、Azure邏輯應用程序、Azure數據工廠、Azure站點恢復工具、Azure緩存服務、Azure搜索、Azure服務總線、Azure事件中心、Azure SQL數據庫、API管理和Azure流分析。”
雖然第二個事件發生時間較短,但影響更廣:微軟表示,由于底層存儲事件,遠在印度的用戶將遭受配置存儲“故障”。
微軟Azure的初次遭遇與Amazon WebServices的“S3-izure”驚人的相似,它也在美國東部的一個地區。但與S3-izure不同的是,此次微軟的事件并沒有產生多大影響,沒有引起像之前亞馬遜事件后的那種“我的天哪,一切都讓人失望 ”的恐慌。
此次微軟Azure服務的中斷事件也沒有引起用戶的強烈不滿,有兩個明顯的原因:第一,這不是一個像S3-izure完全中斷的事件。Azure存儲用戶可能會有一個不太穩定的體驗,但他們沒有理由停止使用;第二,中斷事件出現在周三晚上21點50分,東部時間大約下午6點,不是在需求旺盛的時候。
這些因素意味著:微軟Azure的中斷沒有引起極大的關注的是一個奇跡,其云服務不受歡迎,并且還將會錯過或因為性能不穩引來批評。當然這樣說可能不太友善。
但事件發生的根源——“一個存儲集群失去了電源,變得不可用” ——表明Azure可能沒有出色的彈性。然而,電力中斷卻是云運營商無法控制的。比起亞馬遜AWS的程序員輸錯一個字母引起的服務癱瘓事件,微軟Azure的中斷事件更容易讓人接受。