2013年,由于火災、洪水、電力以及軟件更新等熱門事件的發生,引起了眾多數據中心出現停機故障。故障主要覆蓋范圍包括云計算、企業、網絡支付、政府、州以及相關地方。每起事件都給客戶和終端用戶帶來了不少麻煩。但這也促使我們吸取經驗教訓:完善數據中心和應用程序,使其變得更加可靠。以下分別列出了 2013年的十項重大停機事件:
1. Healthcare.gov:聯邦政府的在線保險網站已經成為IT領域出錯的一個典型事件。這次事件已經不單單是一次簡單的停機事件。該故障導致了一系列的硬中斷和軟中斷,最終使該網站的功能幾乎全部喪失。聯邦政府曾嘗試增加更多硬件設施來做彌補,但該網站在十二月初直到奧巴馬管理的“IT團隊”正確定位軟件和解決數據瓶頸時才恢復其功能。之后,又通過正式成立醫療改革法案以及政治審查,該網站的性能才趨于完備。恢復之后的網站在一些會導致系統崩潰的關鍵點上加強了防備。Healthcare.gov轉換Web站點性能這一這一事件應該是本年度的新聞頭條。
2. BlueHost、HostGator和HostMonster的重大停機事故:2013年8月2日,由位于美國猶他州的數據中心所支持的幾大全球知名品牌遭受停機事故,這也是2013年度波及范圍最廣的一次重大停機事故。該事故是由Endurance 國際集團在猶他州普羅沃的一個設施故障所引起,直接對其客戶BlueHost、HostGator和HostMonster造成了重大影響。此次事件歸因于Endurance服務器常規維護的硬件故障,但卻直接迅速波及整個網絡系統。
3. Visa停機事件橫跨整個加拿大:2013年1月28日當天,Visa卡暫停服務,促使加拿大人民無法進行網絡交易,給當地金融業帶來了巨大的損失。該事故歸因于TSS(Total System Services Inc.)的一個數據中心的崩潰,直接影響到加拿大商業銀行、加拿大皇家銀行以及道明加拿大信托銀行。
4. Xbox One產品艱難發行:2013年11月,Xbox One產品成功發行,這對于協助于權威Xbox Live的Windows Azure云計算服務來說是非常不易的。早前,該平臺一直被各種問題所困擾,其中包括存儲和網絡問題。但這并不是微軟云操作平臺的唯一一次瓶頸。2013年3月,某款軟件的更新失敗直接影響到其數據中心,最終使得微軟的基于Web的電子郵件服務系統中斷,Hotmail與Outlook.com同時離線長達16小時。
5. 停機故障導致DreamHost客戶離線:2013年3月20日,虛擬主機提供商DreamHost歷經了一次長時間停機故障。該事故歸因于美國加利福利亞州爾灣的數據中心的電力系統故障。此次停機事故持續兩天,直接給DreamHost的35萬多客戶造成影響。
6. 亞馬遜云計算服務未免其難:微軟并不是唯一一家遭受停機故障的云服務商。2013年,亞馬遜出現了幾次非常重大的停機故障,其中最嚴重的一次發生在8月份,這次事故對Amazon.com主頁和AWS雙方都造成了嚴重影響。9月份,連續的網絡問題已經引起了AWS的第十三次停機故障,繼而直接影響到由 AWS提供服務的Heroku、Github以及其他網站。早在2012年圣誕前夕,亞馬遜由于一起重大停機故障導致其平臺關閉,這起事件甚至影響到 Netflix。而亞馬遜在2013年度的表現相對于2012年來說已經具有顯著提高。
7. 數據中心所引發的火災導致美國密歇根離線:2013年4月17日,一場火災直接摧毀了位于美國密歇根州馬科姆縣的數據中心,導致當地IT服務中斷。馬科姆縣位于底特律西部,擁有85萬居民人口。此前,馬克姆縣并沒有備份數據中心,當地官員只能采用筆、紙、復印本以及筆記本電腦試圖為網絡做臨時維護。目前該網絡仍然處于中斷狀態,但新的網絡運營中心有望在近期上線。該州政府和馬克姆社區學院也伸出了救援,幫助其恢復運營。
8. 多倫多洪澇災害擊垮科斯數據中心:一場巨大的暴雨導致多倫多遭受洪澇和停電災害,這也給處于全市最大的數據樞紐中心的居民們帶來了不小的挑戰。而多倫多供電公司暫停供電時,位于151街道的一家酒店則采用發電機供電。然而,此次洪澇災害仍然導致了一系列問題,一些數據中心并不能幸免于難。
9. 美國新澤西州數據中心停機故障:2013年9月,美國新澤西州的數據中心暫停為一些國家機構服務,包括美國機動車委員會和一些州的官方網站。新西澤為州和當地政府提供的服務記錄中已經存在一條最差記錄,而在2013年1月和8月又連續出現兩次長時間的中斷故障。
10. 雅虎艱難度過12月:上周,雅虎郵箱連續四天出現一些功能性問題,而雅虎首席執行官 Marissa Mayer對此已做出道歉。Marissa Mayer說,“本次停機事故比我們想象中的要嚴重很多,我們花了好幾天的時間來恢復系統功能”。雅虎本次事件歸咎于存儲系統一個罕見的硬件故障。