導語:在IT領域,哪些災難性的損壞影響最大?應該采取哪些預防措施?
核心信息:
1. 模擬災難,驗證和提高當前設備抗災能力。
2. 停電是每一家服務供應商不愿看到但又無可奈何的事態。
寒天催日短,風浪與云平。在上一周,天黑的越來越早。再加上初冬的一場大雪更加讓人們感覺到冬天的嚴寒。作為一名技術人在周末的雙十一敗家之后想想自己的網站如何應對大規模的訪問量爆發?閑話不多說,先來看看上周發生的那些事吧。
颶風桑迪:曼哈頓數據中心的災難應急方案
颶風、地震、海嘯讓我們的數據中心變得脆弱,當這些災難來臨時我們應該如何應對?作為運維人員的我們又將如何保護好脆弱的服務器?不久前颶風桑迪襲擊了美國東海岸,在曼哈頓的運維工程師是如何保護服務器的呢?
在曼哈頓下城區,颶風的影響令電梯無法正常工作,Peer 1 Hosting公司的管理員們不得不用大桶為位于18樓的柴油發電機補充燃料。而在新澤西州,SunGard公司則緊急規劃燃油車行進路線,避免車輛為洪水所困。
黃石超級計算機的主要用途是對實體系統進行數值模擬,比如大氣和海洋等。對本次颶風的預測就是由黃石氣候研究所的超級計算機進行模擬的。“你需要更高的分辨率來準確地判斷(一場颶風的)強度,還需要大量的統計信息來預測(颶風)將襲擊哪些地區。”羅夫特解釋道。在經歷過颶風之后我們走進幕后英雄黃石超級計算機。
從Amazon停機事件說起:故障不可避免 風險管理常備
不論是不可抗拒的自然災害還是人為災難,當服務器宕機之后總是會引來很多爭論。Amazon網絡服務停機最近鬧得沸沸揚揚,客戶以及作為競爭對手的其它云服務供應商紛紛指責Amazon店大欺客、穩定性毫無保障。
但在批評聲當中,CIO.com網站專欄作家Bernard Golden卻挺身而出,認為云計算故障不可避免,奉勸大家以平和心態對待停機事故。作為云計算的天敵,停電是每一家服務供應商不愿看到但又無可奈何的事態,但云計算自身所具有的低廉成本、易于冗余等優勢很可能成為未來對抗停機的有力武器。