從平日辦公收發(fā)電郵,到閑暇的時候進行網(wǎng)購,或和親友分享假期的各種精彩照片,我們創(chuàng)造的“云計算”對日常工作和娛樂都提供了不少便利,甚至在醫(yī)療衛(wèi)生、社會保障和政府機構職能等領域,人們都越來越傾向于利用互聯(lián)網(wǎng)的數(shù)字傳輸來開展工作。
可是,我們應該警惕的一點是,隨著現(xiàn)代人比以前更依賴于網(wǎng)絡傳輸,網(wǎng)絡的弊端會漸漸顯現(xiàn)。傳輸系統(tǒng)往往就像一張“百家被”,各類網(wǎng)絡服務在里面七拼八湊,而這些相互聯(lián)通的網(wǎng)絡服務又分別由形形色色的公司和行業(yè)合作機構提供。
在這種互聯(lián)互通的環(huán)境下,如果其中一家的網(wǎng)絡服務出了故障,其他公司的服務就會被殃及。
最近就有個現(xiàn)成的例子:即時通訊軟件Skype宕機幾乎整整一天;與此同時,F(xiàn)acebook也宕機了一個多小時,而且是在一周內第二次出現(xiàn)這種故障。這意味著,在此期間,許多依靠Facebook賬戶驗證用戶身份的網(wǎng)站也無法正常登陸。
對廣大網(wǎng)民和不少網(wǎng)站來說,失去Facebook這個接口確實比較麻煩。而一旦那些重要的醫(yī)療和社保服務系統(tǒng)或能源供應管理系統(tǒng)受到干擾,那帶來的真是不得了的麻煩,可能足以對一國經濟和國民的生活質量帶來真正的負面影響。
幾周以前,四次雷擊造成比利時電網(wǎng)停電,谷歌設在當?shù)氐臄?shù)據(jù)中心europe-west1-b也暫時斷電。事發(fā)后,盡管大部分服務器都利用備用電池和冗余電量維系短期用電,但還是給硬盤空間造成了約0.000001%的損失。乍看起來,損失比例微乎其微,可鑒于谷歌存儲數(shù)據(jù)浩如煙海,這樣的比例意味著數(shù)個GB到幾十GB的數(shù)據(jù)丟失。
這次事件的教訓是,我們不能無條件地信任云服務供應商來存儲個人數(shù)據(jù)和提供備份服務。就算有了云計算備份,你也需要另做備份。這次事件還教會我們,依賴導電金屬長距離輸送的供電系統(tǒng)很容易遭到雷擊破壞——比我們想象的更容易。
Facebook outages last 24 hours Facebook的宕機事故持續(xù)了24小時,最高峰時有569例故障報告。
停電了,怎么辦?
前美國國防部長威廉·科恩(William Cohen)日前明確指出,美國國內電網(wǎng)難以抵御大規(guī)模斷電的打擊。他說:“恐怖分子很有可能襲擊國家電網(wǎng),而這種打擊會導致從東海岸到西海岸的大面積混亂。這是很有可能發(fā)生的。”
我曾經當過電力工程師。對于科恩的上述警告,我認為完全可以理解。美國需要強大又安全的供電系統(tǒng),而無論多強大的控制系統(tǒng)都有可能出故障。為重要設備設置替代或者備用電源的做法并不少見,因為隨時可能因為某些供應點斷電釀成意外事故。還是那句:即使有了備份也要再做備份。
無論何時,只要有部分電網(wǎng)斷電,整體供電網(wǎng)絡都會設法給那部分電網(wǎng)另外提供電源來彌補其缺失。因此,供電系統(tǒng)要有冗余電力儲備,還要設置監(jiān)控與控制系統(tǒng),以在出現(xiàn)故障時及時應對,保障電力的均衡供應。
科恩擔心的是,大范圍停電可能引發(fā)社會動亂。前美國國土安全局局長詹尼特·納波利塔諾(Janet Napolitano)表示,電網(wǎng)遲早會遭遇網(wǎng)絡黑客攻擊已是板上釘釘,剩下的只是時間問題。
前美國國國家安全局高級分析師皮特·文森特·普瑞(Peter Vincent Pry)甚至認為,如果對美國供電網(wǎng)絡發(fā)起攻擊,可能“奪去90%美國國民的生命”。
眾所周知,電磁脈沖(EMP,比如核武器在空中爆炸)會造成巨大的破壞。如今有許多人覺得,通常所說的工業(yè)控制系統(tǒng)——即SCADA,數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)——具有通過網(wǎng)絡彼此聯(lián)系的復雜特性,這可能成為重大風險。
2003年8月14日美國東北部地區(qū)斷電就是這種潛在風險的一個例子。當時,該地區(qū)265家獨立發(fā)電廠的508部發(fā)電設備因此受到影響,停電波及美國八個州的4500萬人和加拿大安大略省的1000萬人。然而,這次事件僅僅源于俄亥俄州一個控制室的警報系統(tǒng)存在軟件漏洞,未能警告操作者系統(tǒng)發(fā)生超載,由此產生了系統(tǒng)故障的連鎖效應。事后花了兩天才恢復供電。
生活在網(wǎng)絡時代,人們越來越依賴互聯(lián)網(wǎng),也創(chuàng)造了提供冗余路徑以保障點對點傳輸?shù)木W(wǎng)絡,但是供電故障還會讓核心路由系統(tǒng)失靈。
控制系統(tǒng)是最薄弱的環(huán)節(jié)
基礎設施最不顯眼的環(huán)節(jié)往往最容易遭到攻擊。舉個例子,數(shù)據(jù)中心的空調故障可能導致溫度過高,高溫就會熔毀設備,特別是用于存儲海量數(shù)據(jù)的磁帶驅動器。這就可能影響價值幾十億美元的巨額銀行交易或是一個繁華城市的交通路徑,或者造成一個急救服務呼叫中心癱瘓。
人們越是依賴數(shù)據(jù)和數(shù)據(jù)處理,在它們出現(xiàn)故障時就越容易蒙受損失。為保證數(shù)據(jù)安全,安全關鍵系統(tǒng)一般會配備故障保護控制機制。但是,這類機制也可能遭遇攻擊,任攻擊者為所欲為。
人類創(chuàng)造了云計算,又越來越依賴它,然而它并沒有我們想象的那么強悍。互聯(lián)網(wǎng)的性質以及我們使用網(wǎng)絡的方式仍有限制,事實上并不像我們設計時設想的那樣分散。我們依然在很大程度上依賴于一些關鍵的物理地址,即數(shù)據(jù)和網(wǎng)絡節(jié)點的集結中心。因此,倘若有人圖謀不軌,在某些關鍵點制造一些不可接受的故障,那或許就會引起多米諾效應般的大崩潰。
DNS(域名服務)基礎設施是尤為薄弱的環(huán)節(jié)。畢竟,全世界只有13個根域名服務器,它們就充當著全網(wǎng)地址簿的總列表。
我認為,目前各國政府對這一問題考慮還不夠透徹。如果沒有電力供應,互聯(lián)網(wǎng)不能正常聯(lián)通,云計算便無從談起。而失去云計算,人類社會就會出大麻煩。(本文編譯自愛丁堡龍比亞大學計算機學院Bill Buchanan教授的評論文章,中文版首發(fā)鈦媒體)