宇宙射線會觸發路由器 bug?眾所周知,宇宙射線可以嚴重影響電子設備,但是宇宙射線影響路由器數據流量丟失這樣的說法是否缺少論據?或許思科另有說辭。
故事是這樣的:
Reddit網站的一位網友提了個問題:“有人曾經在軟件錯誤報告中看到是由于宇宙射線引起的 bug 嗎?修復辦法是重新下載線路卡,然后問題就解決了,有人有類似的經歷嗎?”
下面是幾位網友的回復。
“前空軍司令部工程師在此!宇宙射線本身是合理的存在,但由于沒得到很好的解釋,所以遭到了人們的誤解。通過雜散背景輻射內存中的比特發生翻轉也是有可能的,然而很難找到這樣的翻轉是在何時何地發生的。同時,宇宙輻射不會在一個特定的位置,它可能撞擊到機身或者其他部位。糾錯碼內存正嘗試解決這個問題。我也遇到過這種情況,這個時候你需要讓工程失效分析來幫你看一下硬件是否有問題,如果反饋沒問題的話,那就應該是軟件出錯了。”
另一位網友認為“宇宙射線問題現在還沒有引起嚴肅重視”,他說:“我也親歷過宇宙射線給管理者帶來的麻煩,雖然還不知道這是怎么一回事,但是我完全理解你要處理這堆麻煩的悲催心情。”
還有一位網友說他看到過亂碼:“我也遇到過類似的事情,當我看見亂碼的時候我只是笑了一下,因為沒有人會相信這是由輻射造成的。”
從二十世紀九十年代起,思科已經在 Ars Technica 論壇上不止一次說過宇宙輻射是罪魁禍首了,即使這樣的言論一發出就遭到輿論的質疑。
那么思科會如何回應呢?宇宙射線真的是罪魁禍首嗎?又或許他們的解釋只是一個煙霧彈?思科需要給出解釋,并且社會上相關專家也承諾給出合理解釋。
思科回應道:“盡管我們不能說明這個問題,但是早在 2001 年我們深入研究了宇宙射線對服務提供者網絡硬件、系統結構和軟件設計等的影響。”
既然這么說,思科想必是有備而來。果不其然,思科在 2012 年的一篇博客中指出,“為了減小輻射單粒子翻轉的影響,我們利用定制的芯片和軟件優化了技術,并且新增了可恢復性這一特點。”
那么宇宙射線到底是如何影響電子設備的呢?雷鋒網對此篇博客進行了編譯,全文如下:
這周我們看到了近十年來最大的一場太陽風暴,這樣的太陽活動會引起像北極光這樣的地理現象,然而能造成電子磁場風暴的劇烈的太陽活動不僅損害電子輸送系統、影響衛星運轉還能影響靈敏的電子設備。例如,在 1989 年,宇宙輻射導致魁北克(加拿大一個省份)電網癱瘓,整個城市陷入黑暗之中。宇宙輻射對于衛星和太空飛行器是一大難題,但單粒子翻轉真的會影響到地面上的電子設備?隨著電子產品運行速度的提高(超過 10G)和硅芯片密度的增加,宇宙射線很有可能影響路由器或網關的性能,我們最大的挑戰就是找到防止單粒子翻轉的辦法。
思科在 2001 年開展了如何能防止宇宙射線產生影響的研究,尤其是對像 3 號計算機預訂系統這樣的重要系統產生的影響,我們甚至采用了粒子加速器來長期模擬宇宙射線的影響。有一個重要發現,僅僅做一些小的改變是不夠的,構建一個可以從地面上撞擊實物、到系統正常運行以及軟件聯合應用的系統是十分有必要的。為了驗證我們的設計,我們測試了競品在相同的加速狀態下的性能。
幾位思科的現員工和前員工 Allan Silburt , Shi-Jie Wen, David Ward, Adrian Evans 和 Dean Hogle 在《 IEEE 核工程學報》上發表了一篇名為《Specification and Verification of Soft Error Permormance in Reliable Internet Core Routers》的文章,如果你是 IEEE 的會員就可以免費下載這篇文獻(DOI:10.1109/TNS.2008.2001742)
這篇文章指出想要獲得良好的效果就要搞清楚系統的硬件是如何運作的,還要有相應的設計方法學,這種方法學應該包括定制的硅芯片、軟件以及可恢復這一特性。正是由于思科在特定用途集成電路、系統構架、軟件設計等方面的創新,使得宇宙輻射對重要的服務提供平臺的影響降到最低。
從網絡計算機到身邊的手機無一不表明了我們的生活越來越依賴電子網絡設備,所以加強網絡可信度對我們來說是十分重要的。
所以宇宙輻射真的會引起網絡設備爆炸嗎?如果是思科經手的,我保證肯定不會(強行植入廣告,老板給紅包嗎)。