微軟公司的研究人員日前揭開新建的“云規模”仿真器的面紗,研究人員建該仿真器的目的是要完全消除公共云網絡出現中斷。
仿真器名為CrystalNet。在本周于上海舉行的2017年ACM年度操作系統原理研討會上,CrystalNet是該次活動討論的主要議題之一。
微軟移動暨網絡研究團隊的著名科學家主管Victor Bahl表示,CrystalNet是兩年多的研發工作成果。他在博文中解釋說,CrystalNet的設計信念是,在云網絡出現問題前發現問題并采取主動的措施。 Bahl和他的同事接著很快就認定,測試的最好方法是建一個云網絡仿真器。
Bahl 表示,“部署之前先測試,這是個老辦法,但微軟研究院在兩年的研究里考查了各個大型云提供商記錄的中斷情況,我們相信,如果我們先在一個相同的網絡副本上驗證生產網絡,就可以發現大多數潛在問題。“
CrystalNet和微軟生產網絡是相同的,因為CrystalNet用了和微軟生產網絡相同的網絡拓撲、硬件、軟件和配置。CrystalNet可以在虛擬機內的仿真設備上運行,并且還支持大多數常見網絡設備的軟件映像。
微軟提供了以下的CrystalNet架構圖:
諸如CrystalNet的仿真網絡的真諦在于,微軟的Azure工程師可以用CrystalNet測試在計劃的更改和更新中出現的問題,而不是直接實施更改和更新,然后希望不會出現什么大狀況。一些大的公共云供應商就是直接實施更改和更新,出大狀況是經常的事。 Bahl表示,用上CrystalNet后,微軟的工程師可以“降低網絡出嚴重狀況的可能性”,更新時有時會出現嚴重狀況。
早期的結果看起來還不錯。 Bahl表示,微軟Azure團隊已經利用CrystalNet驗證了一些新的網絡設計、架構更改、硬件和固件更新以及網絡配置更改。微軟還利用CrystalNet成功地構建和測試了旗下的云開放網絡軟件(Software for Open Networking in the Cloud)。云開放網絡軟件是一款網絡交換機操作系統。
盡管CrystalNet測試取得了成功,但也有專家表示,CrystalNet可能無法防止各種各樣的中斷。Constellation研究公司副總裁兼首席分析師Holger Mueller表示,微軟試圖解決一些Azure云以前遇到的網絡中斷問題雖然是件好事,但要防止離線還有許多其他方面需要考慮。
Mueller表示,“在部署前進行仿真和測試是確保正常運行時間的正確方法,但測試終歸只是測試。能夠在本地測試并即時回滾是確保正常運行時間的關鍵點,但回滾功能仍然是大多數基礎架構即服務提供商需要開展的一個重要的工作方面,特別是在網絡基礎架構更新方面。
至于這種有美好前景的新技術何時以商業軟件推出,Bahl沒有說。但他確實也提到,一些Azure客戶已經表示有興趣將CrystalNet用于防止自己的網絡出現中斷。微軟在考慮將CrystalNet上架出售前極有可能會先將CrystalNet整合到Azure云里。