網絡測試自動化是電信行業的熱門話題之一,數據中心網絡也不例外。
在特殊情況下,例如人們遇到的網絡故障情況,自動化網絡測試就顯得尤為重要,因為網絡運營和維護團隊可能被迫遠程工作。
完美的風暴
盡管整個行業普遍意識到網絡流量將繼續呈指數級增長,但沒有人預期(或至少已計劃)由冠狀病毒疫情引起的情況。
這些挑戰可能使人們感到頭昏眼花:網絡容量達到極限,供應鏈因生產/需求而陷入困境,以及負責使用網絡服務在家中啟動和維護網絡的團隊。發生故障時,這是影響網絡性能的完美風暴。諸如Netflix之類的內容,諸如Fortnite之類的交互式游戲,諸如Skype或Zoom之類的通信服務以及大規模的企業VPN訪問平均已將全球網絡流量提高了30%。這使服務提供商和數據中心網絡處于緊張狀態,幾乎沒有錯誤余地。
數據中心已準備就緒,可以在電源、冷卻甚至網絡連接等許多方面進行災難恢復。這在理論上通常是正確的。在現實世界中,即使采用冗余機制,中斷也可能對提供商及其客戶造成嚴重的業務影響。如果查看數據中心互連(DCI),則不再需要等待問題發生。
如果數據中心互連(DCI)光纖鏈路上的服務質量下降,則網絡管理系統將自動切換到另一條路由以安全地傳輸該流量-雖然它可能不是最快的,但是在負載平衡的情況下,它可能會將剩余的流量鏈接到其性能極限)。
因此,延遲性能在這里起著重要的作用。面對現實,沒有人喜歡重新路由,就服務可用性而言,這應該是最后的選擇。那么如何預見這種情況呢?如果光纖的任何部分損壞或僅表現不佳,則可能需要派遣技術人員到特定位置或數據中心。
這可能需要一些時間來安排工作人員進行故障排除,這就是人們所理解的平均維修時間(MTTR),并且可以很大程度地減少此響應的影響時間正在使組織的收入最大化。
測試自動化和可預測性的重要性
數據中心知道,要減少平均維修時間(MTTR)并在網絡中建立可見性,它們需要盡可能地集成和自動化網絡測試功能。由于業務影響未知,因此對網絡事件做出反應的風險太大,因此優秀策略是投資于網絡故障預防,以使用自動化測試功能來增加可見性和控制。
停電的成本很高(根據調查數據,平均每分鐘9,000美元)。目標是實現100%的網絡正常運行時間,因此投資網絡可見性不是一種選擇,而是必須的。
如果分析現在看到的典型網絡問題,那么仍然會在物理層中發現很大比例的問題。這些問題通常是由于外部因素和人們無法控制的。建立自動測試功能以主動測試光纖互連將有助于防止性能下降和最終停機。此外,至關重要的是要能夠監視實時網絡而不影響流量,即“服務中”測試。
但是故事還沒有結束。工程師可以使用這些功能來構建機器學習機制,從而以對網絡采取反應性測試方法無法實現的方式,基于網絡數據(光功率、鏈路降級、等待時間等)做出決策。同樣,人工智能算法需要數據,而網絡狀態數據完全不能從等式中排除。簡而言之,可預測性將成為新一代網絡向前發展的重要支柱。
以及這將如何影響網絡工程團隊?他們會消失嗎?絕對不是。總是需要人為干預,但要以更有效率的方式進行。如上所述,工程師等不及要等到網絡出現問題,他們的價值就不是花費數小時來隨機測試網絡,而是建立一個能夠做出明智決策以確保優質性能的更智能的網絡。
如今,數據中心大多數都與開放系統(開放硬件和軟件)一起使用,當遇到供應商之間互操作性以及其快速增長的網絡的可擴展性的障礙時,它們使他們的生活變得更輕松。工程師不僅要花時間優化網絡參數,還需要花時間建立測試自動化。網絡測試功能必須最終成為該策略的一部分,以集成網絡可見性和智能。
結論
數據中心運營商將繼續需要大量的網絡容量來支持其客戶。這將增加維護團隊的復雜性。最終,網絡測試自動化需要成為其網絡擴展計劃的一部分,以很大程度地利用人力和技術資源。人們再也無法承擔對網絡進行反應式測試的負擔,因此工程師將需要在其網絡擴展計劃中實施測試例程,以推動自動化并提高故障可預測性。