某地科技網匯聚層的一個節點位置處安裝了一臺寬帶接入服務器,平時該網絡接入用戶的數量非常大,為了保證接入連接的穩定性,該網絡特意使用雙線路將寬帶接入服務器上連到兩臺核心交換機設備上,雙連接線路采用的是千兆光纖鏈路,該網絡路由采用的是靜態路由尋址方式。在組網建設時,考慮到在正常狀態下用戶接入連接的流量比較大,為了有效分攤流量,該網絡特意選用兩條千兆光纖鏈路來實現負載均衡的目的:當其中一條千兆光纖鏈路出現意外不能正常工作或其上鏈的交換機設備遇到故障的時候,所有寬帶接入流量應該能夠自動切換到另外一條千兆光纖鏈路上,從而實現冗余路由保護的目的,這樣就能確保寬帶上網用戶始終可以正常地上網。組網建設任務完成后,調試效果符合既定的建設要求。
初遇無法自動切換
最近一段時間,通過寬帶接入服務器訪問科技網的不少上網用戶反映,現在的上網速度明顯不如以前那樣正常,打開一個不包含圖象、多媒體信息的普通頁面,也需要很長時間才能完成;使用ping命令測試目標網站的地址時,結果發現數據丟包率非常嚴重,有的時候達到了50%,很明顯該寬帶接入網絡存在明顯的故障現象。為了快速弄清楚故障原因,網絡管理員立即使用telnet命令遠程登錄到核心交換機設備的后臺管理界面進行詳細檢查,結果發現該寬帶接入服務器到核心路由器設備的某一條上連千兆光纖鏈路已經被down掉,不過這個時候網絡路由并沒有自動從故障光纖鏈路切換到正常工作的那條光纖鏈路上,難怪寬帶接入存在50%的數據丟包現象。
無法自動切換之謎
為了確保寬帶接入用戶能夠快速正常上網訪問科技網,網絡管理員只好先調整一下核心設備中的路由參數,適當降低了與故障通信鏈路有關的靜態路由訪問優先級,確保網絡路由都能正常通過另外一條工作狀態正常的光纖鏈路,完成參數修改任務后,寬帶接入用戶果然能夠正常上網訪問了。
后來,網絡管理員特意模擬科技網的實際工作環境,架設了一臺交換機設備,并通過備用的光纖鏈路實現了雙線路上連交換機的目的,在兩臺核心交換機設備上分別設置一條靜態路由連到該新架設的交換機上,同時將與故障光纖鏈路所連的交換機互連端口工作狀態設置成“shutdown”,這個時候再檢查新架設交換機上的對應路由狀態時,網絡管理員發現它也已經處于down狀態了;而故障光纖鏈路所連的核心交換機,雖然對應交換連接端口下面的虛擬工作子網已經被down掉,不過連向新架設交換機的靜態路由記錄仍然存在。
詳細對核心交換機設備中的配置參數進行檢查之后,網絡管理員發現本地科技網中使用的核心交換設備與其他地方的科技網有明顯不同的地方,經過省科技網與省電信之間的網絡調整,本地科技網的核心交換機設備直接與本地電信網絡的高端路由器保持連接,核心交換機設備上連運行BGP協議的路由器,通過網絡直接將本地路由表中的記錄內容引入近來。不過,在嘗試通過網絡引入本地路由記錄時,一定要事先在路由表中存在才行,不然的話是不能正常引入的;但事實上,路由表中只存在一些具體的路由記錄,而沒有聚合路由記錄,為此網絡管理員特意設置了一條連向null0交換接口的路由來欺騙邊界網關協議,從而借助網絡配置,使得邊界網關路由器成功把聚合路由記錄引入其中。
這個時候,故障就完全顯現出來了,當科技網匯聚層的某條光纖鏈路突然中斷斷開之后,運行BGP協議的路由器中存在的一條連向null0的靜態路由記錄始終處于up激活狀態,而靜態路由在訪問優先級方面又比其他路由高,為此在與故障光纖鏈路所連的核心交換機設備上就會始終存在一條連向null0的靜態路由記錄。而前期進行的寬帶接入改造工程測試,恰好是在省科技網與省電信之間的網絡調整之前,當時根本沒有連向null0的靜態路由記錄,所以當時測試結果一切顯示正常。
由于靜態路由的訪問優先級在所有路由當中是最高的,考慮到這一點,網絡管理員立即修改了核心交換機設備中的路由參數,將連向null0的靜態路由訪問優先級別稍微降低了一下。如此一來,當科技網匯聚層的某條光纖鏈路突然中斷斷開之后,對應該鏈路的核心交換機設備就能自動借助OSPF路由協議從另外一臺核心交換機設備上學到。完成了連向null0的靜態路由訪問優先級調整任務后,網絡管理員重新進行了一次測試,結果發現冗余路由成功進行了自動切換,這說明到了這里,上述故障現象已經被順利地解決了。
最后的小結
在進行類似科技系統之間的縱向網路由配置過程中,很容易發生網絡配置相互影響的現象,而這些現象在某一時段內對網絡的運行影響暫時看不出來,這也提醒了各位網絡管理員,一旦網絡中出現了某些調整之后,我們應該及時對一些重點的網絡接入項目進行測試,確保可以在最大程度上將網絡中存在的隱性問題暴露出來,從而有針對性地加以研究解決。