問(wèn)題:全球WAN升級(jí)很需要服務(wù)提供商的三層VPN MPLS服務(wù),但一些站點(diǎn)中一直受到高性能路由和可用性問(wèn)題的影響。在一些從原來(lái)WAN基礎(chǔ)架構(gòu)遷移過(guò)來(lái)的站點(diǎn)(主要是新興市場(chǎng))的網(wǎng)絡(luò)路由問(wèn)題報(bào)告中,諸如應(yīng)用程序超時(shí)、響應(yīng)速度慢和完全斷線等越來(lái)越普遍。這些站點(diǎn)都是基于低速P2P線路、幀中繼和IPsec/互聯(lián)網(wǎng)VPN等網(wǎng)絡(luò)結(jié)構(gòu)。
許多時(shí)候人們經(jīng)常質(zhì)疑是服務(wù)提供商的線路或設(shè)備故障引起了問(wèn)題,但是有時(shí)候我們會(huì)被告知問(wèn)題只是“暫時(shí)性的”或者“沒(méi)有發(fā)現(xiàn)問(wèn)題”。遇到這樣的情況,我們的運(yùn)營(yíng)人員登錄到一臺(tái) CPE路由器,然后發(fā)現(xiàn)MPLS PE路由器上包含了BGP路由,因此所有的流量都被丟棄了,包括PING流量。運(yùn)營(yíng)人員手動(dòng)關(guān)閉連接提供商的CPE WAN接口,使站點(diǎn)從MPLS網(wǎng)絡(luò)切換到傳統(tǒng)的WAN網(wǎng)絡(luò),從而使服務(wù)恢復(fù)正常。這個(gè)問(wèn)題引起了我們主管的高度關(guān)注,因?yàn)榘言芯W(wǎng)絡(luò)作為備份網(wǎng)絡(luò)需要開支。而且許多此類站點(diǎn)都是無(wú)人看管的,它們?cè)诎胍惯€會(huì)執(zhí)行一些批處理應(yīng)用程序。
是否有一些技術(shù)或解決方案能夠自動(dòng)檢測(cè)和處理這類網(wǎng)絡(luò)路由問(wèn)題?我們了解BFD,但是似乎這是一個(gè)專門用于鏈路的解決方案,有一些提供商不支持。我們的運(yùn)營(yíng)人員考慮采用GRE通道疊加技術(shù),但是它會(huì)顯著增加網(wǎng)絡(luò)復(fù)雜性,而且還會(huì)影響我們重點(diǎn)部署的MPLS VPN。
回答:似乎您遇到了通常所謂的“管制”或“黑洞”問(wèn)題,其表現(xiàn)是MPLS核心網(wǎng)絡(luò)的問(wèn)題影響到了終端用戶,但是未影響到CPE路由器本身。這些問(wèn)題都經(jīng)常出現(xiàn)在3層VPN網(wǎng)絡(luò),而在傳統(tǒng)P2P或覆蓋(幀中繼、IPSEC)WAN部署的概率則較小,這是因?yàn)榉?wù)提供商增加了一個(gè)路由層的緣故。由于任何兩個(gè)CPE站點(diǎn)都不會(huì)建立直接路由,所以它們必須使用MPLS/VPN網(wǎng)絡(luò)的PE路由器發(fā)出的控制面板信號(hào)。這比設(shè)計(jì)很差的服務(wù)提供商網(wǎng)絡(luò)還要慢很多。
FD(雙向故障檢測(cè))無(wú)法解決您的問(wèn)題,這點(diǎn)您說(shuō)對(duì)了。它只支持直接相鄰的“存在性”檢查,而不能檢測(cè)確定端到端路徑完整性。在CPE路由器之間部署疊加的GRE通道肯定是一種檢測(cè)問(wèn)題的可行方法。在通道中,可以使用GRE持久連接或優(yōu)化路由協(xié)議來(lái)檢測(cè)性能問(wèn)題和執(zhí)行故障恢復(fù)。然而,正如您所說(shuō)的,這類設(shè)計(jì)會(huì)增加復(fù)雜性,而且在一些特定平臺(tái)的硬件上,由于需要分片和無(wú)法轉(zhuǎn)發(fā)數(shù)據(jù)包,它會(huì)影響性能。
有一個(gè)可供參考的解決方案是高性能路由(Performance Routing, PfR),其前身是最優(yōu)邊緣路由(Optimized Edge Routing, OER)。高性能路由集成了思科IOS解決方案,它使用嵌入式思科智能IOS特性來(lái)改進(jìn)應(yīng)用程序性能和可用性,從而優(yōu)化傳統(tǒng)路由性能。經(jīng)過(guò)配置,PfR就能夠在網(wǎng)絡(luò)出現(xiàn)問(wèn)題,或者用戶定義策略影響特定WAN出口性能時(shí),監(jiān)控IP流量流,測(cè)量WAN路徑性能和動(dòng)態(tài)重定路由流量。基于IOS報(bào)告源的實(shí)時(shí)反饋信息,如NetFlow數(shù)據(jù)記錄、IP SLA統(tǒng)計(jì)信息和WAN鏈路使用率,PfR能夠作出智能路由決策。這樣就可以實(shí)現(xiàn)傳統(tǒng)路由協(xié)議(OSPF或BGP)無(wú)法實(shí)現(xiàn)的感知應(yīng)用程序的路由功能,因?yàn)閭鹘y(tǒng)路由協(xié)議只支持一維的“最佳路徑”選擇。
根據(jù)在CPE路由器上運(yùn)行的硬件和IOS級(jí)別,您可能只需要在CPE路由器上啟用PfR屬性,然后定義一個(gè)性能策略,監(jiān)控端到端的路徑可用性。當(dāng)來(lái)自Netflow或IP SLA的反饋信息表明出現(xiàn)了管制或黑洞狀態(tài)時(shí),您就可以將流量重新轉(zhuǎn)發(fā)到傳統(tǒng)網(wǎng)絡(luò)。這是報(bào)告非常有用的特性。