轉眼又到春節,又到了親朋好友大團圓的時刻。但對程序猿和攻城獅群體來講,能否安安穩穩的過年就主要取決于網絡是否安穩了。前不久,在某公司的年會上,因為某云服務商光纖中斷導致攻城獅集體掏出筆記本在年會現場辦公,不僅插排用光而且連抽獎都沒抽到。騰訊云讓你安然應對各種春節網絡突發情況。
2016是公有云快速發展的一年,然而在市場繁榮的景象下也隱藏著諸多隱患:2016年9月,廣東電信光纜中斷,導致A服務商BGP網絡服務中斷異常;
2016年10月,北京電信骨干網故障,導致A、U服務商BGP網絡服務中斷;
2017年1月,架空光纖撞斷,斷導致U服務商BGP網絡服務中斷...
BGP網絡故障給云計算客戶帶來了巨大損失,而大部分服務中斷,都被公有云服務商解釋為運營商網絡故障導致公有云停服。雖然運營商對網絡故障中斷負有直接責任,但是公有云的網絡服務能力只能做到這樣了嗎?
當然不是。
其實不僅是網絡故障,據統計全國范圍內三大運營商每周會出現3~7次的核心網絡變更,每次網絡變更都可能對BGP網絡質量造成影響。傳統IDC服務商和云計算服務商通過同地域BGP出口做跨運營商的網絡流量調度,一定程度上解決服務中斷的問題,但一旦網絡故障、變更發生在業務高峰,還是會出現跨運營商互聯帶寬飽和導致的BGP網絡時延、丟包無法控制的問題。
騰訊云依托15年的BGP網絡運營經驗,精打細磨,在面臨國內交叉復雜的網絡環境中,修煉出一身基于SDN的跨地域網絡調度能力,保障了包括微信、QQ在內的億萬用戶良好的互聯網通信體驗,今天小編將為您一一揭秘這個隱藏在騰訊云穩定網絡背后的神奇武功!
所謂天下武學神功,修煉之前要求基本功扎實?;竟]有練好,直接上神功經常會導致走火入魔,最終自取滅亡。(比如,把光纖架在空中就是基本功不扎實的一種體現)在修煉SDN網絡調度這門高級武功之前,我們已經用了10年時間,做好了以下幾項基本工作。
基本功1:Tb級BGP網絡出口,21路運營商聚合
所謂巧婦難為無米之炊,沒有BGP出口就不要做公有云。騰訊云在全國各個地域擁有Tb級的BGP網絡出口帶寬,聚合21路運營商接入資源,保障了用戶即使面對微信春節紅包這樣500Gbps入流量的洶涌攻勢,也可以從容應對,絕不抖動。
基本功2:Tb級骨干承載網,連接全球BGP網絡出口
沒有連接的BGP帶寬出口,好像戰場上被分割的孤島,一方有難就有難了,沒有相互支援。騰訊云Tb級骨干承載網,連通了騰訊云在國內的各大BGP網絡出口,各個地域互為POP點在單地域故障時可以實現流量切換。
基本功3:多維網絡監控模型,全局網絡監控告警
一方面,騰訊云具備面向全國的網絡撥測和自動化告警,從網絡層面感知網絡運營情況;另一方面,基于騰訊云具備獨家的基于QQ收發信息狀態的統計信息,可以快速定向判斷全球網絡點對點的網絡質量,先于網絡層感知網絡異常,快速定位問題。
修煉好以上三門基本功,基本可以開始乾坤大挪移——基于SDN網絡調度的內功修煉了。
在啟用SDN網絡調度之前,騰訊云已經具備了基本的BGP流量調度能力,當某地域單運營商故障或變更時,可以通過人工配置的方式將路由切換至相鄰的BGP網絡出口。
以騰訊云上海為例,如果上海電信網絡變更會導致業務停服3個小時,我們可以手動停止上海的接入路由器發放騰訊云路由,這樣所有訪問上海的用戶流量會通過廣州或北京的BGP流量入口繞行至騰訊云骨干承載網,連接至公有云服務。
這樣的操作需要人工實現,而且路由切換一般為全局切換,即全國訪問上海公有云的服務都會被切走。這樣的流量切換在小業務規模時還是ok的,當業務規模增大,網絡運營精細化后,按需的自動化網絡流量切換就成為必須。
如上圖所示,我們采用全局的SDN網絡控制器連接全地域BGP接入路由器。網絡管理平面一方面接收全局的網絡監控告警,獲得全地域的網絡資源和告警信息;一方面通過SDN控制器,向全國范圍內的接入路由器下發按需的路由和選路控制。
系統可以預設網絡優化算法,為不同選項(包括ISP優選、本地優先、區域優先、AS PATH最短優先、網絡資源使用率、網絡時延優化等)賦予不同權重求和給出最優配置方案,推送人工進行審核,人工審核通過后即可自動化下發網絡調度命令,支持包含主機、網段、區域、AS號、運營商等多維度的調度策略。
SDN網絡控制器采用異地容災部署,通過公司骨干承載網互聯,支持HA(High availability)以及ISSU(In-Service Software Upgrade)。所有基于ODL控制器的BGP流量切換都是秒級操作,保證切換操作中用戶連接不中斷,實現精細化的按需的無感知的網絡運維。
目前現網運行的SDN網絡調度功能每月調度30次以上,平均每次調度時間2.5小時,幫助用戶每月規避網絡異常超70小時以上,大幅提升了騰訊云公網BGP質量。騰訊云將持續優化網絡架構和SDN網絡調度策略,為用戶提供穩定、可靠的、無感知的BPG網絡服務。