阿里巴巴的雙十一全球購物節近年來交易額逐年擴大,2015年的雙十一交易額達到了一個驚人的數字。4萬多商家和3萬多個品牌的參與,總計143億美元的GMV(同比去年增長60%),而通過移動端支付寶進行支付的占總GMV的68.7%。阿里巴巴的雙十一已經成為世界上單天交易額的最頂峰,很難相信,在2009年第一次雙十一的時候只有27個參與的商家。
在雙十一全球購物節期間,訂單創建的峰值一度達到每秒8萬個訂單,這給云計算基礎設施帶來了龐大的流量。為了解決與傳統云網絡相關的限制,提高與計算網絡的可伸縮性、可靠性、降低成本,阿里選擇了數據平面和控制平面分離的SDN技術來解耦底層網絡和Overlay網絡。
我們采用VXLAN和OpenFlow技術的Overlay方式,構建了穩定的、self-learning網絡拓撲和self-routing的傳統網絡轉發路徑,經過我們的實驗,我們發現它完全可以支持我們的混合云環境。
其實在15年5月的SDN大會上龐俊英女士就談到了阿里在SDN上的探索,她講到了在數據中心使用OpenFlow+VxLAN的驅動力。第一個是大規模部署的問題,在規模小的時候,二層就解決了,當到了一定的規模就會有人提到大二層的各種技術。當然這需要一步步的探索,現在一出門都是萬臺或者幾萬臺服務器的規模,任何一種純大二層的技術都不能好好的工作。還有很現實的一個問題,就是VM的遷移,一定要遷移怎么辦,這就需要從傳統的二層技術向Overlay變遷。第二個是擴展性的問題,如果采用一個一個小集群,那么池化能力一定會被降低,因此選擇是Underlay與Overlay的分離。公有云的規模交付如同流水線方式制造虛擬機,管理成本體現在供應鏈的能力、交付能力等等。網絡的彈性能力也成為了剛性需求,如何做自動交付和變更。第三個是混合云的存在,有的物理服務器不支持虛擬化,如果要和云之間連通,混合元就成為剛性需求。
該解決方案是分離轉發和控制的重要步驟,我們的分布式控制器提供了一個簡單的靈活的方式來管理和運營網絡,顯著的提高了穩定性和可用性。我們的云計算網絡實現了可編程、可伸縮、可定制的特性,而且它是開放的、硬件不可知的;它對我們避免廠商鎖定具有重要意義。我們的在這方面的經驗是在整個網絡的自動化函數中配置不同的流量,以此保證高可視化,我們可以在一年一度的雙十一和日常流量中有效管理不同數量的流量,包括峰值和谷值。
最重要的是,我們將這些轉化成了給我們客戶的便利。通過我們的解耦網絡,我們能夠為用戶提供高質量的購物體驗,2015年的雙十一能夠獲得巨大的成功,我們要感謝SDN。
作者:Zhihua Yang,阿里巴巴網絡架構組
原文鏈接:https://www.opennetworking.org/?p=1952&option=com_wordpress&Itemid=316