11.11,即“雙11”狂歡節,讓眾多的小伙伴們享受網絡購物盛宴的同時,也將阿里再次推向了輿論的高潮,阿里再一次創造了一系列令人感嘆的銷售數據:1分11秒破億,75秒移動客戶端破億,3分鐘超過10億,一個小時飚升到122億元,全天成交571億,這讓美國最大的網絡狂歡節“網絡星期一”都相形見絀,美國“網絡星期一”是美國最大的網上購物節,成交額為121億人民幣,還不到“雙11”的三分之一。巨額的成交量催生了一批的技術指標:訂單創建能力最高達每秒鐘8萬筆,支付寶在支付峰值突破每分鐘285萬筆,96%的訂單由阿里云聚石塔平臺完成,無一故障,無一漏單。這些漂亮的數據顯示出阿里數據中心超強的技術實力。
這兩年12306網站的表現和阿里的表現形成了鮮明的對比,雖然經過這兩年的改進,12306網站不至于攤掉,但是高峰期訪問體驗依然很差,系統異常慢,等反映過來時車票早已經沒有了,能搶到車票的人比中彩票還要幸運,車票少人多是一方面,數據中心的處理能力才是關鍵,那么究竟差在哪里?數據中心應對流量洪峰的能力是數據中心的一個重要技術指標,這個在網站建設初期都可能遇到,由于對流量的突發預期不足,造成在流量洪峰到來時系統崩潰。漏單、丟單的事情經常發生,甚至長時間無法交易。當年的“聚美優品”在做網絡團購營銷時就出現過系統癱掉的事情,沒想到會有這么大的突發流量,系統根本承受不了,本來可以通過團購大賺一筆,卻因為系統癱掉,還要安撫眾多的網絡小伙伴們。當然后來“聚美優品”對數據中心系統進行了全面的改造,后面的團購也搞得有聲有色。所以數據中心一定要對未來可能出現的流量洪峰要走預測和模擬測試,像阿里為了應對“雙11”,在5月份就部署了ODPS開放數據處理服務,可以在6小時內處理100 PB的數據,在雙11之前在數據中心內部做了8次的壓力模擬測試,已經對“雙11”可能出現的流量洪峰做了準確預判,這個對于數據中心部署非常重要,預測的流量洪峰越高,就需要數據中心部署更多的服務器,計算軟件都可能要進行修改。比如:假如阿里的支付軟件系統的處理上限是200萬筆/秒,但是通過以往數據,推斷支付的成交量可能達到300萬筆/秒,這需要對現有的支付系統進行優化,確保完成300萬筆/秒。所以預測的數值一定要符合實際,要準確,然后根據這個數值,如果現有的系統無法滿足,那么要重新設計數據中心的軟件和硬件系統。如果這個數值定的過高,意味著系統容量的浪費,給企業帶來承重的成本負擔。有了這個流量洪峰數值,還需要對新的數據中心系統進行反復模擬測試,現在通過各種測試軟件和測試儀器構造模擬的數據非常容易,那么就設計流量洪峰的數值流量對數據中心進行壓力測試,然后找出現有系統的漏洞,及時進行修補。這樣在真正的流量洪峰到來時,才能夠平安度過。我們可以看到軍隊每年要進行各種各樣的演習和訓練,目的就是練兵,以便在真的出現戰爭時,保持較強的戰斗力。作為一個優秀的數據中心平臺,模擬、演練應該是一種常態,以便能應對各種突發情況,流量壓力測試只是其中的一種而已。
當數據中心按照預測的流量洪峰做好全面部署,并且也挺過了壓力測試,也不是就萬事大吉了。像12306網站的春運,阿里的“雙11”都有明顯的時間性,在那個時間點必然流量洪峰會來,而數據中心一般都有成千上萬臺設備,一旦趕上設備硬件故障,必然造成業務受影響,所以還要考慮備份,以防萬一。阿里采用異地雙活的數據中心,可以確保一個數據中心故障,另外的數據中心還可以接管業務,流量平滑過度不中斷。12306網站還不具備這樣的能力,所以之前出現了機房斷電就導致整個網站無法訪問了。雙活或多活數據中心部署要耗費大量的財力和技術,阿里能玩得起,作為國家政府的鐵道部卻玩不起,也許是劉部長的原因,你懂的。不管怎樣,備份技術是數據中心保持業務不中斷的基礎,在設備上,機房上,甚至數據中心上都要有備份,可以做到整個數據中心備份的才是數據中心發展的終極目標。
擁有了業務備份的能力還不夠,還要有能做事的人,這個最是關鍵。數據中心建得再先進,如果沒有人會管理也是一堆設備,只有讓人充分使用起來才會變得有血有肉。阿里的人力儲備當然不是12306能比的,每年阿里在高校中用高薪搶走了最優秀的畢業生,并用很好的福利激發員工的創造力和工作激情,這一切都是12306所無法比擬的。這樣的一批人對數據中心的理解深入人心,才能設計出可靠、穩定的系統,尤其是關鍵時刻“雙11”的保障上。其實模擬測試的再完美也不是實際,等到了“雙11”還是會出不少的差錯,這就考驗了這些人的能力。由于這些人都是身經百戰,對數據中心的運轉了如指掌,哪里出了異常幾分鐘就可以排除。據說阿里在“雙11”之前假象了近500個突發的故障,如何解決都想好了方法,這樣才在“雙11”到來時有效應對,這又怎么能是12306能做到的。阿里在“雙11”加班加點甚至熬通宵的員工達到1.1萬人,這樣的人力投入也是12306所望塵莫及的,更何況這些員工都是技術優秀,年輕有為的。
以上的簡單對比可以清楚看出,到處都是差距才造成了數據中心之間的天壤之別。其它的數據中心也一樣,衡量一個數據中心的能力,除了各種設備技術指標,人才是關鍵,有了會做事的人,數據中心才能變得優秀。