今年以來的各項重大事件和活動的直播,例如央視春晚、全國兩會、世界杯等活動和體育賽事,都有著來自于金山云的保障,保證了海量用戶的觀看需求。歷經直播重保實戰考驗的金山云,可以說在直播保障方面,有著領先的技術和豐富的經驗。其中,創造了高層次觀看體驗的世界杯直播保障,就是一個非常典型的例子。
一組金山云在保障期間創造的數字,證明了世界杯直播保障工作的成功:峰值帶寬3個T、流量命中率99.65%、卡頓率小于1%、主要質量指標優于客戶要求50%以上、整體保障質量名列前茅。
央視網對金山云的保障工作給予了高度肯定。在世界杯服務感謝信中,央視網寫道,“貴公司作為央視網的視頻CDN供應商,在此次世界杯的轉播報道中鼎力支持,特別是在帶寬儲備資源、駐場重保支持上為我司保駕護航”。
央視網給金山云的感謝信
由于娛樂屬性強,又有著傳播快、受眾廣泛的特點,世界杯直播顯得相對特殊,保障工作相對難度較大。與其它項目不同,為世界杯做直播保障,時間長、任務重,這表現在多個方面。例如,賽事直播首先要為用戶帶來優質視聽體驗,如何避免高并發產生的卡頓、丟包情況出現?如何能夠提前對直播所需的帶寬進行準確評估,針對直播覆蓋的區域進行帶寬調整,最大程度上避免流量緊張?如何對直播形成的峰值帶寬壓力形成穩定支撐?對于世界杯這樣的賽事,應該為客戶提供怎樣的服務,才能保證直播的安全和高效?設備故障的應急處理應該如何實現?
對于這些問題,金山云的直播保障團隊,用三招給出了讓客戶滿意的答案。
三招神助攻:百萬直播保障背后的架構
成功保障離不開金山云深厚的技術和資源積累。為了世界杯直播,金山云的團隊運用了多種技術手段,保證了直播的觀看體驗。
金山云直播源站及轉碼集群架構圖
首先,金山云為客戶搭建了多個直播源站及轉碼集群。在央視和金山云的直播源站的基礎上,為每個源站配備轉碼,金山云這一集群支持央視網世界杯期間的內容直播,RTMP/FLV拉源流,轉碼處理后支持央視HLS/HDS/FLV拉流。同時配備容災主備解決方案,可在搭建的多個源站之間互為備份,實現秒級切換。
金山云CDN邊緣節點可實現對直播內容的預拉取
第二,金山云采用了CDN邊緣節點對直播內容的預拉取。即能夠早于客戶一秒拉到直播內容,保證用戶觀看流暢。由于HLS屬于切片式直播,正常情況下HLS直播內容相對于直播現場的內容有幾秒到幾十秒的延遲,在此過程中,金山云提前先將直播內容拉到離用戶最近的邊緣節點上,這樣的預先拉取比起請求回源,延遲可大幅降低,大大提高了用戶的播放體驗。同時,金山云在邊緣節點處設置有“大腦”,負責內容的分發,保證負載的均衡性,提供最大的服務能力,減小上層源站的壓力。
金山云智能調度系統架構圖
第三,金山云在直播保障過程中,采用了智能調度系統。這一系統是金山云自主研發平臺,負責直播保障過程中智能調度策略的實現,它有三大功能模塊——“負載均衡器”、“鷹眼”、“智能閥”。
在高峰時段來臨時,一旦CDN邊緣節點負載過大,就需要調度更多的邊緣節點,問題也隨之而來,在眾多邊緣節點中,需要將誰的流量調走?調多少?調到哪里?這時,“負載均衡器”就會按照任務的優先級做出排名,對此進行計算。
對于調多少流量,調到哪里,“負載均衡器”能夠實現自動調整。調到哪里,會根據帶寬圖,判斷在哪里有服務,在判斷需要調多少流量之前,“負載均衡器”會計算節點帶寬和節點的流量承載能力,如何才能不超過節點的流量安全水位線,從而實現既將流量水位降到安全標準,又能夠將其它節點的影響降到最小。
智能調度系統的其它兩大功能模塊——“鷹眼”和“智能閥”同樣值得一提,它們是智能調度系統的左膀右臂,為精準流量調度護航。
發揮左膀作用的“鷹眼”,是金山云自主研發的網絡實時監控平臺,通過它可監測到直播數據的流向,包括中上層源的切換之后數據流向的監控,包括所有節點的帶寬水位、機器的負載、業務的QPS在線人數、錯誤率、慢速率,可細化到每個省市。便于及時摘掉宕機的節點,如果出現節點帶寬不夠的問題,平臺自動調量,同時進行回源鏈路的優選,源站有故障或質量不好可瞬間切換。
而扮演右臂功能的“智能閥”,為流量調度提供靈活可控的策略,它可根據世界杯比賽產生的實時帶寬數據進行資源動態調整,將閑置資源分發給直播重點內容,并且保證提供給世界杯直播的帶寬可獨占專享,其它直播業務無法占用,而且在流量峰值時,會預留鎖定量,不會出現帶寬緊張的問題。
在世界杯直播保障期間,團隊先是用“鷹眼”監測數據,看數據有沒有達到“水位”,如果“水位”將近,“智能閥”將開啟,提前預警和分配資源,再由智能調度系統調整流量的走向。
眼下,金山云的服務團隊正在按照重保方案,對亞運會直播保障進行演練。“不止亞運會,在接下來的一系列為央視網做直播保障的任務中,由于經驗的不斷積累,就算世界杯或亞運會每個月舉辦一次,我們同樣會保障好”,團隊的一位成員這樣說道。