云負載均衡的關鍵在于為客戶交付可擴展和可靠的服務,可是很多云提供商需要現代化其負載均衡器和應用交付控制器的方法。
亞馬遜Web服務(AWS)在圣誕節平安夜經歷了年度第四次宕機,由于誤刪除其彈性負載均衡(ELB)服務配置文件導致此次宕機,該項服務位于北弗吉尼亞的數據中心,主要負責應用到不同計算硬件負責的分布式輸入數據,提供商在AWS網站上的事件總結中如是寫道。
一旦AWS斷定超過6%的負載均衡器不能適當的運行,就關閉剩下的負載均衡器,阻止它們影響其他的。同時客戶在AWS云中沒有可用的負載均衡技術,大多數對于高調的AWS失望,比如向網飛這樣的公司。失敗導致視頻流媒體提供商四小時局部宕機,其用戶嘗試通過一些其他設備訪問網飛的流媒體視頻,該公司在12月24日的推特中說道。
盡管人工錯誤不能完全根除,但是云提供商可以對其應用交付控制器(ADC)和負載均衡器采取不同的策略,比如通過虛擬設備和改善自動化給客戶更多的控制。
云負載均衡:客戶主掌控制權
亞馬遜的ELB服務是一種多租戶服務。當AWS經歷硬件失敗時會影響一些客戶,但不是數據中心的全部客戶。但是很多服務提供商為其客戶推薦的負載均衡是作為專用服務的,可以由客戶代替提供商進行部署,Riverbed Technology Stingray業務部門產品和市場副總裁Apurva Dave說道。
“盡管一些提供商提供完全的管理方法,他們可以獲得全部的所有權,包括網絡和應用交付,一些云提供商正在選擇讓其客戶通過那些工具的虛擬實例訪問這些功能,”Sam Barnett說道,他是Infonetics Research數據中心和云的執導分析師。
Joyent是位于舊金山的云提供商,并且是Riverbed的客戶,為其客戶提供從Stingray產品線通過提供商管理的服務,比如亞馬遜ELB或者客戶控制和管理的服務來訪問虛擬應用交付和負載均衡,Joyent CTO Jason Hoffman說道。
亞馬遜ELB服務共享的架構時平安夜宕機的應先各因素,Hoffman說,“取代了整體的服務和所有客戶的擴展,云提供商可以在一個服務失敗時在每一個用戶的基礎上雇傭一個服務,就不會有級聯效應。”
“如果Joyent的客戶有自己的Stingray軟件實例,客戶能夠控制,會影響其他客戶的因素就不會影響數據路徑,盡管他們是多租戶基礎架構,”他說。
更多自動化 更少失敗風險
在客戶的云基礎架構上授權客戶更多的控制是清除級聯失敗的一種途徑,但是配置變更和管理網絡元素并不一定是用戶的職責。
“這實際應該是關于提供商的政策和規程怎么樣的東西,才能最小化失敗的影響,或者阻止偶發的配置變更失敗,”Infonetics的Barnett如是說道。
云提供商需要更多的自動化和變更管理減少導致失敗的錯誤的風險。Infoblox是一家美國的網絡管理廠商,提供NetMRI,這是針對企業和服務提供商的一種網絡確認自動化工具。
NetMRI能夠追蹤所有配置、移動和部署變更,并追蹤到導致這種變更的員工,Infoblox CTO Stu Bailey說道。該工具也旨在自動化任何云提供商人工每天做的配置流程。
云環境中還有很多流程沒有自動化,Bailey說,“這也是網絡基礎架構和Web服務領域中的多學科自動化需求的增長趨勢。”