我們都知道,大數據通常與數據中心不斷增長的結構和非結構化工作負載相關。而網絡負責處理傳輸到服務器、存儲陣列和云服務的數據流量。服務器之間的密集型I/O吞吐量常常發生在數據中心或者廣域網之間。伴隨著大數據的來臨和應用的不斷增長,新的問題將會出現。由于傳統的IT設施在當初設計的時候,沒有考慮到大數據的情形,瓶頸問題將變得更加普遍,尤其是在存儲一端,問題更加明顯。
這樣一來,IT業務中就會出現一種新的分支:面向新一代數據中心的數據管理。下面,我們就給大家介紹大流量阻礙數據中心發展的幾大緣由:
一、大流量是一種新型工作負載
大流量是指橫跨廣域網連接的數據中心內服務器間的通信流量,它不同于通常情況下的大數據工作負載——也就是用戶對機器或者機器之間的通信流量。
二、傳統IT不能勝任大流量要求
導致大流量出現的主要原因是IT過去幾年所形成的優勢:虛擬化的廣泛部署和擴展系統;遠程實時遷移;數據復制和備份;專門針對基于WAN分布式系統而編寫的尖端應用,比如Hadoop, MapReduce, MongoDB和Cassandra。
三、大流量增長沒有止境
大流量增長沒有具體的指標可供參考,它的增長將永無止境。Forrester Research預測說,在未來幾年,由機器運行產生的應用數據將達到50%的年增長。而且,存儲巨頭EMC官方發布過一份報告,認為在2009至2020年間,將實現44倍數據擴容,這意味著數據帶來的流量增長將是一個巨大挑戰。
四、大流量對IT人員影響巨大
不斷增長的大流量將對大型組織機構的影響最為深遠,而在其中,尤以生產一線的工人、CIO、CTO、存儲管理員、災備和服務器工作人員、網絡管理員和數據中心管理員等受影響最大。
五、數據中心和管理面臨考驗
日益增長的大流量將會給企業的數據中心及其管理帶來嚴峻考驗,因為它們需要解決傳統和當前二者不同情形的數據傳輸過程中的問題。而且,還需要確保系統中基本的數據存儲和訪問功能正常運行。這些,將直接影響到業務的連續性、災備和關鍵業務運行。
六、如何優化現有的系統
可能的解決辦法包括擴充現有網絡帶寬、重復數據刪除、壓縮和精簡配置軟件。數據中心也考驗使用傳統的WAN優化軟件,使用應用加速解決方案,或者針對這種新型的大流量特點開發新技術。
七、解決方案面臨的現實問題
某些解決方案在某些情況下不可能得以執行。比如,如果數據中心彼此相隔遙遠,有效的優化方案實際效果可能并不明顯;或者,服務商不能為站點之間提供足夠的帶寬。
八、網絡優化的相關問題
當企業對其網絡的帶寬和安全性進行優化,CIO和CTO需要事先知道對網絡和數據中心帶來何種影響。比如,在舊有系統中引人新軟件,可能會出現不能與其他舊軟件或者上一代版本軟件實現兼容的問題,而這容易引發系統崩潰。
九、優化的常規指南
企業該對如何界定數據,以確保優化方案能在IT運營中無縫執行。考慮的因素應該包括:部署的難易程度、完全透明的網絡滲透、與現有系統的兼容以及低功耗。
十、大數據未來情形
未來數據將不斷增長,數據中心靜態運算和存儲資源將被傳送到統一的資源池中,以省時省力的經濟方式充分利用虛擬化和云服務,從而減輕內部數據中心的工作負載。