企業網D1Net 9月4日 21世紀是一個數字化、網絡化、信息化的時代,全球各種信息數據在飛速的增長,這讓數據中心不堪負重,所以這幾年各地都是著力建設大型數據中心,并對原有的數據中心不斷進行擴容,提升數據中心的帶寬以及數據處理能力。然而,數據量的增長比我們預計的還要快,從2005年到2011年,全球數據量增長了8倍,達到了千萬億兆的數據量,未來數據量仍將持續高速增長,每兩年就會翻一翻,預計到2020年,全球的數據量將達到35ZB,這是什么概念呢?如果用4TB的硬盤來存放這些數據,則需要80億塊。這還僅僅是存儲數據量,還沒有包括一些計算處理過程中的數據,訪問的數據以及臨時生成的數據等等。為了滿足這些數據計算、傳輸、訪問等需求,數據中心就要不斷地進行擴容,甚至建設新的更大的數據中心,好不容易建設好的數據中心卻也僅能滿足二三年的數據處理需求,還得不斷地擴容,這也是全球一片數據中心建設熱潮產生的根本原因,因為有越來越多的數據需要處理。
海量數據運算、存儲及交換是數據中心所需的三大核心功能,數據中心需要不斷地增加服務器和存儲設備的數量,擴大網絡帶寬,從而滿足海量數據運算的需求。現在32核服務器技術成熟、40G/100G網絡設備也已經普及,這些為提升數據中心的處理能力提供了技術基礎。在目前的技術發展水平來看,如果數據中心需要更多的計算能力或者網絡帶寬,則只能通過增加設備的數量,并行運行來提升整體的數據處理能力,因為再高的64核技術仍不成熟,400G的網絡標準還沒出爐,這樣擴大數據中心占地面積,增加設備數量是目前唯一提升數據中心處理能力的方法。正是基于此,數據中心被建設得越來越龐大,擁有上萬臺服務器的數據中心已經變得屢見不鮮,這些龐然大物消耗了大量地球上各種寶貴的資源,產生了一系列新的問題。為了應對這個信息大爆炸的時代,數據中心真的只有擴容這一招了嗎?答案是否定的,依然有很多其他的技術方法可以改善大量數據處理的問題。下面就介紹幾種:
減少重復、垃圾、臨時數據傳輸
其實不難想象,雖然全球的數據量在高速增長,但實際上其中重復數據占據了很大份額。比如:我們要在網絡上看一個在線電影,后臺實際上是在我們和數據中心之間建立了一個網絡連接,然后將電影拷貝到了本地電腦的內部緩存中,進行實時下載與播放,如果同時有一萬人在觀看,那么要消耗大量的網絡寬帶資源,而實際上為了加快訪問的速度,數據中心在很多地方都有分中心,電影會復制到距離訪問用戶最近的數據中心,這樣就可以節省網絡帶寬資源,但是消耗了數據中心的存儲資源,這些保存在各個分中心的數據就是重復數據。我們經常將各種數據拷貝到本地保留,或者放在自己的油箱或者私有云中,這樣占據了大量的存儲空間,這些重復數據占據著大量的存儲資源。從技術上來將,可以將這些數據采用索引的方式進行保存,比如當我們從某個論壇復制了一個文件保存到自己的網絡云盤中時,后臺只將這個文件的關鍵索引進行復制,保存到云盤中,這樣可以大大節省存儲空間。當要訪問時,通過實時網絡傳輸的方式打開,這可以大大節能存儲空間,不過對網絡帶寬的要求要高些。在這些數據中還有很多垃圾數據,我們經常說手機又收到了垃圾短信,電腦里有大量無用的信息,這些都是垃圾數據,但是卻占用了大量的存儲空間,個人使用的存儲設備要經常進行刪除,更新,對于數據中心就是要經常檢查那些不被訪問的數據,要及時清除,訪問量低的數據要限制其訪問帶寬,將資源預留給其它數據。服務器的回收站、網絡設備的Flash都要周期性地進行清理。數據中心要完成網頁訪問、視頻播放、計算、存儲等各種各樣的業務功能,在這個過程中也會產生很多臨時數據,這些臨時數據若不能及時清楚,也會占用數據中心的網絡帶寬和存儲資源。對數據中心的數據進行有效區分與管理,區別對待,就能有效提升數據中心的處理能力,減緩數據中心資源的枯竭。
用高效報文協議替代TCP
TCP/IP協議是數據中心網絡的技術標準,為了將一個文件從一個服務器傳輸到另外的服務器上,需要通過TCP/IP協議來進行傳輸,其將一個文件分割成了若干個報文,而報文的格式就是TCP/IP協議所定義的。因為我們將一個文件分割成報文后,需要增加報文頭,否則網絡設備不知道這個報文要傳輸到哪里。報文頭里定義了這個報文的轉發路徑,以便收到這個報文的所有網絡設備都知道要將這個報文送到哪里。這樣問題就來了,一個報文的頭就要40字節左右,而如果是傳輸的一個報文內容只有20字節,報文頭的內容都比內容多,報文的長度規定是64字節~1536字節。這樣對于小字節的報文,網絡開銷就非常大,可能一多半傳輸的都是報文的頭部內容,因此縮減報文頭部長度,減少網絡開銷也是一個方法。比如對于具體業務,可以改四層TCP傳輸為二層MAC傳輸,直接將報文頭部內容減少兩層,現在提倡數據中心建設大二層的網絡,也是考慮了報文長度開銷問題的。采用MPLS VPN轉發替代傳輸的TCP四層轉發,這樣的好處是MPLS VPN采用標簽轉發,不再關心IP頭和TCP頭的內容,轉發效率高。不過這種方式也增加了報文的長度,會多4字節的標簽長度,和提升轉發效率相比,增加這4個字節標簽長度是值得的。TCP協議的特點是可靠傳輸,有確認機制來保證報文的完整,這樣在數據傳輸時,就需要先建立TCP連接,傳輸過程中有丟包,還要重傳,這樣的實現機制使得數據轉發的吞吐量會受到限制,在存在網絡丟包時,傳輸的機制就加重網絡擁塞(因為要反復重傳報文),每個報文來回都要有確認機制,這都大大增加了網絡開銷,因此在數據中心急需出現針對TCP傳輸的替代方案。因此,這幾年也出現了VXLAN大二層技術、MPLS技術等替代方案,也有有些考慮更改TCP協議參數或者擁塞控制算法、優化應用層數據傳輸模式、增加交換機緩沖區和使交換機支持顯式擁塞標記等辦法來解決TCP協議的問題,從而提升數據中心網絡帶寬處理能力。
需要高效的壓縮技術
視頻數據是消耗網絡帶寬的最大元兇,視頻數據量非常大,若是同時傳輸很快就會將網絡帶寬占滿,因此急需一些高效的壓縮算法,減少傳輸過程中的數據量,尤其對于現有的高清數據,壓縮算法尤為重要,一個1G的電影,若能通過壓縮,傳輸只需要500M,那么就能節能一半的網絡帶寬,而視頻數據也是最容易通過壓縮算法實現數據量大幅減少的。
以上介紹了很多關于從數據特征上來減輕數據中心網絡負載的方法,很多方法實用而且簡單,值得在數據中心中推廣,減緩數據中心建設的速度。數據中心建設晚一點,產生的效益就會多一點,相信任何人都能夠算清楚這筆帳,通過提升數據中心網絡帶寬的軟實力,將可為數據中心帶來獲益。