大數據是云計算發展的自然結果,可以說大數據是廣義云計算的一部分。所以,我們可以回到云計算領域去探討大數據對數據中心場地基礎設施的影響。有很多資深的數據中心專家會有這樣的感覺,如果把他帶到一個正在運行的數據中心里而不告知任何有效信息,面對一排排的機柜,他根本無法分辨這是“云數據中心”還是“非云數據中心”。云技術更多的是體現在服務器運行的軟件中,而場地基礎設施層面為數據中心提供的基本功能則是一致的。
但在這里需要引起重視的是,大數據和云計算對數據中心場地基礎設施的建設的確是有影響的,這種影響更多地體現在宏觀規劃層面。數據中心場地基礎設施的宏觀規劃最核心的兩個重點是“可用性等級”和“容量規模”。首先是按照業務要求確定數據中心需要達到的可用性等級,體現出來的建設指標如“按照國標A級或按照UptimeTierIII進行建設”,當然,對大規模數據中心可以有不同可用性等級模塊的組合方案。而容量規模可分解為電量、面積、制冷量三個指標,對新建數據中心而言,制冷量可以按照IT電量進行配套設計,因而核心指標是電量和面積,電量與面積之比即為功率密度。容量規模體現出來的建設指標如“總IT電量1萬KW、功率密度7KW/機柜”等,當然不同模塊可以設置不同的功率密度以適應不同的業務需求。
從“可用性等級”和“容量規模”兩方面著手,大數據和云計算對數據中心場地基礎設施建設的宏觀影響大致有如下幾個方面:
數據中心單體規模變大,小規模數據中心的數量減少
當前歐美地區新建數據中心也均以大型云計算數據中心為主,以提供新型的IaaS、PaaS等作為發展方向,中國也在跟進這一趨勢。截止2010年底,美國大于2,000平米的數據中心已經超過570個,而我國數據中心數量雖然已經接近45萬個,但超過2,000平米的數據中心僅有50個左右,不足美國同等規模數據中心的9%。我國數據中心發展水平與歐美尚有差距,而大數據與云計算的應用與深化將是推動我國數據中心發展的一次良機。
數據中心場地基礎設施的可用性等級不再片面追高
因為有云計算在軟件層的冗余,人們發現在場地基礎設施層面片面追逐高等級是不劃算的。一個典型的例子是eBay,eBay由原來所有數據中心Tier4級別轉變為20%Tier4和80%Tier2,建設成本和運維成本減半,依然可滿足業務發展所需。
單機柜功耗走向高密度
與傳統計算相比,大數據與云計算意味著功率密度的升高,這是建立在IT設備標準化基礎之上,追求運維成本最低的自然選擇。eBay曾經做過評估,在業務量一定時(每天支持的交易量固定),機柜密度越高越省錢,直到28KW/機柜(超過此密度后,空氣散熱無法滿足需求,機柜內部必須采用液體制冷,會導致成本大幅上升)。但中國的現狀不同,雖然也在走向高密度,但高的程度卻比較溫和。
從下表內容可以看出中美數據中心的需求和理念的差異以及所導致的設計差異。雖然時常在媒體上看到國外某些大型數據中心令人心動的超低PUE,但我們必須意識到中外國情不同,國外的方案不能簡單地復制到中國。
我們要借鑒歐美數據中心成功的建設經驗,并結合我國的國情才是我國政府和企業發展、建設和布局數據中心的最佳途徑。經過上述分析,我們提出如下大型數據中心設計的關注點,以滿足大數據和云計算時代的需求:
可用性-滿足業務對可用性的需求,區分不同業務的不同可用性需求,不片面地追逐更高的可用性等級;
靈活性-能夠有效地支持未來業務的需求,通過模塊化設計方法,統一規劃設計,分步實施。采用設計技術手段,在一定范圍內實現可用性等級和功率密度的可變特性;
經濟性-以總擁有成本TCO(建設成本+10年運維成本)評估方案,選取TCO最低的方案。PUE最低的方案不一定TCO最低;
節能環保-通過提高能效降低長期的運營成本,在業務可承受的風險范圍內,采用創新的節能技術;
可管理性-用智能系統和監控技術手段,實現自動化運維管理,用以有效支撐數據中心越來越大的規模,減小單位設備運維人員數量,減少人為錯誤的發生機率。