數據中心的建設是一個整體結構,任何一個細節規劃忽略都有可能導致問題的發生,規劃設計的優劣,也只有在系統運行后才能做客觀的評估,很多問題要經過較長時間,甚至是設備或系統的一個生命周期內才能暴露出來。因此,為避免數據中心建設完成交付后,因建設時未考慮周全出現的問題造成工期延誤而需要返工,以下是確保數據中心規劃設計人員堅持正確方向的關鍵問題:
1、你需要多少個機架?它們的尺寸是多少?
機架的數量決定數據中心的空間需求。傳統的IT機架的尺寸為600x1000mm(寬x深),而一個空間為100平方米的機房可以容納大約50個機架。當然機架也有其他的尺寸,而知道機架的尺寸和機架的數量,就很容易估測你的數據中心所需的空間。
2、你需要什么等級的數據中心?
數據中心的Tier等級確定了數據中心的冗余要求和電源分配路徑。對于一個Tier2級數據中心來說,部署“N+1”架構的電源和冷卻設備的冗余是足夠的。然而,對于一個Tier3級的數據中心設施,通常都會包括“N+1”冷卻設備冗余,具有雙供電2N電源冗余,以及獨立的雙路配電機架。因此,了解數據中心的等級可以決定你需要的冗余設計。
3、每個機架平均功率密度是多少?
要注意的是,當你設計數據中心的電源容量時,應該根據平均功率密度,而不是在最大額定電源,這是很重要的。機架的平均功率密度乘以機架的數量才是數據中心的最大IT負載量。然后,再加上數據中心的電源系統,冷卻系統和交換機和存儲設備等設施的功率。為了避免產生昂貴的成本,并充分利用電力系統,使數據中心具有大小合適的電源和空間,采用模塊化策略是明智的,可以降低成本,而不必犧牲未來擴展的靈活性。
4、數據中心的交流機架或直流機架需要什么級別的備份電池?
服務器機架可能需要部署百分之百的直流電源,或百分之百的交流電源,或者是二者的組合。例如,如果您正在為托管目的建設數據中心,你可能有配備交流(UPS)供電系統的需求,而如果是要成為一個電信設施,這可能需要部署直流電源系統。知道這些,就會知道你所需要的直流電源或UPS電源系統的大小和規模。
在部署備份電池時,最好根據15分鐘備用放電時間進行配置。這樣部署備用電池,不會顯著增加資本支出,雖然這將很難自圓其說,但這更符合成本效益。企業需要提高備用發電機組的冗余度,而不是在增加電池數量浪費更多的資金。
5、數據中心將建在哪里?
分析新建的數據中心所在地的氣候條件是十分重要。這將有助于確定最合適的冷卻措施,其中包括水冷機組,機械制冷空調,自然空氣冷卻、間接空氣冷卻,絕熱冷卻等,這些都是為了數據中心設施實現其更低的PUE目標。
6、在脫離實際需要和可行性情況下可以確定高指標么?
在規劃設計初期,主觀臆斷確定數據中心的功能指標,不切實際地一味追求規模大、高可用性等級、高機架功率密度、低能耗指標PUE,而具體規劃設計時,又沒有嚴格按照規劃原則和程序做詳細的論證,具體方案和實際措施與總體規劃部匹配,其結果是:
1.由于實際需要不明確,缺乏可行性的必要條件,反復設計、修改,不僅造成成本的浪費,還大大延長了建設周期;
2.已建成并投入使用的機房得不到充分利用,究其原因或因無預想的業務需求量,或因機房條件不滿足用戶需求而必須進行再優化改造才能使用;
3.規劃設想的功能不能實現,諸如系統可用性達不到規劃等級、制冷方案不支持規劃的機架高功率密度、發電機不支持系統連續運行條件、過度規劃使系統能耗指標PUE居高不下等。
7、業內普遍存在著輕規劃設計,重施工建設的認識誤區?
業內特別是用戶信息主管存在輕規劃設計,重施工建設的認識誤區,主要表現在:
1先建樓體結構,后規劃數據中心,為數據中心規劃設計帶來難以克服的困難;
2.機房建設和設備安裝完畢即開始改造的現象普遍存在;
3.先確定設備,再確定方案,由于所購設備功能不滿足方案要求,或場地不滿足安裝條件要求,因而設備尚未運行就要更換;
4.建設結構很難滿足數據中心場地布局要求,使機房分區規劃不合理;空調室外機無法安裝或距離太遠;動力室與主機房距離太遠,增加傳輸和管理困難,增加成本,降低可靠性。
8、業內普遍存在著重設備,是否會忽視系統的認識誤區?
業內特別是規劃設計人員普遍存在著重設備輕系統和重局部忽視大局的現象,主要表現在:
1.先確定設備規格型號甚至生產廠家,然后根據設備選擇或修改設計方案;
2.供電系統按最高可用等級2N冗余設計,但所設計的結果是僅僅UPS系統有2N功能,而整個供電系統卻存在單路徑故障點;
3.整個系統按最高等級冗余容錯系統設計,但是空調制冷設備卻是單路徑供電;
4.為系統配置了交流備用能源柴油發電機,但發電機沒有自動啟動功能,因為規劃設計者缺乏連續制冷也是系統連續運行的重要條件的認識。
9、對可用性設計是否缺乏科學依據?
系統可用性是數據中心規劃設計的最重要的指標,但規劃設計時缺乏科學依據;主要表現是:
1.數據中心在規劃設計時都會進行各系統可靠性的推算,但目前各設計院、不同的設計人員對可靠性的推算依據和數據來源尚未統一,造成對同一數據中心的設計等級和可靠性存在不同定義和不同的結果;
2.對可用性存在著先進行規劃設計、施工,建設完成后再反推設計等級的案例,并以反推的等級標準向數據中心用戶進行推介。此為本末倒置的設計,往往因為設計中的某些關鍵缺陷導致雖然絕大部分設計滿足等級要求,但因為關鍵缺陷的存在造成等級下降;
3.只注意設備或環節(子系統)的可用性,而忽略在整個系統中各子系統之間的相關性對可用性的影響。
10、普遍忽視對系統可維護性和可修復性設計
系統三分建設、七分維護,任何設備都是有故障的,可修復和可快速修復已經成為提高可用性的關鍵指標,忽視可維護性和可修復性的現象表現在:
1.規劃設計階段未考慮后期維護通道、維護空間,例如設備距離墻壁太近,電池靠墻擺放,線纜布局不合理、線纜管路或走線架擋住上方弱電線槽導致后期無法維修、維護工具難以施展等;
2.故障發生時,應急物資和備件無法快速搬運,故障設備和器件更換無維修操作空間等問題,延誤了故障處置時限甚至引發重大事故;
3.應考慮后期發生故障進行設備維護時系統的冗余保障能力;
4.盡可能采用自動化手段,最大程度壓碎維護人員手動操作環節,在數據中心維護操作中,依靠維護人員手動操作存在較大的不確定性和不可控性。
11、受內外部因素影響,不能正確對待傾向、喜好、限制和約束的區別,不遵守科學設計原則
1.受審批、決策等環節個別決策者影響,對一些關鍵功能按照個別人的意見進行刪減調整,導致最終交付的數據中心功能不能滿足運營和維護需求;
2.出于傾向、喜好或利益驅動,在規劃設計階段部分設備廠商會通過夸大設備性能、混淆概念等手段影響規劃設計人員的方案制定和設備選型。
12、統籌設計問題的注意
提高系統統籌設計能力對優質地完成規劃設計任務是非常重要的。
1.在數據中心建設過程中存在著大量因規劃設計對分階段、分專業實施階段工程,以及不同專業施工間銜接問題考慮不足造成交付的數據中心不滿足業務及維護需求,有些問題甚至需要大筆投資進行改造方可完成;
2.不同設計人員只關注自身所負責內容,對于其他專業的是否完美銜接,是否與其他專業設計之間存在矛盾和沖突缺乏全局考慮;
3.規劃設計人員對未來業務發展缺乏準確把握,對后期容量管理、擴容等方面考慮不足;
4.規劃設計人員對周圍資源環境和物理環境不熟悉,所設計的方案會出現實施可行性差或者為后來運維工作帶來難以克服的困難。
13、運維人員應參加規劃設計工作
1.運維管理部門參與前期規劃設計,可以彌補設計人員對系統運行和管理知識不足,提高設計質量,避免或消除設計缺欠;
2.運維管理人員參與規劃設計,可將運維階段的需求在規劃設計中得到充分考慮;
3.運維人員參與前期規劃設計,可充分了解和掌握所維護系統的結構、可靠性薄弱環節、遺留問題、潛在風險,有助于提高運維質量、有根據地制定運維計劃和切實可行的改造計劃。
總結:
在新的數據中心的建設中還有許多其它需要考慮的問題。但行業的經驗告訴我們,在數據中心建設和設計過程中掌握這十三個關鍵基本設置重點,將確保最終的數據中心設計盡可能接近用戶的真正需要。