本文指出了數據中心設計建造中的八個事實,看看你是不是還被蒙在鼓里呢?
1.只要有功率輸入,即有熱量輸出
在數據中心的供電系統中,絕大部分電能是要轉化成熱量的,只有少數電能是真正得到利用的。這是由于數據中心的供電線路存在電阻所致,除非你的數據中心采用超導體供電,否則你將永遠為這些散失到空間里的熱量付費。
2.最終還是會發生故障
系統故障的發生概率分布符合隨機模式,這意味著你永遠也無法將事故發生概率降低至零。需要注意UPS到負載之間的路徑以及制冷系統的冗余容錯功能。
3.電負載的密度會繼續增加
若干年前,一個服務器機架只裝不到十臺服務器,而現在可容納幾十臺刀片服務器;若干年前,每個機架的平均功率是1~2kW左右,現在是3kW甚至更高,高密度機架甚至從3~5kW增長至20~25kW。因此,電費將是影響數據中心發展的重要因素之一。
4.對可用性的要求將提高
宕機的損失變得越來越大。若一個網站宕機,一個潛在的客戶就會在8秒鐘之內離開,去訪問另一個網站;若一個路由器宕機:局域網上就可能有幾百個用戶無法工作;若一個光纖室宕機:就可能有幾千個用戶斷開網絡連接,損失不可估量。
5.操作人員若并非訓練有素,會增加數據中心故障的可能性
由于人才緊缺、人力成本高昂以及培訓機構缺位等諸多原因,如今的數據中心操作人員,大部分都很少甚至沒有培訓。這樣一來,數據中心操作人員不得不通過手動操作和不正規的培訓獲得知識,通過犯錯誤、甚至造成代價高昂的宕機獲得知識,這是極為得不償失的。
6.系統可能在狀態變化過程中(例如維護)發生故障
發生故障的時間和導致發生故障的時間是物理學定律和人類行為規律兩者的結合。以燈泡為例:打開燈泡,燈絲溫度迅速變化,燈絲材料熱擴張,導致燈絲斷裂;而UPS中的IGBT器件,也會在開機時因熱沖擊顯示類似的故障模式。同樣道理,冗余和備份系統可能會在切換時出現故障。由于人為因素,系統在狀態變更之后更容易出現故障,可能是因為系統沒有正確地返回運行狀態所導致。
7.任何設備都需要維護
主動檢查所有設備有助于延長設備的使用壽命,預測和預先發現潛在的問題,永遠走在故障前面。
8.數據中心需要經歷四至五代的IT設備更迭
如果數據中心生命周期大于15年,IT設備經常3~4年就要更換,每年都可能有很大的變化。