從一組服務器轉換到另一組更強大的服務器應該是件輕而易舉的事情。事實上,這個過程非常常規,以至于企業沒有辦法來提供超過三個小時的服務中斷。但是,當數據中心技術人員開始這個過程時,他們會發現連接到舊服務器的電纜都沒有進行標記,也沒有被正確安裝在設備機架上。當他們費盡力氣斷開電纜,他們會發現,一些電纜接在毀壞的插頭上,并且在很多情況下,他們將很難搞清楚這些電纜需要插入到新服務器的什么位置。
讓我們長話短說:中斷本來只需要約20分鐘,而最終可能需要5個小時。此外,在面對恢復服務的恐慌中,技術人員會在設備機架之間串起臨時電纜,而這些電纜會纏繞在一起,最終,企業為了清理這些電纜,需要再次中斷服務。
這是一個真實的故事,可悲的是,存在問題的服務器都是關鍵任務服務器,他們的中斷會給企業的創收活動帶來嚴重影響。
數據中心布線是一個關鍵問題
我們都知道,布線是數據中心內部網絡的一個重要組成部分。企業不僅要知道每根電纜的去向,而且當設備重新配置或更改時,他們需要能夠找到具體的布線。這意味著,每個數據中心都應該有一個布線清單以及布線清單管理系統。數據中心管理人員必須能夠在幾秒鐘內獲得每根電纜的具體信息,包括電纜的類型和供應商、終端接點、電纜管道位置以及安裝日期。
好消息是,企業沒有必要使用電子表格從頭開始建立這樣一個系統(盡管這是從頭開始的最便捷的方法,有總比沒有好)。我們有各種電纜管理系統,包括從最基本的到最復雜的系統。有些系統還被綁定到網絡管理系統來提供對庫存系統的即時訪問,當聯網設備出現故障時,這能夠幫助即時解決問題。還有很多系統則是作為較大的數據中心基礎設施管理(DCIM)應用的一部分。例如,IBM和Rackwise在這個領域提供相當廣泛的產品。另外還有開源解決方案,例如 openDCIM,也可以用來從頭開始布線。
電纜管理戰略
首先,企業必須對電纜進行標記。至少,每根電纜終端需要標記電纜的獨特的識別號碼,以及標記其用途。記住,當出現故障時,重要的是能夠迅速且明確地找出具體的電纜。
數據中心也應該有一個具體的布線架構:這個架構將分配具體電纜管道到特定功能。例如,路由器、交換機和防火墻設備之間的互連電纜應該要與用于外部通信的電纜分開。(筆者想起一個這樣的數據中心,其中一根雙絞線懸掛在天花板上,用于外部客戶訪問自動服務報價處理器,每次電風扇打開的時候,這根雙絞線就會在風中搖擺,客戶的訪問就會中斷)。此外,容錯架構也很重要,特別是對于串擾和噪音,以及散熱而言。
這里需要大量的工作嗎?有必要嗎?你可以算一下:根據長度的不同,定制電纜可能要幾百美元。然而,電纜故障可能導致數千美元的損失,或者至少會給生產力帶來負面影響,因為技術人員很難找到電纜替換它。一個好的布線計劃就像是保險政策,當故障發生時能夠瞬間給企業提供保障。
那么,企業如何知道數據中心是否處于危險之中?參觀一下數據中心,并檢查布線。電纜是否有明確的標記和顏色編碼?電纜管道是否整齊,是否按照功能進行隔離?電纜在地面上嗎?如果所有這些問題的答案是否定的,那么,數據中心就存在問題。
盤查、標記,然后命名
從哪里開始呢?最好就是從盤查和標記每根電纜開始。如果你需要布線命名法,網絡上有很多實用的指南來幫助你制定標記規則。在所有電纜都被定位和標記后,企業需要輸入布線信息到庫存系統,或者電子表格,盡管這并不是最佳辦法。最終,企業將希望有一個更強大的系統,允許他們增加、移動和更改布線,而不需要增加太多開銷。
最后,在庫存完成,布線已經確定后,企業還需要不斷進行測試,以及重新路由電纜來匹配功能和類型。改進的過程應該是連續的,這能夠在非常短的時間內顯著改進布線基礎設施。
這里的選擇很簡單:你要么現在努力清理數據中心布線,要么以后為低效或標記不好的布線付出代價。一般來說,如果你等到以后再處理,成本將會更高,并且,這種延遲對你的業務有不好的影響。