有效的服務器管理需要監控、文檔化,并且有時需要進行內部遷移。本文將幫助您發現頂級服務器管理技巧以及如何將其應用于您的數據中心。
服務器管理和監控是數據中心管理的重要組成部分。它需要您對管理的服務器擁有全局的視角,深思熟慮的監控策略,并在服務器停止工作后有精心設置的預案。而且,在云端和托管所飽和業界生態中,服務器管理越來越多地需要有設備移出機房的規劃。
本文提供了磨合服務器管理和監控策略的技巧,這些技巧考慮到了IT環境的需求。
避免文檔過于繁瑣
要有效地管理您的服務器,您需要適當的文檔。盡可能多收集關于您的服務器的信息,從序列號和型號到SCSI詳細信息和接口類型。如果是虛擬化服務器,則需要在清單中包含虛擬化供應商、虛擬機管理程序產品和版本。
如果手動完成,此過程可能非常繁瑣,但您可以使用自定義腳本(例如在Windows Server PowerShell中的腳本)來自動捕獲服務器配置和清單。實施全面的變更管理策略,防止系統發生任何會導致其他系統的意外中斷的變更。例如,Microsoft的理想狀態配置(desired state configuration)確保每個硬件或軟件組件不會從已知狀態隨意更改。
監控是防止資源浪費的關鍵
根據Uptime Institute的統計,雖然整合和虛擬化減少了當今數據中心的空間問題,但30%的服務器被視為處于睡眠狀態或是“僵尸服務器”。這些服務器消耗著昂貴的資源,而不提供任何價值。無論直接或者間接,僵尸服務器浪費著不必要的電力和冷卻能量。
精心的服務器管理和監控對于消除僵尸系統的存在至關重要。首先,選擇一類數據中心基礎架構管理(DCIM)平臺,配置管理數據庫或是自定義的自動化工具。使用您選擇的工具,監控CPU利用率和功耗,然后識別未充分利用的資源來發現和消除僵尸服務器。一種替代方案是指定一位工作人員定期測量和評估服務器利用率。
升級還是替換?
任何服務器監控和管理策略的關鍵部分是決定是升級還是完全替代過時的系統。簡單升級通常更具成本效益,但還有其他因素需要考慮,如增長曲線和性能。如果您的內存或存儲升級后性能無法持續到下一個預算周期,那么這種選擇對您的組織來說可能更加昂貴不劃算。
如果您的服務器可以容納固態驅動器,將其從旋起驅動器改為普通驅動器可顯著提高性能。但是這種升級可能會引發性能問題,同時對系統的一部分進行改進可能會迫使其他部件嘗試跟上,這可能會造成瓶頸。
如果選擇進行升級,服務器的類型之間存在差別。刀片服務器具有供應商強大鎖定的特點,這使得商業現貨(COTS)組件的添置變得困難。而且有時,升級刀片服務器并非好的選擇,因為供應商可能不會繼續生產該系列刀片服務器的產品,無法進行升級。
另一方面,機架式服務器更容易升級。機架式服務器的使用壽命為3至4年,在大多數組織的設備周期之內。此外,添加COTS組件的選擇通常更有可能是機架式服務器,這樣可以使升級更加容易。
正確地完成遷移
在服務器管理和監控過程中的某個時刻,您可能需要規劃從企業內部遷移到托管設施——該過程需要大量的準備工作。計算要運行的服務器所需的電源、空間和冷卻能量。由于許多托管設施有自己的預先完成布線的機架,您可能需要遷移到不同的服務器之上,并為您的設備構建一份全新的物理地圖。
確定您在遷移期間是否能承擔宕機時間(造成的損失)。如果可以,請關閉專用于特定工作負載的服務器,將其完成遷移后并重新啟動。如果不能,請使用虛擬化服務器在一部分系統上運行作業,以便在移動過程中部分關閉服務器。任命一名“遷移經理”來識別和溝通出現的任何問題都是會有幫助的。
在進行遷移的當天,在退出服務器之前關閉或遷移應用程序到其他虛擬機。將內部和光纖電纜綁扎或粘貼,使其固定在正確的位置上。雇用一家計算機遷移公司也許是值得的,但無論哪種方式,您應該使用氣墊車來運輸服務器,并避免在顛簸的道路上運輸。遷移公司的人員運輸完成交付并安裝服務器后,連接電源、冷卻系統、交換機和路由器,然后進行目視檢查,以確保線纜沒有松動或明顯的錯誤。