數(shù)據(jù)中心需要時刻做好最壞的打算,但也需要不惜代價避免其發(fā)生。良好的系統(tǒng)文檔可以幫助組織避免嚴重錯誤。
任何數(shù)據(jù)中心都可能忽視的最大問題,就是缺乏明確詳實的服務器文檔。
IT專業(yè)人員知道如何安裝與配置最復雜的設備,但往往不具備較強的溝通能力。這樣一來,企業(yè)依賴管理員的記憶或非正式的傳遞知識,造成原先可以避免的整合、升級或故障處理問題,因為管理員忘記了自己之前是怎么操作的,或者在離職后出現(xiàn)知識真空面。 這里有一些方法能提高你的服務器文檔質量。
強大的服務器文檔
創(chuàng)建系統(tǒng)或服務器文檔并沒有統(tǒng)一的標準。重點不在道路,而在于如何建議一個“地圖”來展示每個系統(tǒng)是如何安裝、配置與集成到數(shù)據(jù)中心,以便其他IT專業(yè)人員可以理解、測試、升級與故障排插,最小化生產環(huán)境浪費的時間。
組織記錄各自的服務器與系統(tǒng)各不相同,采用的標準和詳細程度也不一樣。不過還是有辦法來支持這些無章的文檔。
列表清單。從硬件清單開始,包括所有主要組件的列表。接下來記錄軟件清單,包括詳細的操作系統(tǒng)、虛擬機管理程序、虛擬機(與其他所有操作系統(tǒng))、驅動程序、應用程序(工作負載)、以及所有相關序列號授權信息。
任何系統(tǒng)清單工具都可以詳細記錄硬件、軟件組件并隨著時間更新。提供一個完整的、一目了然的組件列表就十分有用,這樣可以很容易了解系統(tǒng)并規(guī)劃采購。整理庫存報告,并連同原始安裝或恢復介質以及任何原是供應商提供的文檔,如手冊或安裝指南。
說明文檔。接下來需要記錄任何有關各個系統(tǒng)的安裝與配置,從固件選項(BIOS設置)開始。同樣還需要包括文檔啟動腳本。命令行腳本出了名的缺乏備注,所以把它們也加入文檔更方便在未來修改或排查故障。接著,部署一個版本控制系統(tǒng)來幫助管理員跟蹤版本,這樣容易發(fā)現(xiàn)系統(tǒng)是否在使用舊的或錯誤的腳本。
更大型的數(shù)據(jù)中心,需要記錄系統(tǒng)如何安裝上架,包括局域網(wǎng)地址、媒體訪問控制或MAC地址,記錄每個網(wǎng)絡接口卡的端口,并且需要額外記錄系統(tǒng)如何與網(wǎng)絡交換機連接。將這些結合起來,所有信息能夠形成網(wǎng)絡拓撲圖,能夠方便IT專業(yè)人員跟蹤與查看目前架構,并為基礎設施提出改善建議。
利用系統(tǒng)管理工具自動化完成一些信息收集任務。工具經常會替換更正式的文檔,因為所有的報表都在動態(tài)變化,不會過時。無論采用哪種方法,在變更發(fā)生時,需要采取方法來更新系統(tǒng)與相關文檔。錯誤的文檔比沒有文檔更糟糕。
文檔放哪兒?
關于系統(tǒng)與服務器文檔,將其保存在何處,并沒有明確的要求。
系統(tǒng)文檔最理想的情況是接近物理系統(tǒng),這樣方便查看重要細節(jié),快速訪問重要詳細記錄,加速恢復運行時間。用其他介質保存文檔,不要將其保存在系統(tǒng)中。文檔是為了幫助排除故障,但如果出現(xiàn)系統(tǒng)故障或無法訪問系統(tǒng)本地磁盤上所保存的文檔時,就一點用都沒有了。
在單獨的位置合并文檔也十分常見。如果你選擇這樣的路線,需要為手冊設置一個架子,配置文件與數(shù)據(jù)中心其他細節(jié)信息也要放在附近。避免文件冗余副本——改變其中一份的內容往往很難更新到其他子副本中,從而導致錯誤與混亂。
保存文檔的介質并沒有太大的實際區(qū)別。紙打印、刻錄到光盤、記錄在閃存驅動器,甚至在主存儲區(qū)域網(wǎng)絡上保存電子手冊與文檔都是可行的:根據(jù)自身具體環(huán)境規(guī)模與復雜程度,選擇可接受的媒介。系統(tǒng)管理很可能會產生很少的硬拷貝文檔。確保一致性與整合,使每個集都容易獲得。
妥善保管服務器文檔
一般情況下,伴隨新服務器而來的供應商文檔價值有限,系統(tǒng)一般是根據(jù)實際情況進行配置和部署,但這是很好的參考文檔,建議保留供應商的文檔作為自己文檔開發(fā)的參考。
供應商文檔的批量與錯誤已經越來越少,因為更多的產商已經轉向基于WEB的文檔與指南。例如,供應商可以更新他們自己的在線文檔,幫助梳理錯誤、勘誤、故障排除與解決方法。
不過,原來的文檔與當前配置詳細信息依舊存在可以重新利用的價值(出售給其他用戶或重新分配給其他業(yè)務部門)。
為了文檔方便 文檔必須明確和準確——下至特定的按鍵,上至復雜安裝過程中的鼠標點擊。需要能夠手動記錄纖細活動信息,但還是有很高的幾率跳過某些特殊步驟。
用工具記錄所有操作過程,并給用戶編寫文檔留下一步一步可查閱的關鍵步驟。
其中一個工具是微軟的問題步驟記錄器(PSR.exe),最初集成在Windows 7和Windows Server 2008 R2上,以幫助支持人員查看究竟用戶桌面上發(fā)生了什么。IT管理員發(fā)現(xiàn)其能夠記錄和備注每次鼠標點擊,接著將其保存為壓縮的MHTML報告,這遠比遠程協(xié)助用戶進行操作有效得多。
該工具在Windows Server 2012中仍舊存在,可以記錄并自動生成文檔記錄客戶端與服務端系統(tǒng)的重要活動。當需要進行重要配置和配置操作時,可以利用其創(chuàng)建記錄庫,供工作人員后期參考。要啟動PSR.exe,單擊開始,在搜索中鍵入PSR,然后可以在搜索結果列表中看到PSR小程序。
文檔記錄是否有用,在任何數(shù)據(jù)中心內沒有既定的判斷依據(jù),所以不同組織文檔的數(shù)量與質量無法對比。審閱與改進文檔,允許其他IT人員查閱資料和提供有關清晰度、完整性的反饋建議。而且數(shù)據(jù)中心經理們應該騰出時間來定期培訓,讓IT人員熟悉現(xiàn)有的文檔,在需要時就不會手忙腳亂了。