由于云計算和虛擬化等新技術的出現,數據中心的演變可能將其轉變為一個非常不同的環境。然而,任何數據中心都需要某些基本要素才能順利和成功地運作。無論您企業的數據中心是步入式機柜(walk-in closet)還是飛機式機架(airplane hanger),或者甚至是在浮式駁船上(有傳言稱Google正在構建),這些要素都是適用的:
1、環境控制
標準化和可預測的環境是任何高質量運營的數據中心的基石。其不僅僅是保持數據中心操作環境的冷卻和適當的濕度水平(根據維基百科,推薦的數據中心操作環境溫度范圍是61-75華氏度/ 16-24攝氏度和40-55%的濕度)。您企業還必須考慮防火、氣流和功率分配。我曾經供職過的一家公司對于這幾點的對待就非常嚴肅,確保他們的數據中心盡可能保持原始,規定紙板箱嚴禁存放在操作機房。這背后的理論是,由于分配機制,將更冷的空氣帶到機架的前面,這會使得紙板的顆粒可能進入氣流,并有可能潛在的污染服務器。這可能是有些極端了,但肯定說明了這個概念的重要性。
2、安全
毫無疑問(但無論如何,我還是會強調)物理安全是可靠的數據中心的基礎。使系統保持鎖定和密鑰,并僅僅只向授權人員提供密鑰,且只允許通過網絡對服務器、應用程序和數據進行必要的訪問。可以肯定地說,對于任何公司而言(當然,除了人之外),最寶貴的資產都是駐留在數據中心的。小偷們將會目標瞄準筆記本電腦或個人手機。而專業的黑客大盜則瞄準的是數據中心。門鎖是可以撬開的,所以我建議采用警報等裝置。當然,警報也是可能被黑客攻破的,所以您企業還可以考慮采用下一措施:鎖定服務器機架、為您數據中心的安全系統備份電源、招聘保安員。這措施都取決于您企業數據中心的具體安全需求,但請記住,“安全的確保僅僅只是一個過程,而不是目的地。”
3、責任
站在系統管理員的立場,我可以證明絕大多數IT人員都是專業和值得信賴的。然而,這并不否定在數據中心內需要對于操作人員及與他們交互的相關人員進行責任的追蹤。數據中心應通過胸牌徽章訪問(badge access)來記錄進出工作人員的詳細日志信息(我建議這些日志由IT以外的人員,例如安全部門管理,或者信息副本由IT主管和副總裁共同掌握)。訪客在任何時候都應該詳細登記進出細節并繼續受到監督。應打開網絡/應用程序/文件資源的審計。最后一點,但并非不重要的一點是,每款系統都應該有一個明確可識別的所有者,無論其是服務器、路由器、數據中心冷卻器還是報警系統。
4、管理策略
數據中心所涉及的每個過程背后都應該有一套相應的政策,以幫助保持和管理環境。您企業數據中心需要有相關的系統訪問和使用的管理策略(例如,只有數據庫管理員才能完全控制SQL服務器)。您企業還應該有數據保留策略:諸如數據應該存儲備份多長時間?你企業是否將這些數據保留在場外異地,如果是這樣的話,什么時候到期?相同的理念也適用于安裝新的系統,檢查過時的設備/服務,以及刪除報廢舊設備(例如,擦除服務器硬盤驅動器以及捐贈或回收硬件)。
5、冗余
我曾經擁有的第一輛車是一輛藍色的福特Pinto。我的父母為其支付了400美元,當時的油錢是每加侖一美元,所以,我到處都開著這輛車。其有一個備用輪胎經常派上用場。我想強調的要點是:即使我的老汽車容易發生故障,但其有冗余。您的數據中心可能成本造價更昂貴,更關鍵,因此您需要的絕不僅僅是一個“備胎”以確保其保持健康。您企業業務所需的所有東西您都將需要預留至少兩項,無論其是郵件服務器、ISP、數據光纖鏈路或IP語音(VOIP)電話系統虛擬機。在許多情況下,預留三個或更多也不會有損害!
重要的不僅僅是冗余組件,而且,測試和確保它們可靠工作的過程也是極其重要的,例如按計劃的故障轉移訓練和研究新的方法。
6、監測
監控所有系統,以確保正常運行和健康運營狀況將帶來巨大的積極價值,但這僅僅只是開始。您企業數據中心還需要監控正在使用的帶寬,以及能量、存儲、物理機架空間以及您的數據中心所提供的任何其他“商品”。
有相應免費的工具,如Nagios可用于螺母和螺栓監控;以及更復雜的解決方案,如Dranetz可進行功率測量。在出現停機或低閾值時發出警報是該過程的一部分,并確保為警報安排故障保護,以使它們獨立于數據中心(例如,如果您企業的電子郵件服務器是在已經一臺死機的VMWare ESX主機上,那么另一款系統應該對其進行監視,并能夠發出通知)。
7、可擴展性
今天,您的公司或許需要25臺服務器來完成一系列任務,包括虛擬化、冗余、文件服務、電子郵件、數據庫和分析。那么,下個月將需要多少呢,明年呢或者下一個十年需要什么呢?確保您企業擁有適當規模的數據中心,具有足夠的擴展容量,以增加功率、網絡、物理空間和存儲。如果您的企業是持續盈利的,那么我可以保證您企業的數據中心需求將會增長,那么現在就是開始規劃的時候了。
規劃可擴展性不是一勞永逸的,相反,這是一個持續的過程。明智的企業將積極跟蹤和報告這一概念。我們可以從這些報告中看到“下一個目標”,其標識了必須盡可能快地滿足可擴展性的關鍵區域(例如,缺少物理機架空間)。
8、變更管理
您可能會認為變更管理是屬于數據中心“管理策略”的一部分,這一考慮具有一定的意義。然而,我認為,這既是一種政策,也是一種哲學。適當的變更管理準則有助于確保您的數據中心沒有發生任何未經計劃、未提前安排討論或同意的事情,并提供了退出步驟或一套“B”計劃備案。無論是將新系統引入企業還是報廢舊系統,數據中心的所有要素的使用壽命周期都必須根據您的變更管理規劃藍圖進行。
9、組織
我還從來沒遇到過一個IT專業人士不認為時間短促的。dan ge新系統的推出時,可能會導致一些零碎角落事務由于時間倉促的恐慌超過了截止日期而未被處理,而這些零碎事情似乎總是包括使操作環境保存良好的整潔。
一項成功的系統部署不僅意味著插入并能夠啟動;其還包括通過標準化和可支持的方法將設備集成到數據中心。您的服務器機架應該是干凈的,并以邏輯方式布置(生產系統在一個機架,測試系統在另一個)。你的電纜應該是適當的長度,并嚴格遵循布線指南,而不是隨意的。下面兩幅數據中心布線圖中,你認為哪種情況更有助于問題的解決和提供支持呢:
資料來源:維基共享資源
或是這種:
10、文檔
最后一項關鍵要素是適當的、有用的、及時的文檔紀錄——如果你企業數據中心不遵守這一嚴格的程序,這將會是另一項能夠很容易地讓您在數據中心操作運營過程中出現難題的關鍵要素。僅僅將你數據中心的交換機布局圖和哪臺服務器插在哪里制定一份文檔紀錄是遠遠不夠的;您數據中心的變更管理指南應該強制文檔保持相關性,并隨著細節的變化向所有相關的人員提供,而且必須始終如此。
十大要素要整合
上述這些概念的偉大之處在于它們完全是硬件/軟件無關的。無論您企業的數據中心同時包含了Linux,Windows或其他操作系統的服務器的運行,還是僅僅是網絡交換機和大型機的集合,希望這些關鍵要素的提點將對您和您的企業有用。
為了將它們整合在一起,將IT環境視為一個輪子,以數據中心為中心,那么這十大關鍵概念要素將作為周圍的“輪胎”,如下圖所示:
為每個組件都投入時間和能量將確保您企業“輪子”的順利運轉。畢竟,這是你企業數據中心最為核心的目標,對吧?
關于作者
本文作者Scott Matteson是一名高級系統管理員和自由撰稿人,他也為小型企業組織提供咨詢服務。