企業(yè)網(wǎng)D1Net 12月31日訊
云計(jì)算和虛擬化等新技術(shù)的出現(xiàn),使得數(shù)據(jù)中心演變成一個迥然不同的環(huán)境。然而,任何數(shù)據(jù)中心都需要某些關(guān)鍵要素來保證運(yùn)作順利。無論你的數(shù)據(jù)中心只有更衣柜那么大,還是大如飛機(jī)場,或者甚至是傳言中谷歌正在浮動駁船上建立的數(shù)據(jù)中心,這些要素都將適用:
1、環(huán)境控制
一個標(biāo)準(zhǔn)化的、可預(yù)測的環(huán)境是任何高質(zhì)量數(shù)據(jù)中心的基礎(chǔ)。這不僅僅是冷卻和保持適當(dāng)?shù)臐穸?維基百科推薦的溫度范圍是61-75華氏度/ 16-24攝氏度,濕度為40% - 55%)。你也必須考慮到消防、氣流和功率分布等因素。我曾接觸過一家公司很認(rèn)真地確保他們的數(shù)據(jù)中心盡可能地保持純凈,任何紙箱都不能存儲在那個房間。這是由于把冷空氣引到前部機(jī)架的分布機(jī)制,讓紙板粒子會進(jìn)入氣流,可能會污染服務(wù)器。這可能有點(diǎn)極端但說明了這一觀念的重要性。
2、安全
無需多言,物理安全是一個可靠數(shù)據(jù)中心的基礎(chǔ)。妥善保管你的系統(tǒng),并只允許授權(quán)人員進(jìn)入,并手持準(zhǔn)許證通過網(wǎng)絡(luò)對服務(wù)器、應(yīng)用程序和數(shù)據(jù)進(jìn)行必要的訪問。可以肯定地說,任何公司的最有價值的資產(chǎn)(當(dāng)然除了人)都存在于數(shù)據(jù)中心。三流小偷的目標(biāo)是筆記本電腦或個人手機(jī)。專業(yè)的小偷則將目標(biāo)定在數(shù)據(jù)中心。門鎖可以被撬開,因此建議不如使用警報(bào)。當(dāng)然,警報(bào)也可能沒有用,所以想想下一個方法:鎖住服務(wù)器機(jī)架?為你的安全系統(tǒng)準(zhǔn)備備用電源?雇傭保安?這取決于你的安全需求,但請記住,“安全是一個長期的過程。”
3、問責(zé)制
應(yīng)該說,大多數(shù)IT人員都是專業(yè)的和值得信賴的。然而,這并不能否定數(shù)據(jù)中心需要問責(zé)制來追蹤人機(jī)的互動。數(shù)據(jù)中心應(yīng)該記錄證件準(zhǔn)入的細(xì)節(jié)(并且這些記錄應(yīng)該由IT以外的部門保管,如安全部門,或者副本同時保存在IT主管和副總裁的手中)。訪客應(yīng)該進(jìn)入和離開時登記,并一直被監(jiān)視著。應(yīng)該開啟網(wǎng)絡(luò)/應(yīng)用程序/文件資源的審計(jì)工作。最后同樣重要的是,每個系統(tǒng)都應(yīng)該有一個確定的人掌管,無論它是一個服務(wù)器、路由器、數(shù)據(jù)中心冷卻裝置,還是警報(bào)系統(tǒng)。
4、策略
數(shù)據(jù)中心中的每一個過程背后都應(yīng)該有一個策略方針來幫助維護(hù)和管理環(huán)境。你需要系統(tǒng)訪問和使用策略(例如,只有數(shù)據(jù)庫管理員能完全控制數(shù)據(jù)庫)。你應(yīng)該有數(shù)據(jù)保留策略——備份應(yīng)該被存儲多長時間?要將它們保存在廠區(qū)外嗎?如果這樣的話,什么時候到期呢?同樣的理念也適用于新系統(tǒng)的安裝,檢查過時的設(shè)備/服務(wù),及刪除舊設(shè)備——例如,清除服務(wù)器硬盤、捐贈或回收硬件。
5、冗余
正如舊汽車也需要備用輪胎一樣,你的數(shù)據(jù)中心也許更新、更貴,并且非常重要,因此你需要的不僅僅是一個備用輪胎來確保它保持健康運(yùn)作。對于企業(yè)賴以生存的一切你都至少需要兩份,無論是郵件服務(wù)器、 ISP、數(shù)據(jù)光纖鏈接,還是VOIP語音電話系統(tǒng)都適用。三個或三個以上的備份在很多情況下都不會有壞處!
除了冗余組件,測試及確保系統(tǒng)正常工作的過程也同樣重要,比如定期的故障轉(zhuǎn)移訓(xùn)練和新方法的研究。
6、監(jiān)控
監(jiān)控系統(tǒng)的正常運(yùn)行時間和健康狀況具有前瞻性的價值,但這僅僅是開始。你還需要監(jiān)控使用了多少帶寬、能源、存儲、物理存儲空間,及其它任何由數(shù)據(jù)中心提供的“商品”。
Nagios等免費(fèi)的工具可以進(jìn)行基本的監(jiān)控,Dranetz可以完成功率測量等更復(fù)雜的解決方案。運(yùn)行中斷或低閾值造成的警報(bào)是監(jiān)控中的一部分,確保為你的警報(bào)布置一個失效保護(hù),使它們能獨(dú)立于數(shù)據(jù)中心(例如,如果VMWare ESX主機(jī)上的電子郵件服務(wù)器故障了,另一個系統(tǒng)要能進(jìn)行監(jiān)控,并能夠發(fā)出通知)。
7、可擴(kuò)展性
你的公司現(xiàn)在需要25臺服務(wù)器來完成包括虛擬化、冗余、文件服務(wù)、電子郵件、數(shù)據(jù)庫和分析等在內(nèi)的一系列的任務(wù)嗎?你下個月、明年,或者是下一個十年又將需要什么呢?必須確保你的數(shù)據(jù)中心具有足夠的擴(kuò)展性來增加電力、網(wǎng)絡(luò)、物理空間和存儲。
對可擴(kuò)展性的規(guī)劃不是靜止的東西,它是一個持續(xù)的過程。明智的公司對其積極地跟蹤和報(bào)告。這些報(bào)告能指出可擴(kuò)展性需要滿足的下一個地方,比如物理存儲空間匱乏。
8、變更管理
你也許認(rèn)為變更管理屬于“策略方針”部分。然而,我認(rèn)為這既是策略又是哲學(xué)。恰當(dāng)?shù)淖兏芾碇笇?dǎo)方針能確保數(shù)據(jù)中心不出現(xiàn)計(jì)劃外的事件。無論是上線新系統(tǒng)還是撤銷舊系統(tǒng),數(shù)據(jù)中心中所有元素的生命周期都必須與變更管理的規(guī)劃一致。
9、有條不紊
每一個IT專業(yè)人士都感覺時間緊迫。由于怕錯過最后期限,可能導(dǎo)致一些“抄近路”行為,一旦如此,往往難以保證環(huán)境又好又整潔。
一個成功系統(tǒng)的實(shí)現(xiàn)并不僅僅意味著裝上它,然后打開,它還包括以標(biāo)準(zhǔn)化和可技術(shù)支持的方法對數(shù)據(jù)中心進(jìn)行設(shè)備整合。你的服務(wù)器機(jī)架應(yīng)該是干凈而符合邏輯的(生產(chǎn)系統(tǒng)在一個架子上,測試系統(tǒng)在另一個架子上)。你的電纜應(yīng)該長度適中,根據(jù)電纜運(yùn)行指南運(yùn)作,而不是隨意地折疊。
數(shù)據(jù)中心不應(yīng)該是這樣的,
而是這樣的,
10、文檔
最后一點(diǎn)是需要有合適的、有用的和及時的記錄,如果你不遵循嚴(yán)格的程序,在實(shí)施中很容易產(chǎn)生問題。把交換機(jī)布局和服務(wù)器插頭的位置匆匆拼湊成圖表是不夠的,你的變更管理指導(dǎo)方針應(yīng)該包括保存相關(guān)的文檔,并且隨著細(xì)節(jié)的補(bǔ)充可用于所有的相關(guān)人員。
這并不是危言聳聽,而是以“車禍”原則為指導(dǎo)。假設(shè)明天我被車撞,其他人至少不用擔(dān)心我的工作或個人文檔是否是最新的,因?yàn)槲颐恐芑〞r間來確保所有的變更和調(diào)整都有相應(yīng)的記錄。更夸張的是,如果我決定換工作,我不用再花兩個星期狂亂地記錄我對系統(tǒng)所做的一切。
結(jié)語
這些方法的偉大之處是它們完全不依賴于硬件/軟件。無論你的數(shù)據(jù)中心服務(wù)器運(yùn)行Linux、Windows或其他操作系統(tǒng),還是只是一個網(wǎng)絡(luò)交換機(jī)和主機(jī)的集合,希望這些對你和你的企業(yè)有所幫助。
(作者Scott Matteson是一位高級系統(tǒng)管理員,同時也為中小企業(yè)提供咨詢服務(wù))