對(duì)于企業(yè)用戶來說,近些年隨著數(shù)據(jù)量呈指數(shù)倍的爆發(fā)式增長態(tài)勢(shì),以及云計(jì)算平臺(tái)的飛速發(fā)展,使得用戶對(duì)于數(shù)據(jù)中心的需求度開始不斷攀升。我們也不難發(fā)現(xiàn),已經(jīng)有越來越多的企業(yè)開始建造自己的數(shù)據(jù)中心,或者有些中小型企業(yè)用戶也開始選擇把自己的數(shù)據(jù)放在數(shù)據(jù)中心當(dāng)中進(jìn)行存儲(chǔ)和管理。
然而對(duì)于數(shù)據(jù)中心的基礎(chǔ)設(shè)施建設(shè)以及一些日常運(yùn)維管理等多方面的問題,或許不同的用戶有著不同的需求,有些企業(yè)用戶可能只是需要大容量的存儲(chǔ)空間,對(duì)于數(shù)據(jù)的提取可能并不頻繁,也就是我們平時(shí)所說的冷數(shù)據(jù)占據(jù)了大多數(shù)業(yè)務(wù)模塊,也許有些用戶對(duì)于在數(shù)據(jù)中心存儲(chǔ)數(shù)據(jù)的計(jì)算能力和運(yùn)行方式要求的更加敏捷更加靈活,這可能對(duì)于數(shù)據(jù)中心管理者們來說又是另外的一套方案了。
綜上所述,當(dāng)今的企業(yè)用戶對(duì)于數(shù)據(jù)中心的設(shè)計(jì)、建造、管理等很多環(huán)節(jié)仍然還存在把握不準(zhǔn)的地方,尤其是在數(shù)據(jù)中心的設(shè)計(jì)和建造過程當(dāng)中,有一些現(xiàn)實(shí)存在的困難和問題需要去克服和解決,這些事實(shí)存在的問題究竟有哪些?本期筆者就和大家來聊聊。
大功率,散熱就成了問題
我們都知道,在整個(gè)數(shù)據(jù)中心運(yùn)行過程當(dāng)中,基礎(chǔ)當(dāng)中的基礎(chǔ)就是電力運(yùn)行了,然而只要有電力系統(tǒng)的運(yùn)行和工作就必然會(huì)產(chǎn)生一些熱量,對(duì)于這些電能的應(yīng)用現(xiàn)在只有很少一部分得到了充分的應(yīng)用,除非企業(yè)的數(shù)據(jù)中心采用超導(dǎo)體供電,否則你將永遠(yuǎn)為這些散失到空間里的熱量付費(fèi)。
數(shù)據(jù)故障不可避免
宕機(jī)是每個(gè)數(shù)據(jù)中心管理員們最不希望看到的事情,但是在實(shí)際運(yùn)行當(dāng)中,數(shù)據(jù)中心當(dāng)中的眾多硬件設(shè)備不太可能保證永遠(yuǎn)不出故障,這也就意味著用戶永遠(yuǎn)也無法將事故發(fā)生概率降低至零。需要注意UPS到負(fù)載之間的路徑以及制冷系統(tǒng)的冗余容錯(cuò)功能。
電負(fù)載的密度會(huì)繼續(xù)增加
若干年前,一個(gè)服務(wù)器機(jī)架只裝不到十臺(tái)服務(wù)器,而現(xiàn)在可容納幾十臺(tái)刀片服務(wù)器;若干年前,每個(gè)機(jī)架的平均功率是1~2kW左右,現(xiàn)在是3kW甚至更高,高密度機(jī)架甚至從3~5kW增長至20~25kW。因此,電費(fèi)將是影響數(shù)據(jù)中心發(fā)展的重要因素之一。
數(shù)據(jù)中心可用性提升
我們前文說到了數(shù)據(jù)中心當(dāng)中設(shè)備的宕機(jī)現(xiàn)象,如果一個(gè)現(xiàn)實(shí)的網(wǎng)站遭遇宕機(jī),那么有可能導(dǎo)致一個(gè)潛在用戶在幾秒鐘的時(shí)間內(nèi)流失掉,轉(zhuǎn)而去訪問另外一家網(wǎng)站,如果一臺(tái)路由器設(shè)備宕機(jī),那么很有可能導(dǎo)致在這個(gè)局域網(wǎng)內(nèi)的幾百個(gè)用戶無法正常連接網(wǎng)絡(luò),若一個(gè)光纖室宕機(jī),就可能有幾千個(gè)用戶斷開網(wǎng)絡(luò)連接,損失不可估量。
管理人員的高素質(zhì)培訓(xùn)
對(duì)于數(shù)據(jù)中心來說,擁有一支高素質(zhì)高技能的管理人員團(tuán)隊(duì)同樣也是非常重要的,由于人才緊缺、人力成本高昂以及培訓(xùn)機(jī)構(gòu)缺位等諸多原因,如今的數(shù)據(jù)中心操作人員,大部分都很少甚至沒有培訓(xùn)。這樣一來,數(shù)據(jù)中心操作人員不得不通過手動(dòng)操作和不正規(guī)的培訓(xùn)獲得知識(shí),通過犯錯(cuò)誤、甚至造成代價(jià)高昂的宕機(jī)獲得知識(shí),這是極為得不償失的。
系統(tǒng)升級(jí)當(dāng)中的問題
我們都知道,任何一款硬件設(shè)備都會(huì)牽扯到其中應(yīng)用的升級(jí)和維護(hù),那么在整個(gè)升級(jí)過程當(dāng)中就有可能產(chǎn)生故障的可能,比如像UPS中的IGBT器件,也會(huì)在開機(jī)時(shí)因熱沖擊顯示類似的故障模式。同樣道理,冗余和備份系統(tǒng)可能會(huì)在切換時(shí)出現(xiàn)故障。由于人為因素,系統(tǒng)在狀態(tài)變更之后更容易出現(xiàn)故障,可能是因?yàn)橄到y(tǒng)沒有正確地返回運(yùn)行狀態(tài)所導(dǎo)致。
編輯的話
數(shù)據(jù)中心作為當(dāng)今這個(gè)大數(shù)據(jù)和云計(jì)算時(shí)代數(shù)據(jù)量的重要載體,在實(shí)際運(yùn)行和管理過程當(dāng)中確實(shí)會(huì)面臨很多的問題,對(duì)于數(shù)據(jù)中心服務(wù)提供商來說,保障用戶數(shù)據(jù)的安全、快速、穩(wěn)定的運(yùn)行是需要考慮到的首要問題,對(duì)于用戶而言,選擇將自己的數(shù)據(jù)托管到哪個(gè)平臺(tái)上,也是需要深思熟慮的。