企業(yè)網(wǎng)D1Net 4月28日 隨著信息技術的發(fā)展,數(shù)據(jù)中心規(guī)模越來越大。數(shù)據(jù)中心已經(jīng)成為了人們工作、生活賴以生存的重要部分。如果沒有數(shù)據(jù)中心提供的各種各樣信息服務,世界將變得不可想象。然而,數(shù)據(jù)中心在高速發(fā)展的同時,也面臨著一系列的新問題。比如:能耗、性能、安全、管理問題等等。其中每個方面都可以列出一堆的問題,正因為如此,數(shù)據(jù)中心技術才會一直保持著高速的進步,諸多數(shù)據(jù)中心技術人員正在馬不停蹄地解決這些涌現(xiàn)出的問題,驅動他們前進的正是在新技術不斷完善過程中孕育著的巨大商業(yè)機會。看看全球福布斯富豪榜,科技公司的富豪占據(jù)了多席,這些富豪正是發(fā)明創(chuàng)造了一些改變了人們生活方式的新技術,才從中獲得了巨額財富。本文將深入探討一下數(shù)據(jù)中心管理面臨的一些難題,并從實際出發(fā),給出一些僅供參考的答案,也許從這里面就會涌現(xiàn)出不少的商業(yè)機會。
難題一:數(shù)據(jù)中心設備種類繁多,特性性能參差不齊;
數(shù)據(jù)中心是由諸多電子設備組成的復雜信息系統(tǒng),設備種類繁多。即使是同一類設備,不同生產(chǎn)廠家的設備,實現(xiàn)功能也會有所差別。而且各種設備特性、質量參差不齊,對這些設備進行高效管理面臨很多問題。
難題二:多廠家應用,實現(xiàn)機制千差萬別;
至今為止還沒有哪個廠家可以生產(chǎn)數(shù)據(jù)中心所需要的所有設備,更多的廠家是生產(chǎn)一種或幾種數(shù)據(jù)中心設備,提供數(shù)據(jù)中心某個方面的解決方案,這就需要數(shù)據(jù)中心部署多個廠家的設備,過于依賴一兩個廠家,這樣在設備采購價格上面也會失去話語權。有個數(shù)據(jù)中心對于一類設備往往也會部署多個廠家的設備,這樣讓設備廠家之間競爭,數(shù)據(jù)中心從中可以獲得性價比更高的設備。但是在一個數(shù)據(jù)中心里部署多個廠家的設備也面臨著很多問題,尤其是管理問題。比如網(wǎng)絡設備,不同網(wǎng)絡廠家的設備命令行都不同,命令含義更是千差萬別,設備維護管理難度大。很多網(wǎng)絡廠家的設備都有一些自己的私有協(xié)議,這些協(xié)議無法和其它廠家的設備互通,給業(yè)務部署帶來極大的不便。
難題三:設備數(shù)量大,位置分散,管理任務繁重;
工信部曾劃分了數(shù)據(jù)中心規(guī)模等級,具體如表1,其中功耗2.5千瓦為一個標準機架,一個標準機架可以放置10臺服務器或者兩臺中端的網(wǎng)絡設備,一個大型數(shù)據(jù)中心就會擁有至少10000臺的服務器,數(shù)量龐大,管理起來任務繁重。有些數(shù)據(jù)中心是由多個地區(qū)的分中心組成的,距離很遠,全部遠程管理,實時性也較差。
數(shù)據(jù)中心等級 |
規(guī)模(機架) |
中小型數(shù)據(jù)中心 |
小于3000 |
大型數(shù)據(jù)中心 |
大于等于3000,小于10000 |
超大型數(shù)據(jù)中心 |
大于等于10000 |
表1:數(shù)據(jù)中心規(guī)模等級
難題四:數(shù)據(jù)中心安全無處不在,顧此失彼;
數(shù)據(jù)中心安全問題越來越引起人們的重視,最近的“心臟出血”事件,之前的“斯諾登”事件都引發(fā)人們對數(shù)據(jù)中心安全的擔憂。數(shù)據(jù)中心處理的各種信息數(shù)據(jù)本身就具有保密性,涉及人和物的隱私,一旦數(shù)據(jù)泄露或者受到損害,都是帶來嚴重損失。
難題五:網(wǎng)絡瓶頸,網(wǎng)絡攻擊不能及時發(fā)現(xiàn);
現(xiàn)在數(shù)據(jù)中心處理的數(shù)據(jù)量天天都在增長,數(shù)據(jù)中心的網(wǎng)絡帶寬遲早有一天會被耗盡,也正因為此,才會在各地出現(xiàn)建設數(shù)據(jù)中心的熱潮,擴容、新建數(shù)據(jù)中心的項目比比揭示。
難題六:時間混亂,應用事件順序無法正確反應;
做任何事情都要有序,數(shù)據(jù)中心同樣如此,數(shù)據(jù)中心里的各種設備之間協(xié)調工作,靠的就是時間,根據(jù)時間順序來分別完成各自的工作,從而向外提供應用服務。
如上的六大管理難題幾乎在每個數(shù)據(jù)中心都會遇到,解決好這些問題,將大大簡化數(shù)據(jù)中心的管理復雜度,提高數(shù)據(jù)中心的運行效率。針對這些難題,我們需要一些有效的手段來積極面對。
解答一:統(tǒng)一網(wǎng)管;
現(xiàn)在的數(shù)據(jù)中心如何不進行網(wǎng)管部署,幾乎無法進行設備管理。通過網(wǎng)管可以有效完成:拓撲發(fā)現(xiàn),設備管理,Trap告警,日志管理等工作。一個行而有效的網(wǎng)管將很好地解決設備種類繁多,性能參差不齊的問題。
解答二:優(yōu)選標準協(xié)議,跨廠家兼容;
數(shù)據(jù)中心應該是開放的,而不是封閉的,禁止使用一些私有協(xié)議,大力發(fā)展標準協(xié)議,要求設備廠商支持統(tǒng)一標準協(xié)議,在數(shù)據(jù)中心部署所有設備都支持的標準協(xié)議,保證所有廠家設備兼容。
解答三:集群、虛擬化應用,化繁為簡;
數(shù)據(jù)中心設備數(shù)量龐大,非常不好管理。而通過部署集群應用,就可以很好地管理設備。還有虛擬化應用,可以將數(shù)十臺設備虛擬化成一臺設備,通過對一臺虛擬化設備操作就可以完成幾十臺設備的管理,管理的工作量大大減少。
解答四:實時監(jiān)控,防范攻擊;
數(shù)據(jù)中心要想實現(xiàn)安全運行,就要部署多級安全防護,從數(shù)據(jù)中心接入到內部,從物理層到應用層,全方位地進行保護。現(xiàn)在的安全設備也有不少,完全可以實現(xiàn)24小時無人職守自動監(jiān)控。數(shù)據(jù)中心管理永遠要保持“安全第一”的工作態(tài)度。
解答五:預防擁塞,消除瓶頸;
數(shù)據(jù)中心帶寬是有限度的,從運行成本角度考慮,應該盡可能地利用現(xiàn)有的網(wǎng)絡帶寬,對應用進行合理布局,消除數(shù)據(jù)中心中可能存在的網(wǎng)絡瓶頸。不要盲目地擴容,通過對流量的細致分析,找到瓶頸,花最小的代價換來網(wǎng)絡容量的提升。
解答六:NTP服務統(tǒng)一時間;
NTP協(xié)議是在數(shù)據(jù)中心里應用廣泛的時間同步協(xié)議,可以將數(shù)據(jù)中心所有設備的時間統(tǒng)一起來,這樣所有的設備都擁有幾乎相同的時間。這樣整個數(shù)據(jù)中心的日志,Trap才有參照性。除了NTP,還有精度更高的授時設備,專門用于提供精確時間,供其它設備使用。時間同步設備是數(shù)據(jù)中心管理不可缺少的重要部門。
除了這些解決問題的方法,還有更多沒有列出。在解決數(shù)據(jù)中心管理難題的過程中,就會發(fā)現(xiàn)任何一種技術都有其使用的優(yōu)點和缺陷,從來沒有一種技術是盡善盡美,毫無缺點的。我們需要在數(shù)據(jù)中心實踐中不斷積累,逐一解決這些管理難題,給數(shù)據(jù)中心管理插上騰飛的翅膀。