編者按:最近幾年,企業應用云化越來越明顯,很多企業把公司的業務轉移到云平臺上,完成遷云之后原有的數據中心會被控制出來。這時很多企業會選擇出售這些閑置的數據中心,而這些數據中心一般會被托管服務商(比如云服務商等)買入,然后服務商將這些資源整合到自己的平臺中,然后再出售給用戶進行使用。
我們知道數據中心在發展到一定的規模的時候,一般都會面臨或多或少的一些問題,常見的比如數據中心物理空間不足、硬件設備老化、硬件設備的效率低下、網絡的擁堵、各種安全隱患、電力緊張以及管理效率降低等問題,這些可以說是一些老舊數據中心的通病。
即使是老舊的數據中心仍然具有它的價值,云廠商提供的產品中,同類產品一般會存在多個檔次。以云硬盤為例,底層對應的物理存儲設備可能是高性能的SSD盤、一般的SSD盤或者機械盤,用戶可以根據自己的需要進行按需購買,老舊數據中心中的存儲設備可以用來部署性能相對較低的數據盤業務。
當然數據盤只是一種情況,其他的設備基本也都可以按照數據盤的思路二次利用起來。這種直接使用老舊數據中心的方式只是一種思路,除了這些我們還可以對老舊的數據數據中心進行現代化的改造以符合當前業務得需要,這部分我們在后面的內容中還會專門描述。
從2018年的云計算市場報告我們也可以看出,云計算的市場增長仍在繼續。筆者近期注意到,根據媒體的報道,今年處于待售狀態的數據中心的數量比過去幾年中的任何一個時間點都要多,難道真的如報導所說數據中心正在消亡嗎?
01
被歪曲的事實
企業服務上云近年來確實是個大趨勢,云計算興起之前很多公司都有自己的數據中心,企業業務上云之后由于數據中心一般不會被長期閑置,從國內的實際情況來看,這種情況下企業一般都會尋求出售自己的數據中心(畢竟地租、電費、維護等成本都不低),這些數據中心被售出之后一般很快都會以云資源的形式被再次使用,所以云計算的發展導致數據中心的消亡是個偽命題,畢竟云計算平臺也是強烈依賴于數據中心的。
那么問題來了,數據中心總體是在向前發展還是在逐步萎縮呢? 要回答這個問題其實看下云計算未來幾年的發展趨勢即可,在筆者搜羅了幾個比較權威的機構的預測結果:
(1) IDC
IDC公司的預測結果顯示,未來幾年全球公有云計算市場的營收將會從2018年的1800億美元增長到2021年的2770億美元,增長額接近1000億美元,增長率達到54%。
(2) Forrester
Forrester 公司的預測結果顯示,未來幾年全球公有云計算市場的營收將從2018年的1780億美元增長至2021年的3230億美元,增長額為1450億美元,增長率約為81%。
(3) Gartner
Gartner 公司的預測結果顯示,未來幾年全球公有云計算市場的營收將從2018年的1760億美元增長至2021年的2780億美元,增長額為1020億美元,增長率為58%。
毫無疑問的是全球公有云、私有云市場以及IDC托管都在以極為驚人的速度在增長,尤其是國內外知名的那些公有云大廠,比如自2010年以來,亞馬遜AWS 的云計算營收每年的復合增長率都超過60%,這種增長勢頭一直持續到2018年。2018年的上半年亞馬遜AWS的營收同比增長約50%,總營收從2017年第3個季度的36億美元一度上升到2018年第2季度的61億美元,中間相差不到一年。
如果我們把亞馬遜AWS 2018年第2季度的營收粗略的當做2018年季度平均營收,那么AWS 2018年的總營收會達到244億美元,比2017年的總營收大約增長了100億美元。
微軟2018財年第4季度的報告顯示,公司的服務器產品和云計算產品的營收同比增長了45億美元,增長率約為21%,據分析這部分的增長主要來自于微軟Azure 和服務器產品獲得內部產品的認可并被采用的結果,但算Azure 的營收的話增長率達到了91%。
不論是公有云還是私有云以及混合云,其底層的基礎資源設備都需要部署到數據中心中,如果上文中預測成立的話云計算在未來幾年勢必會繼續保持快速的發展,因此數據中心也必須一并快速發展。
需要注意的是,技術在發展過程中一般都會伴隨著老舊技術的淘汰,在這一點上云計算也不例外,因此未來數據中心的發展還會面臨一系列的問題,比如設備老舊帶來的運行效率和成本效益問題以及擴展性的問題。
02
云計算未來幾年的發展
我們知道云廠商的數據中心并非都是自建的,由于數據中心的建立需要考慮很多的因素,光是選址可能就需要需要耗費很多的時間。在云業務的快速成長期自建數據中心可能來不及,因此很多的云廠商這個時候會從基礎設施提供商那里租賃現成的數據中心。在這種背景下,曾經有一位著名的分析師預測,隨著越來越多的企業將自己的業務遷到云服務商所擁有的的超大數據中心之中,企業自己擁有的數據中心將會逐漸的消失,因為相比云服務商一般的企業很難自己快速的建立起足夠的容量。
還有一點需要注意,并不是所有的企業應用都適合遷移到公共的云平臺之上,從實際來看很多企業出于業務屬性的考慮選擇的是私有云,這些私有云平臺一般是直接部署在用戶自己的數據中心或者部署到托管的數據中心中。從近幾年的數據來看私有云市場在增長率上不如公有云,但私有云的市場的基數大,導致目前私有云市場的收入目前還是高于公有云的,比如根據451 Research 2018年的調查,2018年私有云市場的營收比公有云市場的營收要高出43%。
另外,如果未來云計算市場的發展符合預測的話,即使是這些云計算大廠恐怕也很難應對這樣大量的數據中心的建立,在這種情況下云計算廠商勢必會向數據中心托管服務提供商需求幫助或者合作。
如果分析師的預測成立的話,那么未來幾年我們需要添加多少資源呢? 這個不是很好評估,但是計量單位就很難選擇,是選擇機架作為單位呢還是數據中心作為基本的單位呢?針對這個問題,業界比較認可的方式是采用機架作為基本的評估單位,因為數據中心規模目前全世界并沒有一個統一的評估標準。為了找到問題答案,我們先做兩個假設:
(1) 假設數據中心中的機架大部分都是標準的8KW供應的機架。
(2) 假設每個機柜滿負載(8KW)運行時每個月可以獲取4.5萬美元的營收。
基于以上兩個假設,下面我們開始我們的推斷,看下為了支持近幾年云計算的發展我們需要增加多少基礎資源設備。
前文中我們引用了三家評測機構對未來三年云計算營收的評估數據,在此我們以最知名的一家Gartner 為例推算未來3年需要的基礎設備數量。Gartner 預測2018年到2021年之間的36個月中全球云計算市場的規模將會擴大1020億美元,這個個數據相當于每個月將會增加28億美元。上文中我們假設每個滿負荷下的標準機架每個月帶來的營收約為4.5萬美元,則全球平均每個月需要新增約6.3萬個標準的機架。每個標準機架滿負荷下的功率為8KW,則全球每個月新增數據中心的電力容量會達到500兆瓦。
在此筆者專門查了下,目前全球新建一個1兆瓦的數據中心的平均成本為800萬美元到1000萬美元。假設未來三年新建數據中心的成本保持不變(一般會逐年增高)的前提下,為滿足未來三年中每個月新增500兆瓦的需求,未來三年全球每個月用在數據中心新建上的成本約為40億美元到50億美元。
從我們推算的結果可以看出,未來三年需要新建或者改造數量眾多的數據中心。那么問題來了,未來三年我們該如何保證可以提供這么大數量的數據中心?還有一個問題,那就是我們除了新建數據中心還沒有其他的辦法呢? 答案是有的,那就是整合現有的數據中心,進行老舊數據中心的升級,完成數據中心的現代化,讓老舊數據中心在未來的三年中重新煥發生機。
03
數據中心現代化
程序員大部分情況下只會去關注軟件層面的更新換代,其實作為云計算平臺的基礎設施,未來幾年數據中心的現代化也是至關重要的。為適應未來幾年(不僅僅是未來幾年,只要上層應用在發展,依托的數據中心也必須要進行發展)云業務的發展,數據中心在技術層面上必須保持進步,以免技術落后導致競爭力下的下降。數據中心在技術迭代跟不上的話,還可能給上層的業務帶來風險,比如如果數據中心在安全這個層面上沒有與時俱進,數據中心很容易會遭到新出現的復雜的網絡攻擊,在這方面不乏先例,單從這幾年日益頻繁的網絡攻擊來看也能從側面反映出未來數據中心面臨的技術升級壓力。
數據中心中一排排整齊的機架,不同設備都有自己各自的位置和標簽,跟我們的城市很像,去過數據中心的同學應該都有這種體會。數據中心的整合類似城市改造,通過對老舊數據中心的機房改造、資源整合、結構優化、系統遷移、網絡改造等方式,可以讓老舊的數據中心更加高效、經濟、可靠。
接觸過數據中心維護這塊的同學應該知道,數據中心工程人員和維護人員基本上就是維持這樣一個原則:不損壞,就不動。這種情況并不是個例,可以說是常態了。這幾年用戶對數據新需求的增加和日益嚴峻的安全風險,需要數據中心管理人員逐步的改變自己的過去的工作方式,需要從過去的被動工作模式逐步的向主動模式改變,需要主動的配合上面業務方使已有的基礎設施資源的效率發揮到最大,加快應用程序和基礎的IT設施的發展。
上文中我們已經了解到未來的技術發展對數據中心現代化的迫切需求,企業要想有效實現數據中心的現代化面臨著很多的前期工作,從筆者了解到的一些業界的數據中心改造項目來看后續的整個現代化的過程需要投入大量的時間和成本,但數據中心現代化需要付出的代價從長遠看來是值得的。下面我們看一下目前業界在數據中心現代化改造和更新方面的具體措施。
1. 技術持續更新
大部分企業數據中心中大部分時候老舊設備的更新換代是在設備損壞后才進行的,但從實際來看老舊過時的設備通常需要更多的操縱成本和維護成本,且可能會存在影響用戶既有業務的風險。
針對這一點一般建議企業建立資產跟蹤,對現存的每一臺設備都要建立檔案庫,同時管理人員需要了解每一臺老舊設備的使用壽命以及是否在保修期等問題。數據中心上層的云平臺管理人員在上層的監控系統中發現疑似硬件設備問題時要主動聯系機房管理人員進行設備的確認,因為從實際使用來看部分設備在即將出現問題但未出現問題時機房的告警平臺有時是發現不了的。確認是硬件設備問題后,就需要機房的管理人員盡快進行設備的更新。
另外一般建議數據中心中都要配備基礎設施管理軟件(DCIM),這樣在不依賴于上層的云平臺管理人員的情況下數據中心管理人員也可快速的了解到即將淘汰的數據中心組件,另外數據中心管理人員也可根據DCIM系統了解到每臺關鍵設備的電量消耗情況,從而可以在設備故障前發出告警,提醒管理人員及時介入處理。
2. 制定工作流程
借助DCIM 系統規范數據中心的資產管理工作,DCIM工作流可以幫助我們跟蹤每個數據中心的幾乎所有的資產管理工作。 數據中心管理人員在每次進行設備的配置變更時都要在DCIM系統中注明本次所做的操作、本次操作所耗時間以及本次操作額執行人等,如果本次操作中出現過異常的情況則還需要注明本次操作的注意點,防止后續管理人員在操作時再次踩坑。
一般可以專門為這些數據設置一個專屬的數據庫,這樣可以幫助我們更加輕松的進行資源的安排、工作訂單的生成,更加重要的是這樣可以確保團隊操作的順利性。 增加工作流程的一致性和問責性可以幫助團隊更加高效快捷的工作,從而提高企業的生產力。
3. 周期性故障模擬
停電對于數據中心來說可以說是重大的故障,如果數據中心沒有備用電源或者主電源中斷后備用電源沒有切換成功會給企業帶來巨大的損失。根據美國一家公司Hexa Research的調查統計,但是美國的數據中心每年由于停電所造成的損失高達5500萬美元。因此一般建議每一個數據中心都要進行電源的強化配置,在配置主備電源后也要周期性的對數據中心的供電系統進行周期性的斷電測試,防止配置主備后當主電源真的被切斷后備用的電源不能及時的切換。
實際的斷電模擬測試中并不是直接將所有的電源切斷,一般數據中心中還會根據機器的上所跑業務的重要程度配置不同的電源系統,因此數據中心的管理人員還要知悉數據中心中哪些機器是核心的機器,在進行電源斷電測試時需要對核心的機器進行著重的測試。
4. 混合部署
隨著時間的推移,一個數據中心中的機器一般會越來越多,這么多的機器一般不會進行單一的部署,未來數據中心的戰略是一種混合策略。數據中心的混合部署一般會包公有云、私有云以及基礎設備的托管。
混合部署的策略的優勢在于其靈活性和適應性,通過實施混合策略可以將應用程序和用戶的工作負載部署在性價比最高的機器上,提高機器的利用效率。
5. 虛擬化改造
我們知道虛擬化不僅可以對底層的資源進行充分的利用,另外還可降低一些工作負載的風險。雖然虛擬化的系統中部分軟件的性能水平不及直接部署在硬件之上的水平,但是由于大部分情況下硬件的性能并不會被榨干耗盡,而是維持在一個不高的水平之上,剩下的計算能力可以借助虛擬化進行合理的使用,因此虛擬化改造會具有更大的,靈活性和控制能力。
DCIM解決方案仍然是現代數據中心中工作的核心管理軟件,借助DCIM 數據中心管理人員可以對整個虛擬化層的資源進行分配、跟蹤,對數據中心中底層資源進行有效的利用。
04
最后的話
從市場的實際需求來看,不論我們采用什么樣的預測方式,未來幾年內我們都需要大量的數據中心,尤其是在5G開始商用的背景之下。為了確保未來的數據中心可以滿足市場的需要,接下來幾年的數據中心的改造和新建必須在成本控制、機器效率、功率密度以及快速擴展能力上進行優化。
模塊化的設計可以提高數據中心的部署效率,尤其是對于超大規模的數據中心這種情況。所以后續在對托管服務提供商進行評價時可以將服務商是否采用了模塊化構建方法構建數據中心來作為其中的一個評價標準。
DCIM 現在仍是數據中心中核心的管理軟件,為適應未來幾年不斷變化的技術生態系統的需求,建議每一個想要進行數據中心現代化的企業將DCIM 引入自己的數據中心管理之中。