伴隨著國家電網的IT架構演變歷程,作為國家電網直屬單位的南瑞信息系統集成公司(以下簡稱“南瑞集成”)在虛擬化和云計算領域進行了深入的探索,歷經了傳統架構到虛擬化再到軟件定義數據中心(SDDC)的演變。在本文中,南瑞集成CTO徐戟深度介紹了國家電網的軟件定義數據中心應用實踐。
數據中心變革的動力是什么?
縱覽中國信息化時代的整個過程,數據中心變革的動力到底是什么?其實可以分為三個階段來看。首先是90年代初期,當時的應用都是TS結構,也就是終端服務器結構的,依靠一個強而有力的服務器拖起很多終端,所有的計算都在服務器端進行。這種終端/服務器模式推動了中型機、大型機的發展;接下來,隨著技術發展逐漸開始有了C/S架構,服務器客戶端架構開始流行,后來出來了BS架構、BSS架構等等。這種架構的出現,解放了服務器的計算能力,大力推動了小型機的發展;現在,隨著互聯網應用逐漸廣泛,分布式的架構也在迅速發展。因此,數據中心變革很重要的推動力是應用架構的變革,應用架構推動了數據中心的變化。
傳統數據中心存在哪些問題?
傳統的架構是90年代中后期形成的,以IOE為核心,以大型數據庫、集中式存儲加上高性能的服務器組成架構,這種架構雖然在當時可以滿足業務的迅速擴張,但是隨著業務到了一定規模的時候,傳統數據中心存在的問題就會暴露出來:
以IOE 為核心,受制于人;
擴展能力不足,性價比不高;
煙囪式建設,離散式管理;
設備種類繁多,運維難度大;
個體差異大,無法制定統一維護策略;
部署周期長,嚴重影響系統上線進度;
資源調度不靈活,大量系統等待擴容,同時大量系統資源利用率嚴重不足;
浪費嚴重,機房空間難以為繼。
如果繼續不做改變的話,企業的IT成本就太高了,于是企業開始寄希望于分布式的架構,有了一個很火的詞——去IOE。其實去IOE本質是分布式架構替代傳統架構的IT架構的變革,互聯網企業在這里面做的很好,這方面傳統行業必須向互聯網企業學習,但是傳統行業的應用特點和互聯網行業的應用特點是不一樣的,簡簡單單的用分布式架構來替換傳統架構是不現實的,需要根據自己實際情況去考慮應對的策略。
所以南瑞集成的策略是“按需定制、深度集成”,通過對服務器、交換機、存儲、高性能IO等IT基礎設備,以及操作系統、數據庫等軟件進行深度集成(進行碎片化處理),并對相關參數配置以最佳實踐數值,定制真正契合企業需要的深度集成軟硬件一體的解決方案。
國家電網IT架構發展路線
如上圖所示,國家電網的發展路線是逐漸把小而散的系統整合成一個大的系統,甚至到國家電網總部進行部署。但是我們后來發現這些系統的資源使用率很低,我們在機房里做過調研,一千多臺服務器中CPU小于1%的服務器占了70%。所以五、六年前國家電網開始進行虛擬化資源池的建設,這個建設還是很有成效的,通過虛擬化建設使IT資源得到了很好的利用,不用繼續投資去擴充機房與服務器,節約的資金量是每年是以幾十個億來計的。
隨著資源池的建設使用,我們發現光建立一個資源池是不夠的,沒有解決資源調度需求的敏捷性,雖然對資源整合、資源使用率提高了,但是運維和其他方面還是有很多問題,所以我們開始著手搭建下一代數據中心——通過軟件定義的數據中心,其中有四點是我們的硬性要求:
全整合。整個軟件定義的數據中心應該把所有的IT基礎架構都納入起來,剛開始可能做不到,但是隨著整個建設不斷的進行,必須將全部的IT架構納入進來;
敏捷。例如,在軟件定義的數據中心里想要去建設一個平臺,我可以通過固有的模板很快生成整體的架構出來,比如說建立一個環境,需要2臺數據庫服務器,需要5個T的存儲,需要20臺應用服務器等等,這些東西可以在快速的完成部署、交付使用。
安全。我們對于安全的看法有很多已經過時,比如說物理隔離概念是什么?當年推進資源池建設的時候,很多應用部門和我們談,我們需要物理隔離,就是網絡硬件不能在一起,那我們還怎么做資源池?隨著后來對整個物理隔離的概念重新的定義,這個壁壘逐漸的消失。
高可用。整個IT平臺提供了跟業務應用連續性相關的所有因素,而不需要在應用系統再去獨立的設計。
上圖是我們軟件定義數據中心的架構圖,物理資源層包括分布式存儲、分布式系統、傳統的網絡和設備,上一層資源管理層次進行管理。最終平臺服務層對外提供相應的服務,數據管理層進行所有的數據的備份和容災等,運維管理層來實現自動化的運維和監控、分析。
目前此軟件定義數據中心目前在國網的應用場景主要有以下幾個:
國網測試云平臺
一體化售電平臺(企業公有云)
智能電網綜合IT平臺(企業公有云)
電力調度云平臺
對于未來我們也有一些愿景,我們希望軟件定義數據中心可以實現以下幾點:第一,是構建兼容化的;第二,技術自主化;第三,能力服務服務化;第四,供應快速化;第五,資源彈性化;第六,管理自動化;第七,管控集中化。
傳統行業數據中心如何擁抱私有云平臺?
接下來談談傳統行業數據中心如何去擁抱私有云平臺,主要有四個問題。
第一,我們是采用選擇一站式還是開放式的架構?
其實這跟企業策略有關。首先,開放式要有足夠的研發能力;其次,有沒有做好持續投入的準備,在這個平臺上隨著業務越來越多,隨著需求越來越大,研發費用需要不斷的投入,開放式的架構才能支撐這樣一個項目。
當然我們還有其他的選擇,就是在一個超融合架構上進行二次開發,這樣要求超融合架構具有足夠的開放性,能夠開放幾乎所有的API給這些用戶,這樣可以在上面做很深度的二次開發,投入會更小一些。
第二,如何融合以前的存量的設備?
我看過青云的資料,發現他們可以通過系統集成的方式來整合。未來他們還會開放相應的API接口來對接傳統的軟硬件平臺,這點非常重要。我認為整個數據中心最后全要納入到軟件定義框架中來,才算是完整。
第三,如何聚合計算能力?
所有的云平臺都是將基礎資源虛擬化,整個資源打散給大家用,這解決了計算能力過剩的問題,如何解決計算能力強制性的要求?目前我們看到的公有云、私有云的解決方案里并沒有很好的答案,這并不僅僅是說在IaaS層面解決的問題,其實是要靠集群的技術,包括分布式數據庫,Hadoop等分布式算法這樣的技術實現聚合。
第四,如何規避政策壁壘。
IT政策要與時俱進,傳統的政策是90年代建立起來的,我們有必要對IT政策進行修正,這是領導層面對的問題。同時對物理隔離的概念需要打破,如果抱著物理隔離來擁抱云是不可能的。
建立屬于自己的軟件定義數據中心
在數據庫方面基于開源技術開發了四款解決方案,NBase數據庫是由南京南瑞集成公司自主研制的數據庫系列產品,其數據庫產品包括高可用數據庫集群(NBase-E)產品、分布式數據庫集群(NBase-D)產品、分析型數據庫集群(NBase-C)產品、NoSQL平臺(NBase-H)產品。
另外還有瑞騰(Return)高性能計算平臺,它是為國網核心業務系統量身打造的一個高性能、可擴展的計算平臺,利用目前前沿的高性能計算組件,使用自主的定制化服務器、IB交換機、分布式存儲系統整合。如上圖,瑞騰高性能計算平臺,上面是計算的節點,我們可以使用四路的PC服務器,插上SSD的卡,SSD容量是有限的,我們后面有一個層,是分布式存儲,標準配置是9060的存儲,隨著需要可以進行擴展。
寫在最后
文章最后分享兩句話,第一句1984年 John Gage說的:“網絡就是計算機”,第二句呂健院士說的:“應用場景就是計算機”,1984年說出網絡就是計算機的時候大部分人都不明白,因為當時大部分人不知道網絡是什么。第二句話應用場景就切合了“按需定制,深度集成”,我覺得后續其他的傳統企業按照這8個字來做文章,應該是一個比較正確的道路。
作者簡介:徐戟,南瑞信息系統集成公司CTO,網名白鱔,《DBA的思想天空:感悟Oracle數據庫本質》、《Oracle優化日記》、《Oracle Rac日記》等暢銷書作者。1992年開始從事系統集成行業,曾供職于DEC、賽格計算機、長天集團、聯想金融事業部等,擔任過技術總監、應用體系總監。