5月26日,企業網D1net攜手上海CIO聯盟組織“上海CIO沙龍”活動,共同探討了各行業新技術驅動新業務的信息化實踐。
主持人:云計算發展到今天,已經有10年的歷程了,我們看到,云計算體現出了巨大的活力和生命力,云計算不僅讓IT更加簡單,也讓更多企業擁抱了互聯網,壯大了自己,提高了企業的靈活性和競爭力,接下來我們有請寶信軟件政企事業部經理杜磊先生給我們帶來寶之云領先服務助力企業云化戰略。
杜磊:各位嘉賓下午好!首先感謝為我們搭建這個平臺進行分享和交流,我來自上海寶信軟件。我今天跟各位嘉賓分享的主題是寶之云管家服務助力企業云戰略落地。其中包含了兩個主題,第一個是管家服務,這是對我們服務的一種定義,有別于傳統公有云服務的標準服務,我們的管家服務,從企業的需求、設計到資源規劃,交付,以及后期的整個運維的全生命周期的服務。第二個是企業云戰略落地,剛才主持人已經提到,云技術已經發展了10年了,已經成熟了,我們回過頭來看,有一定規模的傳統型企業,真正把核心業務系統通過云服務方式云化的還真不多。云化哪些業務和服務呢?除了大家有一些安全上的顧慮,還有一點,怎么云化,對企業來講,已經經過了長時間的信息化建設,有大量的遺留系統,網絡架構也是穩定的結構,如果入云,對整個結構會產生翻天覆地的變化,對正常業務的運作產生很大的影響,我覺得這是不可接受的,后面我通過一個實際案例的分享,把我們的一些體會、經驗分享給各位CIO,各位嘉賓一塊來探討一下,看看能不能從這種方式,通過管家式的服務,能夠解決最后一公里的問題。
首先,把我們公司的情況簡單地說一下,寶信公司是2001年在上海上市的,它屬于寶武集團的成員企業,以前的寶鋼,現在的寶武,實際上30年來一直關注在企業信息化的解決方案上面。目前公司把云計算、通訊這些業務作為主要的戰略發展方向。寶之云是我們的一個云服務品牌,在我們寶之云里面經過我們的定位,我們的目標客戶是誰?我們很清晰,定位成企業級用戶,而且有一定規模,因為寶之云一直為企業服務,所以積累和經驗是在企業服務上面。第二我們也知道企業級用戶需要的是什么,不僅僅只是資源,還需要穩定的持續運行的環境。
第二從我們服務的內涵來看,一共是兩方面的形態,一個是我們從機房托管,PaaS到SaaS三個云層次的服務,從滿足用戶的個性化需求來看,我們也提供公有、私有、云的解決方案。這是目前的實景圖,我們在上海市寶山區有一個3平方公里的數據產業園,以前它是一個煉鋼廠,后來因為產能轉換,就閑置下來了,我們后來把整個的廠區承接下來,它有充沛的電力和土地資源,我們直接對這些廠房進行改造,可以直接搭建成一個高標準的數據中心。目前實際上已經有12000個機柜的交貨量,我們規劃在2018年達到上萬個機柜,目前是亞洲單體密度最大的云計算數據中心。
這是我們目前提供的主要的云的一些解決方案,一個是虛體實有,這個不多說了,就在我們公有云上通過一些隔離的手段劃一塊區域給企業用戶使用,在這個領域里面可以按照自己網絡的結構進行自定義一些工作。第三個專屬云,這塊實際上我們看下來政府云都是專屬云的方式,我認為它的區別實際上從某種角度來講就是私有云,從技術角度來講,我認為跟用戶自建私有云沒有什么區別,只是在商業模式上有一些區別,所以專業云作為云服務商來投資,我們的用戶是作為服務的方式來享受,一個是混合云,可能是把云服務商的數據中心和企業自己的數據中心之間的結合,還有一種是托管,可能整個云要自建,但是機房不用,運維交出來,放在整個機房的環境里面,還有一個是災備,我們目前可以根據用戶的需求提供5種云解決方案。這是我們目前已經具備的災備的架構,目前我們的總部是在寶山,災備中心在張江,整個寶之云已經具備了完整的災備結構,提供4、5、6級的災備服務。
這是一個體系架構,這個是比較標準的三層架構,這里面提到了一個特別的地方,企業的需求比較復雜,這里我們會提到有小級資源池,這可能在很多云服務商不太多見,很多的企業級用戶可能一個系統還在小級上面,但是可以用x86,但是這個工作可能是比較繁重的。第二塊我們提供一些物理設備,我們以前碰到過有的客戶對數據的要求非常高,我可以用你的計算資源,但是你的存儲資源我要適用,我要建自己的存儲陣列,這種方式我們也提供。在PaaS層面,客觀來講我們除了提供一些開源的東西以外,我們還有很多商用的,這也是因為我們企業的大部分都是基于商用軟件開發的,如果一下子全部遷移到開源上面,我覺得還是有巨大調整工作的。
右邊是我們的云管理平臺,我認為對于一個云數據中心來講這是核心,這么大體量的數據中心怎么進行管理, 這是一個非常重要的問題。這塊我想我們是叫五一級,有5塊功能,資源配置、運營、流程、監控、自動化運維管理,可以通過我們的同等的自主門戶來進行功能上的一些使用,我們的后臺的管理團隊推動我們的管理門戶進行功能上的一些使用。我們后臺的管理團隊通過我們的管理門戶對這個部分進行訪問。目前我們通過云管理4年多的實際使用情況來看,實際上90%的故障事件通過自動監控就能發現,而不需要人通過傳統的方式通過人去發覺,同時這些問題有80%能完全做到自動化處理,因為有的故障處理的方式可以把它積累下來,可以把它總結下來,我們這里的運維管理可以把整個的故障事件進行一些閉環的處理。總的來說,因為它是融合了我們為企業服務的一些經驗在里面,第二我們支持異構平臺的管理,強化了整個平臺的靈活性。
這是我們的服務,前面我們提到,服務在這里叫管家式服務,我們會針對不同的階段為用戶提供不同的服務內容來包括我們的用戶,我們的系統如何云化的這些管理要求。
總的來說,我們的特點是8個字,貼身服務,安全可控。作為我們出庫來講,如果到了我們的寶之云里面,我們配置了一對一的服務經理,和傳統的公有云服務可能不一樣,專屬的服務團隊,整個的服務是覆蓋整個項目的生命周期,解決用戶最后一公里的困擾。
第二我們是通過我們自主研發的云管理平臺,滿足用戶多維度的安全管控的要求。第三我們的云是從2012年開始建設起來的,所以目前400多個系統在我們云里面,最大的是我們的寶武集團,它的整個的管理的系統全部是在寶之云上面,我們當前的運行率達到五年4個9,所以我們可以為用戶提供高效穩定的運行。這是我們的一些認證,我們去年6月份通過公安部的認證,安全合規性比較高的標準。這個是安全生產部的可信云的一個認證。這是我們主要的用戶,比較大的客戶,一個是阿里,阿里的上海就放在我們的產業園里面,寶武、寶鋼,整個的私有云就是我們幫著承建,運維。還有一些政府,寶山區政府,還有海關總署,還有一些金融企業。
前面我們把寶信和寶之云的整體的情況跟各位嘉賓做了分享。現在我們主要把時間放在實際案例的分享。
這個是上海醫藥集團云化案例。上海醫藥集團在中國化學制藥行業是龍頭老大,地位很高,在整個醫藥行業里面也是排名第二的一家集團型企業。它當時這個需求是在2016年大概6月份的時候,那時候有兩方面的需求,一個是業務發展的需求,那段時間整個上海醫藥集團的信息化建設步驟非常快,系統特別多,實際上基礎環境這一環節制約了它的一些發展,因為他的機房能力不夠,寸土寸金的地方,人員跟不上,它的在企業里面對設備的申購的周期的要求往往跟不上上線的節奏和時間,所以這是一個非常大的問題。第二個是隨著他的業務系統越來越多,總部大概有30多個系統,越來越多的情況需要考慮,當時有兩種方式,到底怎么來做。一個是自建,當時在自建的時候也很明顯,機房肯定是不會再建,肯定是通過托管的方式進行自建,還有一個是通過第三方購買云服務的方式進行建設,當時對這兩個研究也進行了多方面的比較,最終通過幾個維度過來做了一個評判。
第一個從費用投入上,云服務方式分期來講,其中投入會很少,對企業的資金壓力肯定是小的,對于自建的方式來講,資金壓力肯定會很大的,一次性投入比較多。從服務的保障上也很清晰,第一個如果是云服務商的話他會提供一個集成24的完整的一站式服務,如果是自建的話,我說我的計算能力比較強,我可以自己服務也可以,也可以委托第三方服務,但是這里可能會分段式的,你可能會發覺我的機房給了某一家,網絡可能給了某一家,我的計算存儲給了另外一家,對用戶的管理上會帶來一些困擾。第三個,資源的獲取上也有明顯的變化,云服務上面可能是需要的時候就給云服務商申請,整個的響應時間非常快,如果是自己來的話,考慮到我們的管理的要求上,周期往往都比較長。我們企業里面要申購一批設備,從立項,到最終的招投標,到最后的簽訂,正常的情況下可能要半年的時間。這也是一個比較大的問題。從災備環境來講,如果我購買災備服務即刻就把災備體系建立起來了,如果是自建的話這個體系也是比較復雜的事情。后面我會談到為什么我們談災備談了很長時間,回過頭來看看我們有多少企業真的建了自己的災備系統呢?不多的。
使用難度上,一個是低一個是高可以理解。接受管理的復雜度上面一定也是這樣的,你如果全部是自建,它是一個龐大的工程,特別是已有的數據中心的情況下也是一個龐大的工程,技術風險上也是這樣的情況,技術周期上也是這樣的,一個是時間非常短,一個是時間非常長。所以后面通過分析比較以后,上海醫藥就決定采用建設專有云的方式。這里面我們會看到這塊的區域是由云服務商來負責提供,他提供主數據中心,提供災備數據中心,他逐步地把他現在的主機的計算和存儲的能力全部遷移到云服務商的主數據中心里面,這邊逐漸就蛻變成網絡的一個結點的機房。當時為了做這份云,我們的用戶也有一些要求。第一個云服務模式里面他要求提供一個全面的PaaS服務,從機房到線路,到安全到軟硬件資源,到后面的維護的災備要全套的。第二個技術上面也是有主要的技術要求,第一個機房的標準要達到,T23+語音也是比較高的標準了,我們來看現在企業自建的機房里面達不到這個要求的,很少很少。第二個等級保護要達到三級,這個是我們很多企業自建的話現在目前達不到的。第三個是災備服務要達到5級和6級,按照國標來看,這也是最高的兩個災備標準。第四個是允許他自帶部分物理設備入云,并能進行統一管理。我們也知道很多企業用戶的應用,有時候不是光靠虛擬化環境來解決的,可能需要一些物理設備。第四點是非常關鍵的,怎么解決平滑遷移,簡單來說我要把我入云以后你的地址不發生變化,這也是很多CIO遲遲走不了,這個問題不大,但是這個事情不解決是走不下去的,一個企業習慣了這么多年,把地址都變掉,這個事情就搞大了。第三個要求我們提供一個全方位的技術服務。
為了解決這些問題我們從幾個方面進行了一些考慮。
第一從網絡上,它整個的集團性網絡里面有兩個大的切入點,一個是控股,一個是大廈里面,他的總部里面,實際上我們這塊通過兩個裸遷,和我們的云,和我們的云中心打通,兩個點直接送專線,這樣就形成一個三點的環狀的結構,實際上任何一個點出現了問題,一個線出現了問題都不會影響到整個集團對云中心的訪問。第二在云中心里面,我們是按照他企業的組織架構,按照分子公司為一個單位,進行一個區域的劃分,VPC的化學,在每個VPC里面通過虛擬防火墻進行安全域的劃分,或者是也可以上你不同的安全手段給人控制,最終VPC通過VI手段打通,形成了一個分子公司的網絡的互聯,最終得到一個什么效果呢?是在遵循他整個的網絡規劃的前提下,網絡結構不做任何變化的情況下,IP地址不做任何的變化的情況下,在云中心實現了一個企業的網絡的架構。
第二個是安全,整個的安全是按照等保三級的標準來做的,從管理上面,參照體系標準,從安全防護上是從每個層級上,機房、網絡安全、主機數據、應用,每個環節都做了安全防護,關鍵一點是我們還有一個服務,我們是7×24的服務,還有一個專門的安全服務團隊,近期的這些系統進行一些專業的工具進行安全的掃描、審計、滲透式測試等等這些東西,確保整個安全的結構。
針對上海醫藥的要求,我們也有個性化的管家的服務,這里主要是分了一些階段。我們從整體的架構的設計,網絡設計以及資源的設計。在實現階段主要是做一些入云的計劃,這個是非常關鍵的事情,我們的云環境要交互,根據我們設計的情況進行云環境的交互,還有預測試,我們在之前都有一個預測試的階段。最終測試完以后找一個點做一個透明的,對業務沒有一個整體的切換。進入運營階段我們會提供一個專屬的服務經理,專屬的團隊,提供一個T324的云監控和維護。實際上在這個過程當中我們設計了三個服務級別,因為不同的運行環境對服務的要求不一樣,我們不能說都是按照T324,都能安全5×8,可能不一樣,所以我們設計了A類、B類、C類的級別,不同的環境有不同的服務要求,我們主要從幾個維度,從運行率,從故障響應時間,從服務響應時間等等這些維度切分了一下,我們后來建議對于核心業務系統的運行環境我們采取A類服務標準,對于次核心的業務系統我們用B類,開發測試我們是用C類,這個是為了我們客戶節省相應的投資費用。
這個是我們在做云遷移的方面的一些考慮點,原則上基本上是先次要后主要的方式,因為剛開始的時候大家還是有一個磨合和總結的過程,我們先做相對輔助系統的云化的工作。
思路上我們會進行一系列在我們云的測試環節里面進行一系列的驗證,運行、驗證通過以后我們再進行業務系統的切換,確保整個的切換是一個零風險的情況。
在方式選擇上有兩類,一個是CG的打包的方式,對于那種新上的運營系統整個的環境比較規范,整個的技術環境的軟件版本也比較新,補丁也比較全,我們直接就打包,直接就部署過去了。還有一種系統是比較老了,它的版本已經很低了,常年的補丁也沒有申請過,這種情況下我們采用軟的方式,我可以在我的云中心按照重新部署的一種方式解決現在的結構性的或者是安全性的問題。
在管理模式上,用戶管理團隊可以通過專有的云服務的門戶獲取這些信息,可以時時察看服務的情況,每套環境運行的情況,會有一個專業的服務經理,我們這邊有一個云服務經理,兩個人進行一對一的接口,可以針對一些需求,比如說資源新開要進行一對一的溝通。實際上我們在后面想把線下這塊工作放到線上去,準備把云管理平臺跟現在用戶的系統辦公平臺進行打通。整個走線上的審批流程,比如說有新的系統要上線,可以通過它的系統辦公進行云的申請,資源的申請,通過審批最終扭轉到我們的后臺,我們的后臺就按照要求,進行云環境的部署。
第三是在這里面他們用戶的管理團隊應用是由用戶自行管理,我們不借助用戶任何業務的數據,我們只是服務他底層的到他前面的管理,通過這種管理模式我覺得第一接口非常清楚,第二從職責劃分上也比較清晰,避免兩邊存在一些界面不清楚的情況。從付費方式來講,我們是考慮采用后付費的方式,是每半年按照實際的使用量和實際單價進行一個計費,實際上每個環節里面費用包含以下三個方面,第一個是云資源的費用,這個是按照實際使用了多少虛機,你的虛機是怎么一個配置的情況,存儲是怎么的容量來進行計算,第二個是云服務的費用,根據你選擇的服務等級ABC類有不同的費用。第三個是云災備,根據你選擇的2、4、5、6級的費用,這個就形成一個系統,我們按半年進行一次結算。
這是實際的建設的安排,實際上這個項目是在2016年2月份立項,7月份經過公開招標,寶信中標,7月份我們開了一個項目啟動會,這個也是必須的,主要是解決項目管理上的一些問題。8月份進行了需求分析,這個也非常關鍵,了解網絡的現狀,應用系統的現狀。第四個,解決是9月份開始的,這里面要完成設計的方案,還有一個,要解決大家在云服務的界面和流程上的設計,明確環境的等級和災備的等級。最終進入我們服務的提交,我們根據制定的方案,不同的云服務團隊就把我們的云環境交付出來了,同時,我們會在我們的環境里面先做預遷移測試,測試完以后就進入上線切換的階段。實際上切換的時間是很短的,每個系統遷移的時間取決于它的數據量,大概是1到2個小時,基本上,我們晚上找一個業務不繁忙的時間點一次性切換。通過這種方式,我們會感覺到,打個比方,如果是切換不成功,實際上不影響它,對它現有的環境沒有任何改變,它完成可以退回去,基本上是非常安全的方式。1月份是完成門戶的定制,3月份會完成一個災備的演練,一個系統按照6級還是5級的一個災備演練。3月份驗收,現在我們進入2期,把它其余的系統逐步地再云化。
這還有一個效果,我總結了幾方面的一些內容。
第一,通過較短的時間和成本,整體體現在通訊的安全等級。現在機房已經達到了3+的標準,等保達到了3級別的標準,這個是非常快速的就達到了,它可以滿足業務的發展要求。第二個,通過較低的成本間接災備,進行5、6級災備,這個也是比較明顯的一個變化。實際上關于災備這件事情,我覺得我們已經提了很長時間,這個不是一個新的概念,但是我們回過頭來看,為什么說企業真的建了災備的還不多,除了那種大的金融企業, 4大行肯定是沒問題,問題在哪里呢,我覺得有幾點,第一個,建災備這件事情從投入上也比較大,從技術的難度或者是管理的服務度也是比較高的,還有一個是,到底是災備有多大的效果,有可能就沒有什么效果,這些問題攪在一起,以后對CIO來講建不建災備也是一件困擾的事情。
第三我覺得這也是比較明顯的變化,響應業務的需求,現在要上系統很簡單,他把需求告訴我,我兩下就把環節給他了,以前是不可想象的一件事情,以這樣的方式可以有效支撐業務快速發展的要求。
第四,也是整個IT標準化的規范化,通過這種方式,流程也規范了,管理上也規范了,保證了業務穩定運行的要求。實現了IT部門的管理轉型。實際上現在他們的新中心已經不帶具體上的運維的工作了,全部是在服務、管理上進行了一個大的轉型。
這是他在計算標準化上面,在軟件的版本上通過這次的云化標準化了,以前各種各樣的版本都有,有很低的,有很高的,這樣標準化了,在防火墻的策略上也標準化了,安全上也從幾個維度得到了一個全面的提升。這是一個實際的門戶圖,在這里可以看到各種視角各種維度,他的服務資源進行了信息的獲取。這是他的自動化監控與報警的圖,另外可以針對每個業務系統看到目前有什么問題,運行的情況,都能夠實時監控。
最后,用上海醫藥集團主任的一句話來做一個總結,他看中的是寶之云整體帶來的運行保障能力以及災備能力的提升,原先通過自建三年才能夠達到災備體系,只需要半年的時間向云遷移就能實現,而且建設完成以后可以維持一個長期良好的運行水平,我的分享就到這里,謝謝大家!