2018北京部委央企及大型企業CIO年會于2018年1月13日在北京維景國際酒店隆重舉行。以下是現場速記。
主持人: 在公有云,私有云鋪天蓋地的宣傳中,混合云以身跨兩界,承上啟下的兼容思想,穩穩地占有了市場中的大席地位。下面,我們將請出華勝天成云計算事業部常務副總經理李明軍為大家帶來:華勝天成異構混合云實踐分享,掌聲有請!
華勝天成云計算事業部常務副總經理李明軍
李明軍:云平臺,從IBM開始算起2017年到現在接近10個年頭,我很深的體會,云最終解決的是數據中心怎么進行自動化,更傾向的用楊老師的話說怎么解決我們數據中心活的更好的問題。接下來進入分享的話題。
這里簡單的回顧一下我從事的相關的云的工作,這里面涉及的一些小的體會。云到今天,不管從廠家的宣傳,包括甲方的建設單位,對于建設一個運化數據中心的訴求,到今天為止還很難準確的找到用戶做云的方法。我回顧一下跟從事云相關的關鍵詞。IT是不斷創造新詞的行業,這里面我很快的過一下有哪些比較有意思的話。
第一組是RDP,2007年我在IBM的時候,從IBM的數據中心管理,或者前期的云的團隊里很核心的思路或者產品,R就是快速,D就是驅動,P就是供給,就是快速驅動的供給,這是2007年云的叫法,它解決了數據中心所有資源的部署和供給,需要專家和工程師自己敲鍵盤,進行各種物理級別的操作才能完成的,通常那時候一個很典型的場景,你一個系統要涉及到數據庫管理源等等一系列的齊上陣,根據不同的時間要求、不同的功能要求大家聚在一起,完成復雜點的業務上線。RDP的核心思想解決了從用戶部門、需求部門的角度來講,通過一系列自動化的手段,通過一個非常好用的自服務的界面,把它的需求輸入到界面以后可以很快速的,不需要經過我們傳統的低效的人與人的溝通,通過系統與系統的自動化的需求,把它需要的虛擬機、數據庫系統、應用系統部署起來,這是很基本的思想。到今天為止,今天的云平臺也是繼承了核心的思想,怎么在數據中心里部署這些資源。
到今天為止,我們的云平臺,如果說在當前這個時間點,當然說也覆蓋了更多的概念,比如剛才楊老師講到了非常重要的CMDB。然后BSM從業務視角對業務進行監控管理的工具。包括自動化運維的體系,實際上解決了傳統的需求驅動的資源部署加上后期運維里我們的CMDB和自動化運維一系列的高級的自動化工具的集合。最終運維是解決系統的運行態和管理態的問題,實際上解決了我們最終應用的運行態承載環境的問題。現在云是要解決的,怎么更好的管理好這些環境,從管理的視角怎么看我們的數據中心。
2、另外一組是托管服務,從技術實現的角度來講,我覺得是非常精髓的去反應云到底要做什么的事情。云我們看到不管公有云還是私有云,實質上是要解決為用戶提供更資質化、自動化提供云服務的單元,比如說我們自動擴展的服務,當我們的業務需求、用戶連接數上升的時候,可以自動的調節當前的用戶系統,占CPU資源內存的大小,可以把兩個節點的云服務器自動擴展到三個節點,甚至更多的服務,這些都是非常好的體現了,我提供給業務部門一個服務的時候,用戶不需要關注,系統自己就可以自動做這些事情。從技術承載的內容角度來講,我們也看到,我們的云計算里面,交付的服務內容,也包括了從物理機、虛擬機到容器到今天我們覺得比較火熱的一個話題叫無服務器架構,體現了我們利用它的托管能力不斷深化的過程。
3、云里承載應用的時候,有些選擇公有云,有些選擇私有云,華勝天成做混合云的,我們的客戶很多的跑到X6系統上,有的跑到小型機上,也有試點型的客戶在IDM大型機上為用戶提供云化的服務。當考慮這個問題的時候,實質上很多用戶困惑的話題是說,尤其前幾年,市場上有云計算概念的時候,大家天然認為云計算是天然廉價的實現,或者說云計算就等于X86。到今天為止不管從業界的廠商來講還是說我們的用戶來講,我們覺得這個概念應該都是不對的。實際上最終我們選擇一個系統,選擇一個什么云承載我們的系統,這里面經常涉及到討論的關鍵詞,我這里列出來,一個是CAP,在座都是專家,CAP這個詞,C表示一致性,A是可用性,P是分區容忍度。這里邊是一個大家比較公認的IT的公理,認可一個系統,無法兼顧CAP三者里的全部,最多我們可以照顧到其中兩個功能特性。也就是說如果你選擇它的分區容忍度比較好,你要做一個多集點、多集群的架構,你勢必會放棄C或者A里的一項,或者你的系統的一致性會受到影響,或者系統的可用性受到影響,不可能實現CAP三個完美兼顧的系統,這是大家取得非常一致的共識的類似公理的道理。
最終構建一個系統,選擇一個垂直架構和水平架構的時候,最重要考慮的,最終你可以考慮放棄的,那實質上只能在數據的一致性上去做一些折中的考慮。還有一個垂直擴展系統和水平擴展系統,這里邊也是體現了公有云和私有云涉及到多的討論點的問題,公有云的架構是通用的基礎設施的設計,我們發現它很多東西實際上是天然的支持我們這種傳統水平擴展系統的架構,這種架構很大的特點,每個節點的可用性、每個節點的性能,實際上不做一個最極限、最精致的KUS保證的。現在很多大的銀行里,現在更多的是屬于這樣一種,小型機上也屬于這樣一種。另外一個提法就是敏態和穩態,穩態指垂直擴展系統,敏態是水平擴展系統,這樣的類型。
另外幾個關鍵詞就是關系數據和非關系數據,這個在云的架構實現利,我們通常看到隨著這樣一些非關系數據在架構里成為主流的組建和實現,我們看到過去十年,我們很多的業務系統默認的,一開始我們幾乎所有的開發商,默認構建的關系數據庫居多,90%以上。現在越來越考慮到有些類型的數據,比如說我們互聯網一些類型的數據,可能非常適合于非關系型數據庫,這類的數據庫也是非常適合放到自擴展的公有云架構里使顯得。
4、最后一組詞是云計算的經濟性。最近很多的朋友圈里或者公眾號里有人在分析一些類似的話題,云計算到底給用戶能否帶來一個經濟上的節省,是不是上了云就能幫用戶省錢?到今天大多數人對這個論斷的認識,可能大家也逐漸的有了一些比較一致的看法,云計算本身并不是直接幫助大家解決錢的問題,我覺得更多的是解決了數據中心的智能化和自動化運維的問題。
前面簡單回顧了一下過去在從事云計算相關的工作里碰到的一些八九年里的一個回顧。接下來簡單介紹一下我們公司,華勝天成很多老朋友比較熟悉,在國內存在了17年以上的歷史。我們現在總部在北京,員工人數6000多名,我們也是在主板上市的公司,上交所母體公司華勝天成在主板上市公司。在香港有一家ASL也是我們全資控股的公司。新三板掛牌的公司是蘭德網絡和和潤,和潤做環保方面的產品,沃趣專注在企業里提供以開源的數據庫云為產品的一個公司。
下面是華勝天成相關的資質,我們連續多年里,是系統大一級的企業,云計算在整個公司的業務領域里占重大意義的業務板塊。
這一頁匯報一下云計算在華勝天成的簡單的發展歷程。我們的云計算正式產品化大約是在2009年,2009年主要是在一些運營商市場有私有云的產品,還有定制化服務項目的落地。到了2012年有了一些軟硬結合的產品,像我們的CAMP Box,和Power Director五是我們軟硬一體機的產品類型。中間的綠色區域是我們主要的變化,華勝天成2014年開始與IBM全方位的進行技術方面的合作,包括云的產品,包括我們數據庫、服務器和中間鍵的產品,全面跟IBM做技術合作,通過跟IBM的資源整合,2015年對云的平臺進行了正極,形成了華勝新云品牌。到2016年6月份,整合華勝天成內部各個相關云計算的部門,形成了全新的華勝天成云計算的事業部。隨后的時間里,我們進行了非常快速的產品和功能迭代,包括從私有云的一些功能的范圍擴展到主流的公有云AWS及阿里云等公有云融合K8S為框架的容器技術融合在里面。
這張圖是我們在為我們的企業數據中心做云計算項目時候的一個初步的理論模型,這個理論模型里面有兩個點:一個點我們認為做云計算,是在數據中心的五個方面五個維度的建設,就是計算、存儲、網絡、應用和管理,五個維度不斷的深化。另外一個點,每一個具體的數據中心,每一個用戶實際上云建設的過程實際上是不斷迭代的過程,迭代的過程在五個維度、五個方面怎么進行不斷的迭代和深化,這樣的話實際上我們對參與建設的每個用戶,在項目的建設初期,我們幫助用戶分析、梳理他現在的試驗點是什么,它當前在五個維度上跟云相關的五個維度的自動化程度,它的運行態的不同的不同模式,我們根據現狀,再結合當前的技術發展的現狀,我們給每個用戶規劃云化的路線圖,第一個方面實現什么目標,存儲網絡需要做到那個級別上,隨著技術的發展,隨著業務的發展,下一步云計算的目標是什么。通過給用戶規劃云化路線圖,按照用戶按照時間維度和功能覆蓋范圍不停的演進這樣一個過程。比如說有些用戶做一個開發測試運,它的部署模式和需要的技術復雜度的模式,相比較生長環境來講可能是一個子集。這樣從一個子集一個局部逐漸的擴展到生長環境。
另外從知識復雜度來講,計算的云化,計算的虛擬化和虛擬化的管理,從管理復雜度上最容易來做的,大部分用戶可以先考慮計算虛擬化,以虛擬化作為云化的第一步,先做虛擬化,虛擬化的自動化管理,包括跟云平臺的結合隨著客戶運維方客戶團隊的經驗的積累,包括整個的對自動化工具相關的一些熟悉,我們慢慢的擴展到存儲、網絡,包括跟CMDB的結合,跟SCM的結合等等這樣一個過程。
作為華勝天成整個的云化產品和工具集,我們做到了綜合的產品的布局,剛才跟楊總講的完整的朝管大型數據中心的需求來講會有一些偏差,但是從各個功能點來講,我們也有一些分別的功能的布局。從運營的管理工具,我們現在最新的云管平臺,我們可以在市場,我們是非常有優勢的Ego的管理平臺,我們對開源對于Power為的資源池我們都有相關的資源承載能力。運營分析方面,我們也加入了智能分析,結合現在的大數據、智能運維的一些技術,來把它放到我們的運營分析這樣的工具組合里。運營監控,華勝天成做了接近10年以上的產品叫做摩卡BSM,把我們的基礎設施從底層數據的搜集跟上層業務關聯度的整合監控,都可以做到完整的監控平臺。運維流程的管理,我們也有一個基于我們的BSM產品的ITOM的運營管理的支撐平臺,包括智能化操作平臺,現在有一個基于一系列開源供應商的智能化錯作平臺。日志采集分析是基于大數據和學習的日志采集和分析的平臺。
這張圖簡單的描述一下我們現在在做的云管理平臺,它大致的功能范圍。我們做云管理平臺,在市場上它主要的特點,就在這個左邊這三項,我們三項首先第一種就是多種虛擬化環境的承載能力。華勝天成從2009年從給運營商做云的前期來講,最主要是做WM和SAAM的小型機,隨著市場環境的變化和市場的趨勢我們增加了Openstack,2012年華勝天成成立了Openstack的服務中心。后期通過跟IBM的合作,我們在Power這塊的能力市場上做的比較領先的,我本身也是從IBM的團隊到了華勝天成,包括我們的核心成員。我們在云平臺里對于Power的支撐能力,也是結合最緊密的。我們云廠商支撐小型機的時候還是通過傳統的模式,通過命令行工作集的方式實現分區的創建,和后區的一些簡單的自動化管理。
我們在Power平臺在支撐方面,我們同時支持兩種模式,一種就是比較傳統的命令行連接我們的HMC,我們一些IBM連接的信用管理工具的一些基礎的對物理設備的基本操縱能力。另外我們現在在主流的,現在對IBM新的這樣一些虛擬化管理的模式上,PowerVC,它是完全支撐Openstack的,我們對它的能力也是在行業里做的比較領先的。另外一塊就是對裸機,華勝天成還支持IBM的Xcat,可以對于Openpower架構的物理機的管理能力。
然后對于混合云,我們的云管平臺里實現了非常友好,通過融合非常友好的方式,納管了AWS、阿里云、騰訊云,主要是計算資源、存儲資源的能力。之前在一組應用里可以由一部分虛擬機在AWS上面,有一部分在Power上面,我們可以通過公有云和私有云跨平臺的方式進行部署,這是我們做到的比較領先的能力。
然后針對企業用戶的用戶管理,我們知道現在大多數的公有云,包括我們的一些市場上我們看到的一些私有云的產品,它對租戶的管理通常還是水平化的,平面化的,沒法非常理想的支持企業環境里的多級審批和復雜的組織結構的模式,我們在這方面也有一些專利,在這個市場上,我們通過把組織結構跟每個組織結構的配額,包括跟企業里的干預三八的解釋模型,提供了一種新的模型,企業里反饋比較好。
這張圖是我們整個云平臺的實現,這里面看到可以分四個大塊,左右兩側是給客戶提供上云之前的服務,還有上云之后的項目管理和運維,中間是產品所的功能域,除了機房之外,中間的是我們異構混合的管理能力,剛才提到異構多元池,裸機、等管理容器資源池的管理,我們都成立了這樣一些專業化的團隊,都有專門的具體的團隊來負責對各個平臺的最佳實踐的梳理和它的管理能力的API化。最終形成到我們的云管平臺里的統一API層。相比較市場上見到的大多數云管理平臺、產品的提供商,大多數云管理平臺的提供商是到管理門戶,更多的偏向用戶側的功能,對于我們團隊來講,我們有三分之二的經歷,還有我們的工作量實際上是在各個資源層最佳實踐的梳理,還有它的API化上面。上面這一部分是云管理平臺,它簡單的功能對接是為云里面各種不同的用戶角色提供非常好用的服務門戶,不管你是運維團隊的角色還是業務部門的應用管理員的角色,我們都可以在云管理平臺里為這些不同的角色定制它自己專屬的工作臺。右下角是如何做業務管理和運營管理的模塊,包括審批、計費相關的功能都會進入到這個模塊里。
從我們的技術實現來講,我們的三個核心的功能的區域,最左側,前面稍微講到,我們對異構資源的納管能力,這是我們比較加強的產品的實現點,實際上具體來講,我們怎么比較好的支持我們的一個中大型企業環境里需要的全部的資源能力的吃在,而不是說像我們的很多的創業公司還有一些公有云轉私有云的產品來講,這些產品非常大的特點就是單一架構,公有云產品通過KBM實現的,私有云給客戶提供的私有云平臺里只支持到KBM,連裸機、VMware都沒法很到位的支持。也說資源池級別的需求是什么,而不是說根據云平臺支持的類型,強制的把他的平臺轉成我們支持的系統平臺。經常在市場上聽到一些案例,比如某一個城市的政務云,本來要承載幾十個委辦局的一些稅務中心整合來用的,投入1500臺機器上線以后發現真正跑起來的也就100臺,核心的原因是KBM單一的資源池,通過單一資源池的架構實現了。從我們委辦局的具體的數據中心的運行需求來講,有各種各樣的系統平臺的應用,有些跑到Windows上面有些跑到AM上面,有些跑到惠普的機器上面,這樣的話最終發現,一組應用里10個虛擬機,有8個虛擬機KBM可以解決的,其它兩個一個需要KBS,一個裸機。如果你這個上不了的話這一組業務都沒法上。
還有一個即使你是一個規模比較小的應用,你可以通過一些比如說Orclol的應用,你跑到Liuix上面,遷移不同的版本,你的相關的應用,好多的測試和驗證,具體的一些項目來講,用戶化費的精力比較大的,是比較復雜的上云的工作。對于我們來講,我們認為云本身跟系統的運行環境是兩個系統的東西,運營管理的是運營的問題,跟云無關的,每個運營都有適合的業務跑的方式,有適合的運行態的特點。這樣的話,比如拿我們向楊總介紹的典型的國有大行來講,我們跑到大型機上跑到小型機上,有很多的跑到X86平臺上,不同的業務不同的特點,適合不同運行態的要求。
中間這一列是我們云平臺里面最近2年里非常大的力度來加強開發的兩塊東西,一塊叫云的業務引擎,剛才楊總的演講里也提到了,業務引擎實際上是要解決一個資源分配的時候的服務編排還有圖形化的定義的問題,基本思路是說讓用戶通過圖形拖拽的方式提交業務請求,相比較最初做云的時候,大家在云里請求的服務是一個虛擬機或者一塊云硬盤,今天可以讓企業用戶通過一組拖拽的方式,形成一個業務所需要關聯的資源的組合,比如你傳統的三層架構的應用,你外部的服務器、應用服務其分別需要幾臺,它的安全區域要求是什么,它的運營平臺要求是什么,這樣的話都可以通過圖形拖拽形成一個流程的,這樣到每個部門審核資源的滿足情況,然后自動連接云平臺幫你部署出來。簡單的思路是非常容易理解的,但實際上它解決了我們傳統的數據中心里面管理的非常大的一個問題,就是說我們的應用的資源組跟我們后端的CMDB,跟我們的監控系統,也就是剛才楊總講的非常好的點,我們怎么從應用系統的視角看IT的運維跟管理的問題。我們從這樣一個模塊希望解決的是,從數據中心里面,從一個需求起點開始,它就是跟我們一組業務,它的資源之間、它的關聯關系,它跟后臺的實現之間就是良好定義的,而不是運化之前的的項目大部分都是手工補錄或者半自動化或者手工的方式注入到CMDB里的,手工注入一個工作量比較大,另外它的精確性以及對變化的容忍度非常弱的。
跟這一點相關聯的就是整個資源的,整個CMD整個CI,CI項之間所有的關聯關系,它的資源的容量,它的歸屬關系、依賴關系一系列的展示功能也是我們最近兩年里,我們的產品里非常大力度開發的東西,最終它實現的目標就是說,從需求開始,它的業務定義、業務的部署,到后期的運維、監控,整個失效鏈和變更鏈的分析,都提供了簡單運用的方式,幫助運維人員提高我們的自動化的能力。
第三項是云管平臺里,我們全面的自動化。相比較我們最初幾年,前幾年的單純的從資源的請求和部署階段,大家花的時間非常多,做的功能非常細之外,我們也是在最近的產品開發里面,我們加入了非常多的后期的運維自動化的東西,比如說我們的批量的操作系統的更新、產品的應用系統的更新、應用系統的變更的管理等等一系列的功能我們都可以通過我們的自動化的集中的腳本、自動化的工具來實現。
最后一頁是2009年到現在主要的一些云化的項目,左邊找了一個比較典型的項目的類型,是我們,也是2009年6月份開始做,做到現在,已經做了第七期的項目。這個項目是遵循我們前面提到了華勝云計算五維的方法論,我們認為每個云化的數據中心云過程是不停迭代、不停發展的過程,分了很多的階段。每個階段里覆蓋了我們的自動化交付、資源能力、管理平臺三個大的方向上,每一期我們都規劃了一些不同的內容。比如最初的時候就是做一個虛擬化的整合,幫用戶更好的管理虛擬化環境,盡管這是2009年做的項目,我們發現其實國內很多的大型客戶它的管理水平實際上還是在這點上,虛擬化的規范化和標準化還有很大的提升空間。到第二期它的資源池化,包括異構加入了像當時的Power的小型機,包括原油的小型機的整合。三期網絡存儲化加入了資源池,給應用系統提供門戶方面做了非常多的工作。
右側的這幾個項目類型基本上都是這樣的,我們為每個用戶根據它不同的階段,來根據我們產品覆蓋的這樣一些功能域有選擇的,分階段的實現和實施。我們的項目里前幾年運營商居多,現在我們的城商行、銀行客戶,包括證券的客戶,逐漸多起來。