在云計算產(chǎn)品迭代的時候,提供給用戶的操作界面是可以參考當前的主流思想進行對比和設(shè)計的,但是作為不暴露給用戶的云管理端技術(shù)體系該如何構(gòu)建,這是一個比較復雜的問題。
360安全云產(chǎn)品和技術(shù)團隊結(jié)合公司私有云體系的相關(guān)經(jīng)驗,已經(jīng)著手設(shè)計并形成了完整的云后端技術(shù)管理體系架構(gòu),在本文中將與大家分享。
在云計算技術(shù)體系架構(gòu)中,后端技術(shù)管理提供IaaS、PaaS、SaaS三層資源的全生命周期管理工作,不但需要實現(xiàn)物理資源和虛擬資源的統(tǒng)一管 理,更為重要的是,還需要提供資源管理、統(tǒng)計、監(jiān)控調(diào)度、服務(wù)監(jiān)控等端到端的綜合管控能力。在這種場景下,產(chǎn)品設(shè)計必然會和公司內(nèi)部的傳統(tǒng)運維模式產(chǎn)生差異。
修煉之一:數(shù)據(jù)集中化
為了避免出現(xiàn)傳統(tǒng)系統(tǒng)各個層面數(shù)據(jù)各自為政的情況,云計算中需要將機房信息、網(wǎng)絡(luò)信息、主機信息、虛擬資源信息、產(chǎn)品業(yè)務(wù)信息、功能邏輯信息等各種信息統(tǒng)一用一套信息管理系統(tǒng)進行整理,并提供標準的接口和權(quán)限識別能力,并允許其他系統(tǒng)間的相互調(diào)用。
修煉之二:資源池化
云計算體系下所有的原始資源,如機器、存儲、網(wǎng)絡(luò)等需要做到可標識、無狀態(tài),并將同類體系的資源全部通過資源池進行管控;對申請的新資源在資源池內(nèi)進行合理的規(guī)劃分配,保證資源的利用率;對釋放的資源進行垃圾回收,并定期對資源池內(nèi)資源分布進行定期的歸并收斂操作。
修煉之三:自動化
在云計算層面的管理和運維,需要收集、索引和分析各個云資源的基礎(chǔ)數(shù)據(jù),并對系統(tǒng)進行容量、性能、穩(wěn)定性等方面的預測。這些操作需要功能強大的數(shù)據(jù)收集、傳輸、處理、分析和展示工具,并能夠在短時間內(nèi)將系統(tǒng)的狀態(tài)進行匯總和告警。
整個告警系統(tǒng)除了針對配置、性能和狀態(tài)三個維度采集信息并分析告警外,云計算的運維自動化還包括持續(xù)不斷的基于云基礎(chǔ)設(shè)施開發(fā)和維護各種自動化運維 工具。比如配置管理工具用來設(shè)置參數(shù)或者開啟一個新服務(wù)器上的服務(wù);命令執(zhí)行工具可以讓管理員在緊急情況下不受各種體系的制約地對各類服務(wù)器執(zhí)行操作;服 務(wù)器自動構(gòu)建工具可以加速部署速度,并可以在短時間內(nèi)大規(guī)模部署服務(wù)器,同時也可以讓構(gòu)建過程更容易復制,并且在發(fā)生嚴重故障時,還可以重建架構(gòu)。
[page]修煉之四:流程化
云計算下的管理和運維比傳統(tǒng)方式要復雜許多,需要新的流程化技術(shù)方案以提高管理效率,降低系統(tǒng)資源投入。
360云在運維架構(gòu)設(shè)計上除了引入了ITIL的技術(shù)框架外,還結(jié)合當前公司的運維體系,針對事故管理、問題管理、配置管理、變更管理、可用性管理、 能力管理、服務(wù)水平管理、例常報告、定期巡檢、用戶反饋等十幾種管理需求設(shè)計了豐富且有效的技術(shù)方案,使整個流程能夠快速有效地運轉(zhuǎn)。
修煉之五:個性化
云計算的管理除了適配當前的技術(shù)方案外,還需要不斷適應(yīng)當前新技術(shù)和新用戶的需求。為了能夠快速適應(yīng)變化,除了適配當前的主流運維體系,360還創(chuàng) 新地使用一些新技術(shù)、新理念,不斷地孵化新的運維工具和運維方式。有些工具和技術(shù)方案已經(jīng)開源,并在開源領(lǐng)域有了一定的影響力,它有效地降低了云計算的門 檻,正在幫助越來越多的小型開發(fā)團隊涉足云計算領(lǐng)域。
例如我們開發(fā)了功能完善的后臺管理門戶系統(tǒng),該系統(tǒng)不但支撐基礎(chǔ)設(shè)施資源、平臺資源和應(yīng)用資源以服務(wù)的方式交互給用戶,還提供基礎(chǔ)設(shè)施資源、平臺資 源和應(yīng)用資源服務(wù)的定價、檢索、資源使用情況統(tǒng)計等自服務(wù)功能,而且還可以根據(jù)不同的用戶需要提供不同的展示,并有效隔離多用戶的數(shù)據(jù)。
修煉之六:權(quán)限與用戶管理
權(quán)限本身是為了提供數(shù)據(jù)存取方面的安全控制,這在云計算中尤為重要。我們在云管理系統(tǒng)中會提供身份訪問管理能力,只有授權(quán)的用戶才能訪問相應(yīng)的功能和數(shù)據(jù),未授權(quán)的用戶在使用之前必須對資源服務(wù)提出使用申請,經(jīng)批準后才能正確使用。
除此之外,還收集、儲存并實時更新的用戶的信息,狀態(tài),等級等內(nèi)容,并在此基礎(chǔ)上完成工單、銷售、客服等支持功能,后續(xù)還可以融入需求分析和智能推薦等高級功能。
修煉之七:產(chǎn)品與服務(wù)管理
云管理端還需要建設(shè)完善的產(chǎn)品與服務(wù)管理體系。產(chǎn)品與服務(wù)管理定義了云平臺提供的基礎(chǔ)設(shè)施資源的名稱,定價以及前端的套餐等,除此之外,還需要定義 云服務(wù)的名稱、基本信息、服務(wù)區(qū)域、配額和權(quán)限,并提供云服務(wù)信息的注冊、配置、發(fā)布、注銷、變更、查詢等管理功能供用戶使用。
服務(wù)質(zhì)量管理則需要遵循SLA要求,主動按期審核和管理資源的實際使用情況,針對未達到預先約定的SLA要求,自動化地進行資源調(diào)配,并對產(chǎn)品功能進行迭代演進,以滿足SLA的要求。
修煉之八:調(diào)度管理
調(diào)度管理是云計算中重要一環(huán),服務(wù)調(diào)度是其中之一。360云服務(wù)調(diào)度系統(tǒng)基于各個云服務(wù)的特點,接受上層的請求,進行資源的調(diào)度、運行順序邏輯的管理,并進行展示和存儲。
資源調(diào)度是云計算調(diào)度體系里的另一環(huán),通過查詢基礎(chǔ)資源和服務(wù)資源,判斷當前資源狀態(tài),提供不同種類資源的合理分配算法,并配合調(diào)度系統(tǒng)來分配、部 署資源,實現(xiàn)實時響應(yīng)服務(wù)請求,并根據(jù)需求實現(xiàn)云服務(wù)的自動化生成、分配、回收、遷移、數(shù)據(jù)收斂等工作,用以支持云計算的資源彈性特性。
修煉之九:安全運維管理
一個穩(wěn)定的云平臺,必須具備健康狀態(tài)的自我感知能力。這部分360采用了內(nèi)部一套自研的安全運維系統(tǒng),負責對底層資源和對外提供服務(wù)的上層資源進行 分別的監(jiān)控管理。對外提供服務(wù)的監(jiān)控管理通過自定義插件形式實現(xiàn),能夠進行實時監(jiān)控、捕獲資源部署狀態(tài),獲得使用和運行指標、各類告警信息并按自定義的邏 輯發(fā)送給對應(yīng)的人或組。通過安全運維系統(tǒng),可以實時保障云平臺的高可用性,給用戶提供不間斷的云服務(wù)。
而資產(chǎn)統(tǒng)計巡檢則按照資源的實際使用情況進行統(tǒng)計和分析,每天按照報表的形式通過云統(tǒng)計功能的維度進行資源的匯總和告警。
修煉之十:財務(wù)管理
如果提供一個成熟的公有云平臺,那么一個完善的財務(wù)系統(tǒng)是必不可少的,其中重要部分是訂單和計費系統(tǒng)。360會按照當前的業(yè)務(wù)模型和產(chǎn)品邏輯,記錄 用戶的購買歷史,在計費方式上實現(xiàn)包年、包月、按量計費的收費模型。在業(yè)務(wù)邏輯上能夠?qū)崿F(xiàn)單產(chǎn)品代金券、多產(chǎn)品通用代金券等擴展功能;在用戶邏輯上能夠?qū)?現(xiàn)獲取用戶等級并進行相應(yīng)的扣費。
除了計費,還需要支持賬單管理。需要系統(tǒng)能夠針對用戶的充值、發(fā)票,消費賬單等進行記錄,能夠從多維度查找信息并支持后臺的靈活操作,能夠定期與公司的財務(wù)系統(tǒng)進行對賬和結(jié)算。
后記
上述云后端管理系統(tǒng)雖然從功能架構(gòu)上看非常復雜,但是作為一套完整的公有云體系則又是必須的功能,因此需要產(chǎn)品、前端、服務(wù)端、后端開發(fā)和運維等團 隊進行跨部門協(xié)作,同時還需要有一個完整的QA體系來保證每一部分的質(zhì)量,這本身就是一件極具挑戰(zhàn)的事情,360云團隊會用心為用戶打造一個安全云平臺。