在云計算產品迭代的時候,提供給用戶的操作界面是可以參考當前的主流思想進行對比和設計的,但是作為不暴露給用戶的云管理端技術體系該如何構建,這是一個比較復雜的問題。
360安全云產品和技術團隊結合公司私有云體系的相關經驗,已經著手設計并形成了完整的云后端技術管理體系架構,在本文中將與大家分享。
在云計算技術體系架構中,后端技術管理提供IaaS、PaaS、SaaS三層資源的全生命周期管理工作,不但需要實現物理資源和虛擬資源的統一管 理,更為重要的是,還需要提供資源管理、統計、監控調度、服務監控等端到端的綜合管控能力。在這種場景下,產品設計必然會和公司內部的傳統運維模式產生差異。
修煉之一:數據集中化
為了避免出現傳統系統各個層面數據各自為政的情況,云計算中需要將機房信息、網絡信息、主機信息、虛擬資源信息、產品業務信息、功能邏輯信息等各種信息統一用一套信息管理系統進行整理,并提供標準的接口和權限識別能力,并允許其他系統間的相互調用。
修煉之二:資源池化
云計算體系下所有的原始資源,如機器、存儲、網絡等需要做到可標識、無狀態,并將同類體系的資源全部通過資源池進行管控;對申請的新資源在資源池內進行合理的規劃分配,保證資源的利用率;對釋放的資源進行垃圾回收,并定期對資源池內資源分布進行定期的歸并收斂操作。
修煉之三:自動化
在云計算層面的管理和運維,需要收集、索引和分析各個云資源的基礎數據,并對系統進行容量、性能、穩定性等方面的預測。這些操作需要功能強大的數據收集、傳輸、處理、分析和展示工具,并能夠在短時間內將系統的狀態進行匯總和告警。
整個告警系統除了針對配置、性能和狀態三個維度采集信息并分析告警外,云計算的運維自動化還包括持續不斷的基于云基礎設施開發和維護各種自動化運維 工具。比如配置管理工具用來設置參數或者開啟一個新服務器上的服務;命令執行工具可以讓管理員在緊急情況下不受各種體系的制約地對各類服務器執行操作;服 務器自動構建工具可以加速部署速度,并可以在短時間內大規模部署服務器,同時也可以讓構建過程更容易復制,并且在發生嚴重故障時,還可以重建架構。
修煉之四:流程化
云計算下的管理和運維比傳統方式要復雜許多,需要新的流程化技術方案以提高管理效率,降低系統資源投入。
360云在運維架構設計上除了引入了ITIL的技術框架外,還結合當前公司的運維體系,針對事故管理、問題管理、配置管理、變更管理、可用性管理、 能力管理、服務水平管理、例常報告、定期巡檢、用戶反饋等十幾種管理需求設計了豐富且有效的技術方案,使整個流程能夠快速有效地運轉。
修煉之五:個性化
云計算的管理除了適配當前的技術方案外,還需要不斷適應當前新技術和新用戶的需求。為了能夠快速適應變化,除了適配當前的主流運維體系,360還創 新地使用一些新技術、新理念,不斷地孵化新的運維工具和運維方式。有些工具和技術方案已經開源,并在開源領域有了一定的影響力,它有效地降低了云計算的門 檻,正在幫助越來越多的小型開發團隊涉足云計算領域。
例如我們開發了功能完善的后臺管理門戶系統,該系統不但支撐基礎設施資源、平臺資源和應用資源以服務的方式交互給用戶,還提供基礎設施資源、平臺資 源和應用資源服務的定價、檢索、資源使用情況統計等自服務功能,而且還可以根據不同的用戶需要提供不同的展示,并有效隔離多用戶的數據。
修煉之六:權限與用戶管理
權限本身是為了提供數據存取方面的安全控制,這在云計算中尤為重要。我們在云管理系統中會提供身份訪問管理能力,只有授權的用戶才能訪問相應的功能和數據,未授權的用戶在使用之前必須對資源服務提出使用申請,經批準后才能正確使用。
除此之外,還收集、儲存并實時更新的用戶的信息,狀態,等級等內容,并在此基礎上完成工單、銷售、客服等支持功能,后續還可以融入需求分析和智能推薦等高級功能。
修煉之七:產品與服務管理
云管理端還需要建設完善的產品與服務管理體系。產品與服務管理定義了云平臺提供的基礎設施資源的名稱,定價以及前端的套餐等,除此之外,還需要定義 云服務的名稱、基本信息、服務區域、配額和權限,并提供云服務信息的注冊、配置、發布、注銷、變更、查詢等管理功能供用戶使用。
服務質量管理則需要遵循SLA要求,主動按期審核和管理資源的實際使用情況,針對未達到預先約定的SLA要求,自動化地進行資源調配,并對產品功能進行迭代演進,以滿足SLA的要求。
修煉之八:調度管理
調度管理是云計算中重要一環,服務調度是其中之一。360云服務調度系統基于各個云服務的特點,接受上層的請求,進行資源的調度、運行順序邏輯的管理,并進行展示和存儲。
資源調度是云計算調度體系里的另一環,通過查詢基礎資源和服務資源,判斷當前資源狀態,提供不同種類資源的合理分配算法,并配合調度系統來分配、部 署資源,實現實時響應服務請求,并根據需求實現云服務的自動化生成、分配、回收、遷移、數據收斂等工作,用以支持云計算的資源彈性特性。
修煉之九:安全運維管理
一個穩定的云平臺,必須具備健康狀態的自我感知能力。這部分360采用了內部一套自研的安全運維系統,負責對底層資源和對外提供服務的上層資源進行 分別的監控管理。對外提供服務的監控管理通過自定義插件形式實現,能夠進行實時監控、捕獲資源部署狀態,獲得使用和運行指標、各類告警信息并按自定義的邏 輯發送給對應的人或組。通過安全運維系統,可以實時保障云平臺的高可用性,給用戶提供不間斷的云服務。
而資產統計巡檢則按照資源的實際使用情況進行統計和分析,每天按照報表的形式通過云統計功能的維度進行資源的匯總和告警。
修煉之十:財務管理
如果提供一個成熟的公有云平臺,那么一個完善的財務系統是必不可少的,其中重要部分是訂單和計費系統。360會按照當前的業務模型和產品邏輯,記錄 用戶的購買歷史,在計費方式上實現包年、包月、按量計費的收費模型。在業務邏輯上能夠實現單產品代金券、多產品通用代金券等擴展功能;在用戶邏輯上能夠實 現獲取用戶等級并進行相應的扣費。
除了計費,還需要支持賬單管理。需要系統能夠針對用戶的充值、發票,消費賬單等進行記錄,能夠從多維度查找信息并支持后臺的靈活操作,能夠定期與公司的財務系統進行對賬和結算。
后記
上述云后端管理系統雖然從功能架構上看非常復雜,但是作為一套完整的公有云體系則又是必須的功能,因此需要產品、前端、服務端、后端開發和運維等團 隊進行跨部門協作,同時還需要有一個完整的QA體系來保證每一部分的質量,這本身就是一件極具挑戰的事情,360云團隊會用心為用戶打造一個安全云平臺。