摘要:隨著行業信息化與IT戰略在全社會的廣泛推進,國內數據中心、IDC市場進入了嶄新的發展階段。在需求端,IDC業務逐步呈現靈活化、快速化、定制化的趨勢特征,推動數據中心迎來整合、云化轉變的大潮。
隨著行業信息化與IT戰略在全社會的廣泛推進,國內數據中心、IDC市場進入了嶄新的發展階段。在需求端,IDC業務逐步呈現靈活化、快速化、定制化的趨勢特征,推動數據中心迎來整合、云化轉變的大潮。而運營模式的轉變同步帶來了IDC資源管理的諸多挑戰,包括資源量大類多、精細化管理要求更高,資源協同均衡管理難度更大等。
面對挑戰,如何構建全面、高效的云數據中心資源管理體系,成為了破局的關鍵。對此,中國移動安徽公司從軟硬件兩大線條入手,針對打造集中資源管理支撐系統,并建立全生命周期運營流程機制,以“管的準”與“用的好”為實施導向,實現IDC資源精準管理、挖潛增效,持續提升數據中心資源運行效率。
一理三管,實現資源“管的準”
近年來,大型數據中心數量突飛猛進,跨數據中心云化格局逐漸成型,其規模、復雜程度與形態轉變等因素造就了IDC資源數量多、種類多、層級多的現狀局面。數據中心資源要想“管的準”,亟待實施分步精細化管理解決方案。首先要理清資源,將現有資源顆粒分門別類、全量收集,再從既有存量資源管理、動態變更資源管理、資源常態糾錯三方面入手開展閉環維護,即“一理三管”,實現資源精準管理。
理清資源,是資源管理的基礎前提。以目前通用的云IDC、傳統IDC業務入手,可將數據中心資源分為云資源、網絡及安全資源、傳輸資源以及動力配套資源共4類資源。再由總到分,將4大資源總類劃分為9個資源池子類、31個系統細分,分別梳理各資源的容量、占用情況、可用情況、運行狀態、監控狀態等資源清單,并實時監控。以動力配套資源總類為例,資源池子類可分為空間資源、供電資源與制冷資源,其中空間資源按層級可細分為機柜、微模塊、機房;供電資源按供電拓撲可劃分為高低壓配電、油機、通信電源;制冷資源又可分為單機柜冷池、微模塊冷池、制冷站冷池三類。統籌資源顆粒,掌控各類異構資源形態,是一切精細化管理手段的數據基礎。
存量資源管理,即對數據中心當前既有資源實現集中監管。在理清家底的前提下,依托集中化資源管理模塊,借力動環系統、綜合網管系統、傳輸網管系統、云管理平臺及人工調節錄入五大支撐手段,精準對接全專業資源的實時監控數據,從而實現全量資源的自動化采集,對既有存量資源實施統一管理。在此基礎上構建管理功能清單,建立可視化系統組態模型,精準核算資源容量,明確可用空間,為下一步資源管理提供指導依據。
變更資源管理,就是針對資源的動態性進行常態化精準維護。在既有資源全面納管的基礎上,根據傳統IDC、云IDC兩類業務的不同階段實施情況,制定資源管理閉環流程。針對傳統IDC的機柜+帶寬業務,按照預占申請、實施、回收、擴容等環節實施資源管理;針對云IDC業務,發布云資源管理流程,明確資源申請、分配、回收管理規范。同時,以集成IDC運營管理平臺為跳板,將既定管理流程內嵌固化,實現變更資源閉環管理,確保資源數據長效準確性。
資源糾錯管理,可對資源長期扭轉造成的數據錯誤進行校正。從生產實際經驗來看,伴隨著資源的動態變化,各類資源不可避免的會因工程調整等原因而導致一定程度的數據勘誤,可依托資源關聯關系,以業務入手,將每個客戶占用機柜、帶寬等資源疊加,與系統已用資源進行比對,從而開展自動核查;并通過定義各專業數據核查質量報表,定期組織人工核查復驗,雙管齊下,建立長效資源數據糾錯機制。在自動化資源糾錯盤點方面,目前業界已有較多的前沿試點投入,如智能巡邏機器人,其內設網絡設備、服務器等設備形狀、指示燈含義、數據模型等參數,通過設置巡邏路線,自動巡檢機房并將資源數據實時上傳,全自動化實施核查工作。
統籌兼容,實現資源“用得好”
以運營商云IDC為代表的新型數據中心,區別于傳統自用數據中心,涉及的資源分布更為零散、業務場景更多元、資源協同均衡管理難度更大。如未充分考慮資源協同,將會導致資源效益無法最大化發揮,造成浪費與瓶頸并存局面。云IDC資源使用,需要在資源“管的準”基礎上,從業務著眼,構建多維度資源關聯集合,再從剛性資源需求與柔性資源需求兩大分類入手,依據業務特征套用資源分配原則,制定統籌兼容的資源解決方案,從而精益化挖潛資源效益,實現資源“用的好”。
以業務為資源分配的著眼點,是資源最大化挖潛增效的正確前提。目前業界常規IDC業務可分為8類需求。其中機柜+帶寬、機柜+帶寬+增值、計算+存儲,這3類可定義為剛性需求,即客戶有明確資源需求的業務;而WEB、數據庫、緩存、媒體、游戲等5類應用,因只要求保證業務感知,而對各類實際資源需求并不明確,可將其定義為柔性需求。從以上不同需求特征出發,將每類業務占用的資源情況分層梳理,可清晰確立每種需求的資源分配模型。
針對有明確資源剛性需求的業務,在可用容量滿足的條件下,以資源均衡性為原則,依托現有資源管理系統設置后臺資源分配規則,將業務自動部署在最優位置,規避瓶頸或浪費。如機柜+帶寬業務,可依據資源利用率、多種資源均衡性、業務連續性等指標進行資源分配;機柜+帶寬+增值服務業務,除以上三種原則外,還需進行群組設備在CDN、安全等方面的增值服務能力考量,進行合理分配;而計算+存儲業務,則應按照資源池、集群、設備三層級,以資源利用率為參考,實行“最低最優”原則分配。
針對需求不明確的柔性需求業務,可通過“四步走”制定適配業務類型的資源解決方案。第一步:歸納業務特征。針對5類柔性需求的業務類型,使用loadrunner軟件對各典型業務系統進行測試,監控資源和應用指標數據。第二步:總結硬件特性。在計算能力方面,裸金屬大于虛擬機;存儲容量方面,分布式存儲大于裸金屬本地硬盤;I/O能力方面,分布式塊存儲大于分布式文件存儲;文件類型方面,塊存儲適合小文件讀寫,文件存儲適合大文件讀寫。第三步:形成基于業務特征的資源配置模型。如WEB業務,可得較優配置為虛擬機+分布式塊存儲,數據庫較優配置則為裸金屬+分布式塊存儲。第四步:在配置模型基礎上,制定基于業務并發量的具體配置方案。以WEB服務器為例,額定并發量為100,則應分配4核CPU、8G內存、IOP設置為1000,并配置分布式塊存儲。
資源自動回收,就是對已閑置的云資源進行重新歸類更新。可在IDC云管理平臺中配置閑置資源回收管理模塊,通過自動抓取比對虛擬機利用率信息,輸出閑置虛擬機清單。同步建立回收資源的統計分析能力與回收閉環流程,實現閑置云資源的自動回收納管,從而規避資源浪費,實現資源“用的好”。
面對當前資源管理方面的諸多挑戰,安徽移動云數據中心集中資源管理體系以“按需部署,隨需而變”的理念,有效實現了資源多維度精準管控,使資源利用率最大化。其改變了傳統IDC的資源管理模式,是滿足互聯網業務發展與IDC服務轉型、應對復雜的多業務環境、滿足IDC低成本高效運營的重要手段。在信息化與數據產業高速發展的今天,數據中心勢必還將迎來眾多未知的轉型變化,但只要堅持立足業務,遵循資源規律科學調控,即可在錯綜復雜的現狀中執簡御繁,應對自如。