RightScale評估了企業云資源浪費情況,并發現平均35%的云費用支出被浪費了。僅僅國外的三大公有云提供商(AWS,Microsoft Azure和Google Cloud Platform)浪費的云支出就超過100億美元。
Gartner研究顯示:平均來說企業上云會節省14%的成本,但是到2020年,由于缺乏成本優化手段,80%企業的云資源成本將會大幅超出預算;同時,45%的企業由于缺乏優化措施,在直接遷移上云的過程中會超買55%的資源,并且在上云的第一個18個月內會多花費70%。
那么,是那些原因造成這一巨大的云浪費?
造成巨大云浪費的原因?
使用云過程中可能造成浪費的因素
使用云過程中造成的浪費主要是資源的不恰當使用:
超過應用需求配置的實例,比如4CPU8G內存的實例就能滿足需求,但是卻申請使用的是8CPU16G內存的實例,造成幾乎一倍的費用支出;
不再使用的資源不及時釋放,包括各種云上的收費的資源,這往往是因為遺忘造成的。比如申請了彈性IP,因為相關的業務不再使用,退還了云主機實例,卻忘了歸還彈性IP,造成彈性IP一直計費;
不合理的快照使用,對不應該使用快照的云主機也配置快照,對快照的數量使用過度,另外,也可以引入一些自動化運維的方案,來替代快照方案,以節省成本;
不合理的帶寬費用,帶寬費用是云使用中很大的一塊。應該對業務帶寬利用合理規劃,不同的需求進行錯峰,比如,備份流量就應該和業務高峰期錯開。另外,壓縮率比較高的文件,應在傳輸過程中進行壓縮在傳輸。用戶訪問頻率比較高的資源,可以考慮使用CDN,因為CDN帶寬往往成本更低。
組織內部不完善的管控造成浪費
組織內部不完善的管控和技術能力不足,也會造成云浪費:
云資源申請沒有內部流程管控,或者控制不嚴格,造成超過需求配置、超過使用時間的云資源使用;
云資源使用管理混亂,沒有監控,或者監控追蹤不夠細致,造成云資源利用率不高,或者過期云自己不能及時釋放;
沒有費用預警機制,當因為某種漏洞或者突發情況造成費用支出突然增加的時候,沒有預警機制,比如誤操作造成帶寬瘋狂增加,這時候就需要及時預警;
沒有充分利用自動化工具,及時根據業務壓力情況調整云資源配置,從而節省云費用;
對節約云費用的培訓不夠,獎懲不明確,造成部分組織成員沒有節省云費用的意識;
在組織架構上沒有統一的云治理部門,造成云資源使用混亂,失去和云供應商的議價能力,失去應有的優惠折扣。也不能推行內部使用云的標準化,造成云資源使用方式停留在比較低的水平,甚至基本的安全問題都不能保證。
企業在云上的浪費,消耗的都是真金白云來之不易的利潤,是應該極力避免的,那么,如何優化云成本,盡量避免浪費?應該從兩個方面入手,一方面建立組織統一的云治理中心,一方面引入相關的工具。
組織應建立統一的云治理中心
隨著云使用量的增加,很有必要在組織內部建立統一的云治理中心,即便這個中心只有一個人,或者與其他工作共用一個人,以便在以下方面對云的使用持續優化:
內部流程,流程應該在優化成本和方便性之間取得平衡,否則企業上云獲得的敏捷性將會打折扣。
建立標準,提升自動化水平,利用云的API,在業務層面實現自由彈性的伸縮,當業務壓力增加時,增加云資源,反之則釋放云資源,是對云敏捷性利用的更高階段,也是云成本優化的更高階段。
安全保證,安全必須從全局出發,統一的云治理中心是對云安全的有力保障。
內部培訓,持續優化,云成本優化是一個持續的過程,也需要不斷的提升內部員工的意向和能力,需要專門的分支部門持續推進。
推進新技術使用,云原生、無服務器計算等新技術的使用,可以提升云使用的水平,同時也節省云成本,但是如何推廣和使用,需要有專門的分支部門組織和推進。
使用工具優化云成本
云成功優化工具方面可以分為開源工具、云廠商工具和專業工具。
開源云優化工具
開源工具主要是自動化類的,比如Puppet、Ansible、SaltStack等,還要監控類的,比如Zabbix、Nagios、Prometheus、Grafana等。自動化類可以提升云部署效率,監控類的工具可以收集分析云資源使用情況。
云廠商云優化工具
AWS成本管理器
AWS成本管理器可以提供報告、分析和可視化功能,可用于跟蹤和管理 AWS 成本。:
查看 AWS 成本和使用量的整體狀態,查看支出狀態、找出在整體支出中占比例最高的服務,并總體了解成本的變化趨勢。可以使用其他多種成本管理工具來深入分析AWS 成本和使用量。
AWS 成本管理器可以幫助顯示、了解和管理AWS成本和使用量隨著時間的變化。可以在一個直觀的界面中快速創建各種自定義報告 (包括圖表和表格數據),從而在總體角度或針對特別具體的請求分析成本和使用量數據。
設置自定義成本和使用預算,借助 AWS 預算,可以設置自定義成本和使用預算,使其在超過閾值時提醒。
2 微軟Azure
微軟2017年收購了以色列云監測和分析初創公司Cloudyn。Cloudyn公司創立于2012年,它致力于幫助企業客戶通過分析和優化工具來自動監測器云服務成本。可見微軟對云成本優化的重視,Azure云成本工具可以從維度自動導出計費數據和計劃的報表。
其他云廠商一般也都提供云成本優化工具或者方案。
開源的工具,只能解決云成本優化的部分問題,并且使用門檻比較高,云廠商的工具只能針對自家的云使用,不支持多云情況,也不支持對用戶內部流程和業務優化,如果要尋求整體的云成本優化方案,還是要借助Cloud MSP(關于Cloud MSP能做什么,請參考云時代,Cloud MSP時代! )。
Cloud MSP可以幫助建立優化組織內部的云治理部門,也會提供支持多云的云成本優化工具,比如ChinaMSP總結出了一套“公有云費用優化最佳實踐”,也用于專業的云成本優化工具CostVison,幫您找到云費用最優解。
ChinaMSP云成本優化方案解析
ChinaMSP總結出了一套“公有云費用優化最佳實踐”,此最佳實踐共分為9個步驟:
根據ChinaMSP的實踐經驗,公有云費用優化最佳實踐實際上是一個最好按序抵進的行進路徑:
此處增加“腦圖中云費用優化最佳實踐”的內容描述,重點描述RI管理的部分。
China MSP的云成本優化工具CostVison,針對用戶云成本痛點,提供以下功能:
1.管理支撐:
費用分析:服務類別(云主機、存儲、網絡傳輸、數據庫等服務)費用占比;資源使用分析:云主機、數據庫、云存儲的資源利用率分析,是否存在優化空間;費用分攤:各個部門和小組的費用支出分攤;預算匹配:預算是否超花。
2 優化建議:
云主機配置,RDS配置,未使用彈性IP檢查,未掛載云磁盤檢查,預留實例購買建議。
3 自動化編排:
自動執行周期性操作: 如工作日早九點到晚八點,對標簽為”研發“ 的資源執行批量自動啟停
資源規格自動調整: 如根據業務負載基線,在資源使用率低的時候降配、在負載提升前升配
負載均衡組自動擴縮策略: 根據業務負載自動在閑時降低資源組實例數量
自動發現競價實例: 根據業務情況進行競價實例購買、部署和使用
自動調整預留實例價格:根據基線及時調整使用率不高的資源,最大化利用預留
自動備份與刪除快照:自動創建實例快照、刪除冗余快照,確保最小數量快照和鏡像,節省存儲費用
總結
云上每節約的一分錢,都是節省的利潤,隨著使用云的規模增加,企業非常值得下大力氣專門對云成本進行優化。云成本的優化是一個長期的過程,需要專門的部門推進,也需要專業的云管理服務商和工具支持。(文/云技術實踐 君子蘭)