通常情況下,企業或團隊的首席財務官或主管需要對最終產生的所有財務成本負責。而在IT部門,IT負責人需要掌握應用程序使用和代碼開發資源所產生的成本。而很多企業已將部分或全部項目和應用程序遷移到公共云,而且從生產的角度來看,事情似乎運行得很順利,因為大多數公司都對遷移和轉換感覺非常好。
也許很多企業被遷移到云端可以降低成本這一承諾所吸引,但當收到云計算提供商高昂的賬單之后可能會大吃一驚。
很多人想從預留實例、按需成本、混合費率等因素來理解云計算成本賬單,但這讓人們無法更深入地了解在哪里可以優化其支出。
這甚至需要企業的會計部門來理解定價結構,服務本身的情況也同樣令人難以置信。事實上,僅在AWS公司的云平臺中就至少有500000個庫存量單元(SKU)的價格組合。此外,誰可以在什么時候啟動任何特定的資源,企業團隊對此可能并沒有限制,其本質上將使問題復雜化,特別是當繼續運營時,這顯然將會產生大量費用。
事實上,解決這個復雜且不斷變化的問題并不是一件簡單的事情,它需要一種全面而密切的方法,從了解成本和性能優化的各種機會開始。這就是云計算成本優化的六大支柱所起到的作用。
(1)預留實例(RI)
AWS保留實例、Azure保留虛擬機實例,以及谷歌云承諾使用折扣,這些使云計算資源的使用時間變得短暫,允許企業提前估計將要使用的內容。這也使企業有權在預先計劃時享受大幅折扣,這最終會成為一個巨大的財政激勵。
大多數云計算成本優化錯誤地開始和結束,為企業提供了并不理想的解決方案。估計預留實例(RI)購買的資源可通過云計算提供商直接和第三方優化工具獲得。例如,VMware公司的CloudHealth可根據企業當前的云平臺使用情況,在幾個月內提供有關購買預留實例(RI)的詳細信息,并將幫助企業管理預留實例(RI)生命周期。
這里要考慮的兩個主要因素是風險容忍度和集中式預留實例(RI)管理組合。
•風險容忍度是指確定企業愿意預先支出多少費用,以增加未來收益或收回利潤的可能性。例如,企業是否可以承擔風險,并使用預留實例(RI)覆蓋70%的工作負載?或者是否擔心消費,因此希望將其限制在20%~30%左右?此外,企業能在未來幾年內預測多久?當然,一年是風險最小的,但是如果是三年,這也是一個更大的財務承諾,會節省更多的成本。
•集中式預留實例(RI)管理組合允許跨組織單元更深入地預留實例(RI)覆蓋,從而帶來更大的節約機會。例如,單個應用程序團隊可能擁有有限的現金池來購買預留實例(RI)。或者根據企業的目標,集中的整個組織方法將涵蓋所有工作負載的所有部門和團隊。當然,這種方法還需要與不同的小組進行持續的溝通,以了解創建和執行成功的預留實例(RI)管理計劃所需的當前和未來資源。
一旦確定了風險承受能力,并將企業的方法集中到預留實例(RI),企業就可以利用這個優化選項。但是,僅限預留實例(RI)的優化策略是短視的。它只允許企業利用云計算供應商提供的定價選項。將預留實例(RI)購買與其他5個優化支柱疊加在一起非常重要,可以實現最有效的優化。
(2)自動停放
云計算的一個好處是能夠根據需要啟動或減少資源。然而,這種即時技術的缺點是,團隊成員在完成這些流程時終止的動機很小。自動停放是指在非工作時間關閉運行的資源,這對于開發和測試環境來說是一個特別有用的工具。通過強大的標記策略識別企業的閑置資源是第一步;這使企業可以精確定位可以更有效地停放的資源。第二步涉及自動化上升/下降過程。 ParkMyCloud、AWS Instance Scheduler、Azure Automation和Google Cloud Scheduler等工具可以幫助企業管理整個自動停放流程。
(3)調整規模
適當的規模可以確保企業正確使用需要的資源,而不是太少或太多。當企業開始使用云計算環境時,立即“啟用正確的規模”似乎是明智的選擇。但是,如果沒有分析消耗資源或啟用計費的能力,適當的規模就變成了毫無意義的概念。云計算應用程序的性能和容量要求通常會隨著時間的推移而發生變化,這不可避免地導致資源使用不足和閑置。
許多云計算提供商分享了正確調整規模的最佳實踐,盡管他們花費更多時間來解釋云遷移之前存在的正確規模選項。保持適當的規模是一項持續的活動,需要實施政策和保護以減少過度配置,標記資源以啟用部門級別的計費,并正確監控CPU、內存和I/O,以便真正有效。
適當的規模調整還必須考慮自動停放的資源和可用的預留實例(RI)。那么是否看到了優化支柱的趨勢?
(4)家族更新
實例類型、虛擬機系列和“實例系列”都描述了云計算提供商根據所使用的硬件打包其實例的方法。每個實例、系列、家族都提供不同種類的計算、內存和存儲等參數。它們的集合分組中的實例類型通常作為一個單元退役,當保持它們運行所需的硬件被更新的技術取代時,新系統將取代舊系統,云計算定價會直接與保護措施的變化相關聯。這稱為“家庭更新”。
企業內使用的實例類型/系列的最新知識是估算成本何時會波動的重要組成部分。但事實上,對于任何一個云計算提供商來說,有超過500000個庫存量單元(SKU)和價格組合,這項任務似乎不可能完成。
但是,有些工具可以幫助監控/估計系列刷新,但它們通常不會考慮預留實例(RI)發生的重疊,或者在應用任何其他優化支柱時。因此,對于許多組織而言,“家庭更新”聽起來像一項人工的、費力的任務。值得慶幸的是,已經找到了通過優化服務產品自動化建議的方法。
(5)資源浪費
與運行時間遠遠超過其可用性的實例有關,在云計算中浪費是普遍存在的。在涉及虛擬資源時,浪費似乎是一個抽象的概念,但在這種情況下每個浪費的單元都是無用的。而且,當企業可以使用的資源數量沒有限制時,也沒有激勵使用這些資源的個人自我管理其未使用/未充分利用的實例。云中浪費的一些例子包括:
•沒有連接的AWS RDS或Azure SQL DB
•未使用的AWS EC2
•用于培訓或測試的Azure虛擬機
•持有存儲空間的日期快照永遠不會采用
•空閑負載平衡器
•未連接的卷
識別浪費需要時間和準確的報告。然而,投入時間和精力來制定適當的標記策略是一個很好的理由,因為浪費將立即追溯到產生它的組織單元,因此,很容易標記為審查或刪除。人們經常看到企業在消除浪費之前購買了預留實例(RI),這些浪費一定會導致它們在云中超支至少一年。
(6)存儲
存儲在云中是減少本地硬件支出的一個很好方法。盡管如此,由于使用起來非常簡單,云存儲可以在很短的時間內以指數形式擴展,幾乎不可能預測準確的云開銷。云存儲通常有四個特點:
•規模 – 企業需要多少存儲空間?
•數據傳輸(帶寬)–企業的數據需要多長時間從一個位置移動到另一個位置?
•檢索時間–企業訪問數據的速度有多快?
•檢索請求–企業需要多久訪問一次數據?
對于不同的用例有多種選擇,包括使用更多的文件存儲、數據庫、數據備份或數據存檔。有一個可靠的數據生命周期策略將有助于企業估計這些數字,并確保企業適當的存儲量和帶寬都是正確的,并且在任何時候都能發揮最大的潛力。
因此可以看到,這六個優化支柱中的每一個都包含許多移動部件,因此公共云提供商不斷修改其服務產品和定價。此外,只考慮其中一個支柱而不考慮其他支柱,那么幾乎沒有改進。事實上隨著時間的推移,企業無意中可能會花費更多的費用。有效的優化流程必須考慮所有支柱及其重疊方式,制定正確的政策和防護措施,以確保云蔓延不會持續,并實施合適的工具,讓企業定期做出明智的決策。
對企業來說,未來是光明的!在評估了當前環境后,考慮了成本優化支柱,進行了優化云計算所需的更改,并找到了使此流程連續的方法,企業可以通過應用程序重構、臨時實例、現場實例和無服務器架構來進行優化。