如果只是因為AWS云平臺可以在兩分鐘內運行實例,就會錯失按需價格折扣的機會(最多可以節省90%成本)是沒有意義的。即使對于生產工作負載,用戶也可以有效地使用Spot實例。
以下是如何處理Spot實例并在云計算賬單上節省大量成本的6個技巧:
#1:知道何時使用Spot實例
第一步是大致了解哪些服務可以從Spot實例中受益更多。
例如,如果用戶的服務是無狀態的并且可以擴展(具有多個副本),那么可以在這里使用Spot實例。如今,現代架構中的大多數服務都是無狀態的。
以下是一些可以從Spot實例受益的工作負載示例:
•具有容錯性和實例靈活性的批處理作業。
•容器和微服務通常是獨立的、高度可用的、能夠處理中斷和容錯的。
•高性能計算(HPC)和機器學習應用程序需要高性能的計算能力、大量的內存、超快速的存儲和較高的網絡性能。Spot實例可以提供幫助,甚至可以作為它們的主要計算基礎設施。
•持續集成(CI)/ 持續交付(CD)操作,無論使用什么工具,Spot實例都可以在部署過程中提供幫助。
•分布式數據庫(例如Elasticsearch或MongoDB)能夠處理中斷,而不會丟失任何數據或影響服務。
•編排環境中的任何應用程序。
#2:檢查工作負載是否已準備就緒
在尋找Spot實例的潛在候選對象時,需要了解一些有關它的信息。
以下是一些可以更進一步研究的問題:
•需要多少時間才能完成工作?
•是否對任務和時間至關重要?
•可以處理中斷嗎?
•實例節點之間是否緊密耦合?
•AWS云服務中斷后,將使用哪些工具來轉移工作量?
回答了這些問題,用戶就會知道Spot實例是否適合自己的工作負載。
#3:選擇正確的Spot實例
了解一下AWS云平臺提供的服務。可以選擇一些不太主流的實例,這樣就會降低中斷的數量,并且可能會穩定運行更長的時間。
在尋找最佳虛擬機類型以完成工作時,需要查看其中斷頻率。這是實例在過去一個月中回收容量的速率。
AWS在Spot實例顧問中將其顯示在以下范圍內:<5%,5%~10%,10%~15%,15%~20%,> 20%:
可以將Spot實例用于具有特定類型的競價型實例的生產工作負載。AWS為用戶提供了一個可以保證不中斷工作(最多6個小時)的信息(以小時為單位),而用戶只需要為此多支付一些費用。但是與按需定價相比,仍然可以獲得高達30%~50%的折扣。
#4:設定價格
知道要使用的Spot實例后,就可以設置愿意為它們支付的最高價格。這是一個很好的經驗法則:將價格設置為與按需定價相匹配的最大值。
需要注意的是,用戶的Spot實例只有在其市場價格與其出價相匹配(或低于出價)時才會運行。如果用戶的自定義價格低于按需定價,并且Spot實例的價格上漲,那么用戶的Spot實例可能會面臨中斷的風險。
#5:分組管理Spot實例
這是一個明智的舉動,因為它使用戶可以選擇同時請求多個實例類型,并增加了為工作負載獲取一個實例的機會(避免出現任何中斷)。
另一個好處是,用戶可以為整個實例隊列(而不是給定的現貨池)設置每小時的最高價格。競價池是一組具有相同類型、操作系統、可用性區域和網絡的實例。
在AWS云平臺中,這稱為AWS Spot Fleets。這一功能使用戶可以使用各種分配策略來管理大量的Spot實例。例如,只考慮最低價格或容量優化的實例類型。
需要注意的是:為許多人工配置、設置和維護任務做好準備。
#6:自動化Spot實例
用戶如何避免丟失現場實例造成的停機時間?一個最好的策略是實施自動化工具,該工具使用策略和自動擴展功能為用戶管理云計算基礎設施。
通過使用自動化的云計算成本優化解決方案,用戶可以選擇在現場實例上運行多少工作負載,然后在發生中斷時自動返回到按需實例。
用戶的工作負載將始終有運行的地方。由于AWS可以重新平衡事件,即使在用戶收到兩分鐘的中斷通知之前,也有可能降低風險。
為了獲得最佳結果,需要采用一個基于預測分析(如CAST AI)的自動化操作的解決方案。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。