公有云提供商越來越多地為大計算量應用提供基于GPU的云服務,但組織需要合適的技能和預算來部署它們。
數據分析、人工智能和機器學習越來越受重視,這也就引導企業開始仔細研究圖形處理單元。
作為回應,頂級云供應商Amazon Web Services(AWS)、Microsoft和Google現在已經能夠提供支持圖形處理單元(GPU)的公共云實例。雖然這些GPU云實例具有很大的潛力,但它仍處于開發的早期階段。因此,現在還存在一些障礙,例如成本和很多定制開發工作(在許多情況下)。
不斷變化的市場
傳統上,資源密集型系統(也被稱為高性能計算(HPC))是面向研究、工程和視頻開發的技術。典型應用包括基因組學,計算金融,視頻渲染和可視化。
HPC系統在特殊配置的服務器上需要大量的處理能力。開發經常需要花費數年時間,應用也需要幾天或更長時間才能在高端專用系統上運行。因此,這些應用難以構建,運行成本高,大多數企業都無法實現。
但最近,HPC市場動態發生了變化。這些系統已經從定制的CPU轉移到商業設備上。像Nvidia和Intel這樣的廠商將其GPU定位為適合HPC市場,而頂級的公有云供應商依靠他們來支持HPC服務。
此外,客戶資料也已更改。歷史上,HPC系統通常部署在利基市場,但已經以自己的方式進入了企業的主流。預計隨著物聯網的出現,企業處理的大量數據將呈指數級增長。隨著公司不斷地收集和挖掘更大的數據庫,他們正在尋求軟件來幫助進行自動化處理。因此,GPU系統(包括GPU云實例)已成為人工智能和機器學習應用的計算引擎。
供應商整合了其GPU云實例陣容
向GPU轉移的這一趨勢引起了最近進入這一市場的頂級公有云供應商的關注。在2016年第四季度,AWS和Microsoft Azure都分別公開了新的GPU云實例——分別是P2實例類型和N系列,而在二月份,Google也加入了戰團,開始GPU支持(目前正處于測試階段)。
雖然這些實例類型非常適合機器學習和其他計算密集型應用,但仍然存在幾個影響采用的障礙。首先,這些服務通常是昂貴的。AWS和Microsoft Azure每小時每GPU的價格為0.90美元,而Google GPU云實例的價格為每小時0.70美元。相比之下,AWS針對通用計算實例定價為每小時0.0059美元。
此外,這個市場依賴于定制開發和高度專業的編程工具。熱門框架包括Apache Spark,Caffe,Apache SystemML,MXNet,TensorFlow和Torch。大多數企業的IT部門都缺乏編寫和管理使用這些框架構建應用程序的技能。組織需要對員工培訓和認證計劃來管理這些部署進行投資。
HPC、機器學習等計算密集型應用不斷受到企業的歡迎。而GPU云實例可以幫助支持這些工作負載,昂貴的價格和經驗的缺乏可能會影響許多企業在短期內部署。