日前,谷歌公司推出一個測試版的云服務,允許用戶租用在谷歌數據中心運行的Nvidia GPU,以運行機器學習和其他計算量大的工作負載。
雖然在生產中使用機器學習的企業相對較少,但是在該領域還是有很多開發工作,例如計算機科學家建立和訓練機器學習算法,企業調查各種業務案例等。訓練這些系統需要大量的計算能力,而目前企業發現利用許多并行工作的GPU的能力是獲得這種驅動力的最好方法。
為GPU集群構建專門的供電和冷卻系統并不合算,這使得租賃成為很好的選擇,特別是在實驗階段,大多數公司都采用機器學習。這對于云計算提供商來說是一個商機,他們已經擁有這種基礎設施和資源的經驗,可以提供它作為一種服務。
谷歌公司在云基礎架構服務的最大競爭對手亞馬遜和微軟公司都推出自己早期的云GPU服務。亞馬遜網絡服務公司去年9月推出了其附帶Tesla K80 GPU的P2云VM實例,微軟Azure在2016年12月推出了由Tesla K80芯片提供支持的N系列服務。
對于租賃相同的GPU集群,谷歌為美國用戶提供的價格為每GPU每小時70美分,為亞洲和歐洲的客戶提供的價格為77美分。谷歌公司的定價低于亞馬遜公司,亞馬遜公司托管在美國的最基本的單GPU P2實例每小時花費為90美分。微軟沒有透露其價格,但N系列的最基本的配置每月收取700美元的費用。
機器學習技術日益發展成熟,目前還不清楚什么類型的基礎設施將占主導地位。Cirrascale公司也是一家提供裸機GPU服務器作為云服務的機器學習的廠商,該公司高管認為混合基礎設施最有可能變得更加普遍,其前提是計算業務和云服務得到更大的發展。