日前,谷歌平臺副總裁BartSano接受了行業媒體的采訪,并闡述了用戶在企業需求,遷移挑戰,以及下一波云計算浪潮等方面如何對Google硬件選擇。
云計算提供商正在大規模擴展其基礎架構選項,這是因為眾多企業將大量數據遷移到其平臺上,而Google也沒有什么不同,因為它將這些較新的技術視為成為市場中的主要參與者的一種方式。
谷歌平臺副總裁BartSano帶領團隊致力于這些工作,這個團隊歷史幾乎和公司本身一樣長。他們目前正為一家以其規模經營能力而聞名的企業設計倉庫級規模的數據中心和一切設施。
記者:谷歌公司和英特爾公司最近宣布了圍繞企業云達成合作伙伴關系。其中,下一代英特爾芯片將在2017年部分進入Google云端平臺。達成這種合作伙伴關系的動力是什么?
BartSano:我們通常不會發布這種類型的公告,但我們認為這是重要的,所以人們明白明年年初將采用這種技術,其對最終客戶的好處不僅僅是有用的,顯然,谷歌公司本身為企業提供搜索,廣告,以及任何系統的服務。它對云計算也非常有用,因為可以提供更高的性能,更多的配置,將有助于更大的內存占用,更多的線程等不同的工作負載,以及構建體系結構,幫助處理更多的計算和向量。
記者:Google公司建立了其基礎設施以滿足其自身的特定需求。是否通過更改底層硬件可以滿足云客戶的各種不同需求?
Sano:我們將Google公司視為五到八個不同的產品領域,這些產品領域有自己的形式和功能。當我們遷移到云計算時,將有更多的客戶。其中許多仍然適合我們內部執行的類型,因為它們是通用的,但是有些客戶想要最大的內存配置或者最快的浮點數比率。它變得更大異質性,不僅在計算中,而且在數值計算中采用GPU和TPU。
記者:在TPU和GPU之間,甚至現場可編程門陣列(FPGA)中,主要的云提供商似乎大力加快將這些技術并入其平臺。在將來采用什么技術?
Sano:我們正在努力為迎接下一波技術浪潮提供支持,即機器學習和大數據處理,并利用機器學習和分析大數據。企業需要更多的數值計算來進行大數據處理中的業務。
例如,不是每個企業都需要一個GPU來做小型機器學習模型,或者實行一個特定的任務,也許CPU功能是足夠的。這是人們以前的做法,直到現在問題變得越來越大,不得不采用GPU。最終,當問題變得太大不好處理的時候,作為廠商,不得不做我們自己的定制硬件。然后,決定做一些自定義ASIC(專用集成電路)與FPGA,這只是架構方面的一個區別:如果企業想要一個更可編程的東西,更固定的功能,還是更有效率的產品?這二者都有自己的誘惑和優勢。
采用這些不同技術的所有原因,是因為人們看到計算從通用到機器學習和分析空間的轉變,人們看到云計算提供商試圖引入分析能力,而不需要通用的東西。
記者:能解釋一下這個過程在Google上的演示嗎?
Sano:將從FPGA開始。企業通常使用FPGA,因為它是可編程的,你不能“預測未來”,所以具有靈活性。企業在部署FPGA,并實現個性化之后。我理解這種欲望,因為很難預測未來,但是他們是非常昂貴,非常渴望,因為他們是通用的。
另一個方向是,如果企業可以足夠快地開發定制ASIC并快速部署,那么FPGA的優勢就會減少。這是我們的立場,我們能夠及時開發ASIC,總是努力建立一個可以在某種意義上進行再制造的基礎設施,并進行再制造和個人化。”
記者:Google是容器的早期采用者。您對于技術如何變得流行的觀點是什么?
Sano:我們有一個決定,那就是應該使用虛擬機還是容器?我們最終決定采和容器,因為其有更低的開銷,雖然它可能使一些管理復雜化,但卻是一個更有效的解決方案。我們證明了這是一個很好的決定。虛擬機非常靈活,但企業為這種靈活性支付更高的溢價。效率是企業真正重要的事情。由于企業的規模,哪怕提高1%或2%的內存效率或處理器遷移時間或開銷,這很重要。
記者:谷歌公司在促進客戶大規模遷移面臨什么樣的挑戰?
Sano:移動數據不容易,這是一個很大的挑戰。軟件是面臨的最大的挑戰,坦白地說,獲得所有的軟件,所以它可以遷移或數據集等,我們可以很容易地看到它可能變成一個異構平臺環境。
為了讓他們的內部環境進入我們的云計算,它不僅是軟件,而是物理限制。被綁在硬件上,因為這是我們正在與他們合作...我們正試圖更加靈活,并可以容納他們,但它是一個過渡到這個行業,我們必須通過。
記者:在轉向云計算的過程中,企業還有哪些其他大的挑戰?
Sano:對于在遺留系統等上運行的傳統企業來說,所具有的一個遷移戰略必須開發和導航。對我來說,這是最大的問題,我們想要做的是在混合環境中建立盡可能多的橋梁。