日前,谷歌公司工程副總裁Ben Treynor Sloss表示,其全球在線服務的龐大數量的數據中心將很快在人工智能的幫助下運營。這一預測是基于機器學習系統的計劃所確定的,這個系統為谷歌公司在2016年推出的一個數據中心提供了相應幫助。
谷歌公司的DeepMind系統通過調整服務器的運行方式以及控制電源和冷卻設備的操作,顯著提高了其數據中心的能源效率。通過DeepMin系統的幫助,谷歌公司可以將服務器的能耗降低約40%。如果谷歌公司在其全球所有的數據中心應用這一技術,那么每年可以節省數千萬美元的成本。
“我們開發的產品如此引人注目,以至于我們的挑戰更像是一個工程。我們到底能夠多快地將其推廣到全球各地的數據中心?”Sloss說。“如果用戶能節省這么多的電能,想要獲得這些收益,我們將繼續完善這個模式,并且繼續可能把更多的系統置于其關注的狀態,因為其初步的結果是如此令人印象深刻。”
Sloss表示,不僅僅是谷歌公司正在呼吁將其數據中心運營置于人工智能的管理之下,通過自我學習系統所取得的成果對人工決策有著明顯改善,使用機器學習系統將迅速成為運行大型數據中心時必不可少的措施。
他說:“這樣做的結果不僅僅是在幾年之后受益,就是與目前相比,其狀況水平要好得多。培訓網絡是進行一個基本的模擬過程控制,我猜測這將會變得更加普遍。”
也許更令人驚訝的是,DeepMind系統通過改變傳統邏輯來實現這些結果。盡管傳統的降低數據中心能耗的方法是盡可能少地運行冷卻系統,但人工智能則建議以更低的功率級別運行所有系統。
谷歌公司首先透露,曾經試圖在2014年將人工智能技術應用于運行數據中心,當時已經使用神經網絡來挑選電力使用模式,并尋找降低電力功耗的機會。
DeepMind聯合創始人Demis Hassabis表示,谷歌公司自2014年以來就加強了對人工智能的使用,使用了DeepMind人工智能來對數據中心的運行進行建模,并調整了與其運作相關的120個變量,以實現其能源效率達到最高水平。當采用該模型的建議時,數據中心的能源使用效率(PUE)有所改善,這一措施反映了數據中心設施能夠為服務器供電使用多少電能,而不是驅動相關的基礎設施來處理冷卻設備和功率分配。
調研機構451 Research數據中心和關鍵基礎設施研究副總裁Andy Lawrence認為,谷歌公司使用人工智能來幫助運行數據中心的實驗最終將成為主流。
“谷歌公司使用DeepMind來減少其數據中心的PUE值是人工智能/機器學習的一個有趣的應用,并且清楚地指出了最終將實現什么。”他說,“其長期趨勢是使用軟件工具自動或自主管理數據中心。”
不過,他表示,谷歌公司目前的數據中心的效率已經非常高,而目前只能將數據中心的電源效率從86%提高到88%。
“即使如此,谷歌公司在全球范圍內的數據中心也將節省很大的成本,因為每年使用超過500萬千瓦時的電力。”他補充說,這種方法對于規模龐大的科技公司來說可能是有意義的,但需要大規模的投資。
“即使是谷歌公司,其面臨的一個挑戰是需要大量的傳感器,而且這些傳感器的部署成本可能會非常昂貴。”他說。
Lawrence表示,Vigilent公司采用基于機器學習的算法方法來優化客戶的冷卻服務,而且長期來看,希望看到“基于人工智能的效率服務作為服務提供給數據中心”。
谷歌公司開啟和關閉機器學習建議時的數據中心功耗的差異
Lawrence 表示,“我對我們能夠做的事情感到興奮。”也許DeepMind的機器學習系統最有效的演示就是DeepMind AlphaGo,這個人工智能技術最近在與人類的圍棋比賽中獲得勝利,這個古老的中國游戲的復雜性讓計算機專家為之努力了幾十年。圍棋的每回合約有200種可能進行的動作,而國際象棋約為20種。在圍棋游戲的過程中,計算機通過提前搜索圍棋回合中的每一個動作,以確定最佳游戲步驟,這在計算的角度來說有些復雜昂貴。相反,AlphaGo已經將3000萬次的圍棋比賽的人類行為訓練深入學習的神經網絡來玩游戲。
培訓這些深入學習網絡可能需要很長時間,因為系統逐漸優化模型才能獲得最大的效果,因此需要大量的數據被攝取和迭代。
為了簡化培訓過程,谷歌公司開發了自己的專用芯片,稱為張量處理單元(TPU),可以通過谷歌公司的TensorFlow軟件庫來加快實現機器學習模式的速度。這些芯片不僅僅用于培訓DeepMind和Google Brain的模型,還包括支持Google翻譯和Google Photo中圖像識別的模型,以及允許公眾使用Google TensorFlow研究云構建機器學習模型的服務。這些芯片的第二代產品已在今年5月的Google I/O會議上亮相,隨著這些新型TPU提供的一系列功能,訓練一個用于翻譯的Google機器學習模型可以節省一半的時間。
Sloss說:“TPU比目前可用的技術具有巨大的性能優勢。在這個時候,所有正在致力研究機器學習的廠商都是在人機大賽表演之后追逐的,這會帶來一個很大的競爭優勢,因為可以在某種程度上模仿一些有用的東西。”
在谷歌公司數據中心未來對TPU的推出沒有作出堅定承諾的同時,他表示:“我懷疑能否將繼續使TPU得到更廣泛地使用”。
即使作為谷歌公司的內部人士,Sloss也承認,機器學習能力在能夠并行處理大量數據的處理器背后推動的速度,以及龐大的培訓數據集的可用性令人吃驚。
他表示:“在過去的幾年里,機器學習的整體能力還在不斷提高。我是一名棋手,如果有人三年前告訴過我,2017年世界圍棋冠軍將是一臺電腦,我當時不會這么確定。而在三年之后,我們實現了這個目標。我很期待機器學習能在接下來的五年里為世界做些什么。”