在IT界,永遠不缺乏新鮮的詞匯與炫酷的技術。深度學習(Deep Learning)就是其中之一,近些年獲得無數關注與追捧。Facebook、Google、百度、騰訊與阿里巴巴等互聯網巨頭都開始嘗試將深度學習算法運用到產品開發中,包括計算機視覺、文本檢索、語音識別以及自然語言理解等,以便讓產品更智能化,更好地提升用戶體驗。
深度學習為什么那么火爆?傳統的機器學習面臨諸多挑戰,目前最大的網絡僅僅10層左右,擁有10億個參數,那么用1000萬張圖片進行訓練需要30百億億次浮點運算,而人腦擁有數以萬億計的參數,是前者的1000倍。所以,人眼與電腦所見大不相同。
因此,深度學習是目前最接近人腦的智能學習方法,它通過建立深度神經網絡像人腦一樣去學習知識。而深層模型的并行化框架和訓練加速方法是深度學習走向實用的重要基石。
GPU加速對于深度學習的重要意義
GPU自身具備的高并行度、矩陣預算與強大的浮點計算能力與深度神經網絡的需求契合,可以大幅加速深度學習模型的訓練,在相同精度下能提供更快的處理速度、更少的服務器投入以及更低的功耗。
NVIDIA(英偉達)中國區技術經理賴俊杰作了一個比喻,深度學習就像一個待發射的火箭,需要引擎與燃料這兩大要素才能起飛。“引擎指的是大型神經網絡,而燃料就是數據。”
GPU加速在其中所起的作用是訓練一個卷積神經網絡。例如,批處理128images,CPU需要124秒,而GPU只需要14.5秒。
NVIDIA的深度學習戰略
GPU簡直就是NVIDIA公司的鎮店之寶。它是現代視覺計算的引擎,從最初用于游戲娛樂與視覺計算,到現在廣泛應用于HPC、云與大數據領域,GPU的魅力正在散發光芒。NVIDIA全球副總裁、PSG兼云計算業務中國區總經理Ashok Pandey表示,NVIDIA已經形成完整的端到端解決方案平臺,業務橫跨HPC與數據中心,覆蓋石油石化、高教、政府、超算、金融與消費終端等領域。
從2008年的Tesla、2010年的Fermi,到2012年的Kepler,再到2014年的Maxwell。NVIDIA Tesla GPU加速器在HPC與超算行業中發揮著重大作用。其強大的性能與更大的內存容量,企業用戶可以快速地處理大數據分析應用所產生的海量數據。對計算科學家來說,Tesla加速器可提供所需的處理動力,能夠以前所未有的速度運行更大型的模擬。
Ashok表示,NVIDIA將在中國構建完整的生態系統圈。具體而言,主要覆蓋六大方面,包括積極參與開發社區,針對最流行的深度學習框架,如Caffe、Theano、Torch,推出基于這些框架的CUDA工具庫;與眾多高校科研機構合作,構建30余所CUDA聯合創新中心和研究中心;與BAT等互聯網企業合作,打造強大的OEM體系;啟動針對深度學習相關新興公司的研討會培訓計劃,召開ICCML與ACML等大會;吸引諸如科大訊飛與北京文安等初創企業加入其中;以及與政府、基金資助機構合作。
整個體系如何分工協作呢?首先是OEM合作伙伴提供硬件,主要是由曙光與浪潮等小伙伴提供,例如浪潮此前推出了一款基于GPU的SmartRack,這款GPU協處理加速整機柜服務器為深度學習提供支撐。NVIDIA則提供語音、文字、圖像、人臉識別、開發平臺與Cuda等軟件,對新興公司進行技術培訓,實現ISV與SP的應用開發,針對重點客戶則合作建立聯合實驗室滿足其特殊需求。
2015年1月,NVIDIA與愛奇藝簽署了深度合作框架協議雙方將在視頻深度學習和媒體云計算領域緊密合作,利用最先進的GPU和深度學習架構,搭建愛奇藝視頻創作、分享、服務平臺。
四大新品你必知
剛剛在美國結束的由NVIDIA主辦的全球GPU領域規模最大的GPU技術大會(GTC 2015)上,深度學習成為最耀眼的明星。
NVIDIA發布了全球最快的GPU——GeForce GTX TITAN X。在圖像分類模型AlexNet的訓練中,只需不到3天時間便可完成,比基于16核CPU的系統快15倍。而NVIDIA的下一代GPU架構Pascal,更可將深度學習加速10倍。
此外,還有針對研究人員的深度學習平臺DIGITS DevBox、在深度學習方面相當于Maxwell十倍的Pascal,以及用于自動駕駛汽車的深度學習平臺Nvidia Drive PX。
應用廣泛的CUDA并行計算架構也針對深度學習推出了cuDNN函數庫。cuDNN可以直接集成到目前流行的深度學習框架中,例如Caffe、Torch7和Theano等,開發人員可以快速無縫在系統中整合GPU。通過cuDNN,開發人員不必再關心以往深度學習系統中的底層優化,他們可以將注意力集中在更高級的機器學習問題。
賴俊杰表示,基于Cudnn的Caffe訓練AlexNet模型時,性能比原始版本提升1.36倍,卷積計算達到1.9倍,Pooling達到2.7倍。他表示,很多用戶選擇Caffe作為深度學習的框架。
深度學習NVIDIA準備好了
GPU加速器不僅在高性能計算與超級計算行業中已成主流,而且深度學習與人工智能也是GPU發光發熱的領域。作為GPU市場當之無愧的王者,NVIDIA憑借其自身的優勢將在深度學習方面大展拳腳。正如Ashok所強調的,NVIDIA是一家技術型的公司,可以為深度學習研究提供完整的技術平臺和解決方案。企業則可以使用GPU代替CPU以獲得更高的速度及更低的成本。