NVIDIA憑借GPU成為人工智能計算平臺的領導者
目前來看,NVIDIA作為人工智能計算平臺的領導者,但事實是,一開始并非NVIDIA選擇了人工智能,而是人工智能的研究者選擇了GPU,進而成就了NVIDIA。在2012年,Alex利用深度學習+GPU的方案,一舉贏得ImageNetLSVRC-2010圖像識別大賽,并奇跡般地將識別成功率從74%提升到85%。NVIDIA敏銳地覺察到了這一趨勢,并大力優化基于GPU的深度學習生態系統,并加速迭代開發,三年時間將GPU性能提升了65倍,從而奠定了目前的王者之位。
在深度學習過程中,分為訓練(training)和推斷(inference)兩個環節:訓練環境通常需要通過大量的數據輸入,或采取增強學習等非監督學習方法,訓練出一個復雜的深度神經網絡模型。訓練過程由于涉及海量的訓練數據(大數據)和復雜的深度神經網絡結構,需要的計算規模非常龐大,通常需要GPU集群訓練幾天甚至數周的時間,在訓練環節GPU目前暫時扮演著難以輕易替代的角色。
毫無疑問在深度學習的Training階段,GPU成為了目前一項事實的工具標準。由于AMD今年來在通用計算以及生態圈構建方面都長期缺位,導致了在深度學習GPU加速市場NVIDIA一家獨大的局面。根據NVIDIA今年Q2年報顯示,NVIDIA的Q2收入為達到22.3億美元,毛利率更是達到了驚人的58.4%,其中數據中心(主要為面向深度學習的Tesla加速服務器)Q2收入4.16億美元,同比上升達175.5%。
為了保持領先型,NVIDIA一方面在產品研發上,耗費了高達30億美元的研發投入,推出了基于Volta、首款速度超越100TFlops的處理器Tesla,主打工業級超大規模深度網絡加速;另外一方面是加強人工智能軟件堆棧體系的生態培育,即提供易用、完善的GPU深度學習平臺,不斷完善CUDA、cuDNN等套件以及深度學習框架、深度學習類庫來保持NVIDIA體系GPU加速方案的粘性。第三是推出NVIDIA GPU Cloud云計算平臺,除了提供GPU云加速服務外,NVIDIA以NVDocker方式提供全面集成和優化的深度學習框架容器庫,以其便利性進一步吸引中小AI開發者使用其平臺。
國內眾多企業在采用GPU
國內眾多知名安防企業都正在使用NVIDIA的GPU,英偉達已經與國內安防領域頂級企業結成了智能城市伙伴關系,包括海康威視、大華股份,宇視科技,包括天地偉業、科達、北京文安、深網和久凌,這些企業都在使用NVIDIA的GPU人工智能和深度學習產品服務和解決方案,相關安防企業依靠自身研發實力推出了多款基于NVIDIAGPU及相應模塊的產品!
海康威視推出的后端全系列的AI產品,發布基于英偉達GPU和深度學習技術超腦”NVR、“臉譜”人臉分析服務器等多款AI系列產品。其中刀鋒服務器使用了NVIDIA的GPU以及JetsonTX1的平臺,產品功耗可以縮小到原來的十分之一,占用的空間可以縮小到原來的二十分之一。海康威視研究院院長浦世亮表示:“GPU的出色性能,NVIDIA的端到端AI平臺與深度學習平臺可用于視頻流,以此為多個行業創建更加智能的應用。”
大華股份聯合英偉達發布多款“睿智”系列后端智能設備,“睿智”系列搭載的英偉達NVIDIATeslaP4GPUs,最多可支持192路視頻結構化分析,相較于市場上同類別的產品,視頻處理能力將提高50倍以上;同時,TeslaP4GPUs專為深度學習算法推演而生。大華研發中心副總裁張興明表示:“通過與NVIDIA合作,致力于將AI應用到大華的下一代深度學習產品之中。大華先進的高容量視頻分析服務器DeepSense提供了強大且可擴展的海量元數據抽取與結構化數據處理的方法。借助該方法,可以對車輛、非機動車進行快速而準確的分析,并能夠對人員進行識別。”
2016年,宇視科技推出新一代大容量分布式的云結構化智能分析服務器(代號“昆侖”),在4U的高度上支持了80顆NVIDIAJetsonTX1處理器,一臺昆侖可并發處理640張/秒的人臉識別、160路的人員計數、80路人車物的結構化分析,相當于業界常用普通服務器的40倍性能,且芯片和算法基于深度學習,準確性很高。
此外,以云生態為建設重點的華為,通過搭載TeslaP4GPU加速器后,視頻內容管理(VCM)產品整體性能提高了22倍。視頻內容管理支持深度學習主流框架,為精確的人臉識別、行人-車輛結構化以及反向圖像檢索提供了智能算法。通過使用NVIDIATensorRT深度學習推理優化器與DeepStreamSDK,速度得到了顯著提升。華為視頻監控領域總經理劉廷永表示:“華為視頻監控與NVIDIA緊密合作,并配合深圳警察的工作,以實現聯合創新,讓城市在未來變得更加智能。”