2016年是人工智能爆發的一年,隨著深度學習理論的快速發展,各種深度學習的應用層出不窮,從人臉識別,圖片風格轉換到自動駕駛,不一而足。在這些人工智能應用的背后,則是以GPU為代表的人工智能硬件。
借著人工智能的風頭,Nvidia的股價在去年飛升三倍有余,令人驚嘆。幾天前,2017年CES更是請Nvidia的黃仁勛作為開幕前夜最重頭的專場演講的嘉賓。毫無疑問Nvidia已經成為了本屆CES的焦點。下面我們將為大家分享這場專場演講的內容并分析Nvidia展露的未來計劃。
關鍵詞:Imagination
本次Nvidia老黃給我們帶來的CES演講中,關鍵詞是“Imagination”(想象)。通過Imagination這個關鍵詞,Nvidia很好地涵蓋了自己從游戲渲染加速到人工智能的業務群。
在開場動畫中,老黃首先播放了一系列3D游戲的畫面(包括泰坦隕落2,獵魔人等3A大作),也回顧了Gravity等特效電影。之后畫風一轉,激發人類想象力的從傳統的3D游戲和電影特效轉到了讓人身臨其境的AR和VR設備。在這之后,則開始展示給人巨大想象力空間的人工智能應用,包括機器人,自動駕駛,以及人工智能輔助醫療等等。而在這一切激發人們想象力的應用背后,都站著一個硬件巨頭,Nvidia。這段動畫也很好地回顧了Nvidia業務的歷史軌跡:始于GPU圖像渲染加速,從一個半導體芯片公司慢慢走向未來AR/VR以及人工智能平臺的提供者。
GeForce Now與Shield:游戲云平臺與家庭物聯網新中心
在回顧了過去在計算機圖像、游戲和人工智能領域的一系列成就后,老黃開始發布第一項內容:GeForce Now。
Nvidia的輝煌始于游戲領域的快速發展。在二十年前,PC和主機游戲還是以低分辨率的2D為主,3D游戲要么是假3D(如《暗殺希特勒》),而真3D游戲的圖像非常粗糙,多邊形數量很少,勞拉小姐的臉就是一個錐子。Nvidia正是在當年看好電子游戲會成為人們未來的主流娛樂方式并開始開發顯示加速卡,從而一舉推出GPU的概念并且在游戲市場上賺得盆滿缽滿。在GPU獲得成功后,Nvidia進一步推出了自己的游戲主機Shield。而到如今,Nvidia已經不滿足于游戲硬件提供商的角色,而是在試圖定義一種嶄新的游戲平臺并且成為該游戲平臺的主人。GeForce Now就是這樣的一種平臺。
GeForce Now的邏輯是:目前尚有數量巨大的電腦用戶因為自己的電腦硬件不夠強因此玩不到游戲。為了讓這部分人也玩上3A大作,GeForce Now把游戲運行在處理能力極其強大的云服務器上,而把游戲的圖像和聲音通過網絡傳到玩家的電腦上。因此只要玩家的電腦能上網,無論其硬件多弱都可以玩到最新的游戲。通過GeForce Now,Nvidia的野心是利用其在游戲市場的影響力,從硬件供應商轉型為游戲云服務提供商,這樣就一下從第二產業(制造業)轉身進入了第三產業(服務業),豈不美哉?
那么人們不禁要問:如果GeForce Now特別成功,那么大多數為了玩游戲而買的高性能PC就沒用了,甚至連游戲主機都有下崗的危險,如此一來Nvidia自己的Shield主機又該怎么辦?別急,Nvidia早就為自家主機想好了出路,就是家庭物聯網的新中心。
老黃在CES發布的第二項內容是新Shield。新Shield除了擁有常規的游戲和互聯網視頻播放功能外,最大的亮點是引入了Google助手。Google助手可以通過語音識別完成用戶下的各種指令,如在CES演講的演示視頻中,就出現了用戶通過與Google助手語音交談從而讓Shield播放視頻,展示照片等。然而,Nvidia對Shield的野心遠不止“支持語音交互的智能機頂盒”,而是智能家庭中心。為了讓Shield能接收用戶從家里任何地方發出的語音指令,老黃在發布新Shield的同時還展示了與新Shield搭配使用的NvidiaSpot。NvidiaSpot是經過特別設計的麥克風,可以放置在家里的任何地方,并且通過局域網與Shield連接起來,把用戶的語音指令傳輸到Shield。同時,在Nvidia的計劃中,Shield可以控制的也遠遠不止電視機,而是可以控制各種智能家電(如Nest的產品)。這樣,在Nvidia提供的智能家庭方案中,Nvidia Spot作為用戶指令的接收者遍布家的每一個角落,用戶在任何地方下的語音指令通過Spot傳回物聯網中心節點Shield,而Shield則根據指令來控制家庭的智能家電,如打開空調,啟動掃地機等等。
GeForceNow以及新Shield都顯示了Nvidia試圖將舊有的游戲硬件業務升級轉型的嘗試。我對于GeForceNow的評價是,要是沒法解決網絡延遲的問題根本就沒戲。目前最流行的游戲是動作游戲(槍),模擬駕駛游戲(車)以及各種體育游戲(球),而槍車球對于輸入延遲的要求非常高,一旦玩家的輸入(如在駕駛游戲里轉動方向盤)距離游戲響應(游戲里的車真正改變方向)有上百毫秒的延遲,玩家的體驗就會變得很糟糕。問題是,目前決定網絡延遲的不僅僅是玩家的接入網絡帶寬,而是從玩家接入點到GeForce服務器中心間的任何地方網絡變慢都會成為短板增大延遲從而極大地影響玩家體驗。另外,是否有那么多人是因為缺乏硬件而不玩游戲也是個問題——很可能大部分人就是對游戲沒興趣,即使給他們足夠運行游戲的硬件也寧愿去做其他事情而不是玩游戲。所以,GeForceNow看上去很美,實際上卻還有許多路要走。
對于Shield+Spot的家庭物聯網中心戰略,在Nvidia之前其實也有不少類似的試圖將游戲機升格為家庭客廳娛樂中心的嘗試,然而都失敗了。典型的就是Sony的PSX,當年Sony借著在游戲主機(PS2),視頻播放機(DVD)和電視機領域的龍頭地位,試圖將PSX打造成能玩PS2游戲,能播放/錄制DVD又能播放/錄制錄像的客廳娛樂中心,然而慘遭失敗。類似微軟也試圖將XBOXOne打造成既能看互聯網視頻又能玩游戲的客廳娛樂中心,然而并沒有取得成功,反而在與PS4的鏖戰中漸漸處于下風。直到PhilSpencer上臺執掌Xbox后,才重新將XboxOne定義為游戲機,并解散了專門為Xbox制作電視內容的娛樂部門,將重心移回游戲后才逐漸找到方向。所以Nvidia和Google合作的Shield+Spot家庭物聯網中心戰略能否成功還需要時間去驗證,尤其在連物聯網智能家電尚未普及的今天,Nvidia就已經發布了家庭物聯網中心,只能說是在為未來布局而不可能在短期內就帶動Shield的銷量。未來如果Shield真能成為新的家庭物聯網中心,GooDia(Google + Nvidia)將成為WinTel(微軟Windows + Intel)之后又一對軟硬件巨頭聯盟。
Xavier:1TOPS/W成為深度學習硬件平臺新標桿
如果說GeForce Now和Shield+Spot只是老黃此次CES主題演講的開胃前菜,那么在這之后發布的Xavier就是重頭戲了。
Xavier是Nvidia預期在2017年正式發售的車載超級計算機模組。Xavier包含了擁有512 CUDA核的Volta GPU,8核心的Nvidia定制ARM64 CPU。最令業界震驚的,可謂是其性能:在峰值性能達到30TOPS的情況下,僅僅消耗30W!也就是說,其能量效率達到了1TOPS/W。相形之下,2017年發布在半導體領域最頂級會議ISSCC Deep Learning Processor Session的第一篇paper,ST最頂尖的深度學習專用ASIC也僅僅實現了2.9TOPS/W。
需要記住的是,ST的深度學習加速器是專為深度學習開發,一般而言只能做深度學習計算;而Xavier是一款通用的計算平臺,1TOPS/W的性能除了可以計算深度學習外還可以做其他計算,因此通用性遠好于ASIC。通常專用的ASIC的能量效率應當比通用計算平臺好一個數量級左右,而現在這個差距被縮小到了3倍不到,可見Xavier性能之強大。在性能相差不大的情況下,大多數人都會選擇通用計算平臺而非ASIC,因此相信從事深度學習加速器ASIC研發的工程師們看到Xavier這個指標真的是壓力很大。
另一個有趣的細節是,Xavier的性能并沒有用常規GPU的FLOPS(每秒浮點運算量)做單位,而是OPS(每秒定點數運算量)。在往常的GPU中,深度學習計算通常用浮點數運算來完成,這樣的做法在保證計算精度的同時卻損失了計算速度,因此深度學習硬件的一個很熱門的方向就是如何用定點數運算來代替浮點數運算,在保證計算精度損失可控的情況下大幅提升速度。Nvidia在PascalGPU上已經做了一些對于定點數計算的支持,而根據CES的主題演講透露出的蛛絲馬跡,下一代VoltaGPU上想必會加強對定點數運算的支持。而Nvidia作為深度學習硬件領域的絕對統治者,其對于定點數運算的大力支持又會倒逼深度學習算法開發者加強對于使用定點數的深度學習框架的開發。在可預計的將來,使用定點數的深度學習網絡將會變得越來越流行。
▲在不同平臺上上使用浮點數與定點數計算效率的對比
ADAS系統成為Nvidia人工智能戰略重點
人工智能是Nvidia未來發展的重中之重。人工智能未來市場有多大已經不必多說,而在這次CES主題演講中老黃選擇了ADAS(高級駕駛員輔助系統)作為Nvidia人工智能平臺的切入點。
在自動駕駛方面,Nvidia發布了搭載Xavier的BB2無人駕駛車,BB2目前能實現根據路況自動變道,減速轉彎,避讓行人等等。Nvidia與奧迪合作,預期在2020年實現第四級無人駕駛(即僅僅在極少情況下需要人工干預的自動駕駛系統)。
▲Nvidia無人駕駛系統演示
除了無人駕駛之外,Nvidia還發布了協同駕駛(co-pilot)系統,該系統在無人駕駛技術尚未成熟前可以輔助駕駛員從而讓開車變得更輕松又安全。
協同駕駛技術共包含四大要點,包括面部識別,頭部追蹤,視線追蹤以及讀唇技術。面部識別首先可以通過深度學習判斷駕駛員的表情從而進一步判斷駕駛員的情緒狀況,在發現情緒不穩時提醒駕駛員即使休息調整情緒以避免發生沖動駕駛。頭部追蹤和視線追蹤可以幫助協同駕駛系統判斷駕駛員注意力是否集中,并在駕駛員分神時及時提醒。讀唇技術則可以在環境較吵鬧的情況下根據駕駛員嘴唇的動作判斷其發出的語音指令并予以執行。根據老黃的解釋,Nvidia正在和英國牛津大學LipNet團隊合作研發用于讀唇的深度學習網絡模型,目前該模型已經能達到93.4%的正確率,可望很快就能用在真正的汽車中。最后,協同駕駛系統還能為駕駛行為打分,在督促駕駛員安全駕駛的同時也能夠成為保險公司制定保費的依據。
在人工智能領域,Nvidia的人工智能平臺已經占有統治地位。除了硬件之外,Nvidia目前的CUDA是人工智能硬件加速的主流編程語言,而結合CUDA的CuDNN也因為其高性能成為極受歡迎的深度學習框架。那么,人工智能有這么多方向,為什么Nvidia會選擇ADAS作為戰略重點呢?首先,從市場上說,汽車運輸市場確實是一個巨大的市場。黃仁勛提到,目前的運輸市場規模可達一萬億美元,全球共有十億量跑在路上的汽車,而汽車運輸市場又是一個損耗嚴重的市場,主因就是人類駕駛員容易犯錯。一旦駕駛員犯錯,車禍帶來的損失非常大。如果用人工智能幫助駕駛,那么這些損耗可以被大大降低。
除此之外,另一個重要的事實是,Nvidia的人工智能平臺(尤其是硬件)最適合的應用場景就是ADAS。Nvidia的人工智能平臺最具優勢的應用場合就是數據量中等、計算能力要求高、對功耗有一定要求但是并不苛刻的地方。在數據量巨大的數據中心,Nvidia的GPU是服務器不可或缺的一部分,但是Nvidia自己目前還沒有打算自己做服務器,因此在大數據人工智能市場Nvidia提供的是硬件而非平臺。在另一個極端,即數據量不大,對運算能力要求不高但是對功耗有極大限制的嵌入式深度學習領域,Nvidia基于GPU的人工智能平臺一方面功耗太大,另一方面過高的計算能力反而導致成本過高,因此無法與ASIC抗衡。而在ADAS市場,Nvidia的人工智能平臺無論計算能力(10-100TOPS)還是功耗(10-100W)都能完美地符合要求,因此Nvidia主打自動駕駛市場并不奇怪。
結語
Nvidia在CES的主題演講中顯示了它從芯片公司全面轉型成為云服務、物聯網以及人工智能平臺提供商的野心。在2016年成功抓住人工智能風口市值翻了3倍之后,讓我們拭目以待Nvidia在2017年的表現。