回顧2017年,常發(fā)表威脅論的馬斯克也開始造芯片,英特爾發(fā)布Nervana神經(jīng)網(wǎng)絡(luò)處理器和人工智能芯片Loihi,英偉達(dá)推出進(jìn)化版TITAN V 等等,這一年各個(gè)巨頭可謂是在人工智能領(lǐng)域卯足了勁兒,經(jīng)過這年如火如荼的積蓄,2018勢(shì)必將是充滿“硝煙”的一年。
關(guān)于人工智能的硬件,CPU,GPU,TPU(張量處理單元),甚至是FPGA,已經(jīng)很難判斷是誰(shuí)開啟了這場(chǎng)人工智能之戰(zhàn),要說(shuō)誰(shuí)將終結(jié)人工智能時(shí)代更是為時(shí)過早。但是2018年將是芯片制造商之間長(zhǎng)期戰(zhàn)斗的開始,在人工智能領(lǐng)域的硬件之爭(zhēng),怕是一定要決出個(gè)高下了。
當(dāng)英特爾在Automobility LA 2017上宣布發(fā)布最新的人工智能硬件,這并不是對(duì)外發(fā)起挑戰(zhàn)的意思。相反,它只是少數(shù)幾個(gè)主要科技巨頭的一系列最新技術(shù)更新,畢竟大家的目標(biāo)都是在人工智能硬件領(lǐng)域打下堅(jiān)實(shí)的基礎(chǔ)。因?yàn)榫湍壳暗陌l(fā)展?fàn)顩r來(lái)看,人工智能將成為包括制造業(yè)、汽車、物聯(lián)網(wǎng)、醫(yī)療甚至娛樂業(yè)在內(nèi)的眾多行業(yè)中的主導(dǎo)力量之一。
在硬件方面,人工智能被鎖定在自己的“權(quán)力游戲”之中,不同的企業(yè)都在爭(zhēng)奪霸主地位,創(chuàng)造出芯片架構(gòu),特別是在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面以期獲得優(yōu)勢(shì)。
據(jù)Research and Markets和TechNavio的分析師預(yù)測(cè),全球AI芯片市場(chǎng)將在2017年至2021年間以年均54%的速度增長(zhǎng)。
Technavio嵌入式系統(tǒng)研究首席分析師Raghu Raj Singh表示,“對(duì)能夠滿足深度學(xué)習(xí)的高功率硬件的需求是推動(dòng)這一發(fā)展的關(guān)鍵驅(qū)動(dòng)力。硬件的高增長(zhǎng)率是由于對(duì)高計(jì)算能力的硬件平臺(tái)的需求不斷增長(zhǎng),這有助于運(yùn)行深度學(xué)習(xí)的算法。初創(chuàng)企業(yè)和老牌企業(yè)之間日益激烈的競(jìng)爭(zhēng)正在引領(lǐng)新的人工智能產(chǎn)品的發(fā)展,無(wú)論是硬件還是軟件平臺(tái),都在運(yùn)行著深度學(xué)習(xí)和算法。”
競(jìng)爭(zhēng)正在升溫。人工智能將成為計(jì)算硬件的下一個(gè)前沿領(lǐng)域,自從移動(dòng)計(jì)算和互聯(lián)網(wǎng)出現(xiàn)以來(lái),人工智能可能是計(jì)算機(jī)硬件最重要的戰(zhàn)場(chǎng)。
那么,我們是如何到達(dá)這里的,誰(shuí)又是這其中的大玩家呢?
好的CPU
那些不需要人為干預(yù)的自動(dòng)駕駛汽車,可能是有史以來(lái)最聰明、最復(fù)雜的機(jī)器之一。很顯然,自動(dòng)駕駛車輛已經(jīng)成為人工智能的主要目標(biāo)之一,而英特爾正在為這個(gè)目標(biāo)不斷奮斗。
英特爾并不僅僅是在內(nèi)部進(jìn)行研發(fā)工作,而是利用收購(gòu)來(lái)使得在人工智能領(lǐng)域的腳步更穩(wěn)。 2016年8月,英特爾收購(gòu)了神經(jīng)網(wǎng)絡(luò)處理器制造商N(yùn)ervana Systems。
談到神經(jīng)網(wǎng)絡(luò),它能夠非常有效地執(zhí)行各種各樣的任務(wù),但為了完成這些任務(wù),首先必須教導(dǎo)網(wǎng)絡(luò)如何執(zhí)行這些任務(wù)。首先,神經(jīng)網(wǎng)絡(luò)執(zhí)行要識(shí)別出狗的圖片就必須明白狗的特征,并且了解它的所有品種。光從這一點(diǎn)上來(lái)看,就會(huì)十分耗費(fèi)時(shí)間,可能會(huì)需要成千上萬(wàn)甚至數(shù)百萬(wàn)的狗的圖像才能夠完成相應(yīng)的任務(wù)。
在2016年11月,在收購(gòu)Nervana幾個(gè)月后,英特爾宣布推出一系列處理器 - Nervana平臺(tái),直接針對(duì)人工智能相關(guān)的應(yīng)用,例如訓(xùn)練神經(jīng)網(wǎng)絡(luò)。英特爾數(shù)據(jù)中心事業(yè)部執(zhí)行副總裁兼總經(jīng)理Diane Bryant表示,“我們期望英特爾Nervana平臺(tái)能夠產(chǎn)生突破性的性能,并大大縮短訓(xùn)練復(fù)雜神經(jīng)網(wǎng)絡(luò)的時(shí)間。在這個(gè)十年結(jié)束之前,英特爾將提供100倍的性能提升,這將在新興的深度學(xué)習(xí)領(lǐng)域大大加速創(chuàng)新的步伐。”
今年3月,英特爾又在Mobileye公司進(jìn)行了另一項(xiàng)引人注目的人工智能收購(gòu),這是一款基于機(jī)器學(xué)習(xí)的高級(jí)駕駛員輔助系統(tǒng)(ADAS)的開發(fā),其價(jià)值約為150億美元。英特爾收購(gòu)的意義馬上就顯現(xiàn)了出來(lái)。這家芯片制造商希望在自動(dòng)駕駛車輛領(lǐng)域占有一席之地,也許這樣做也將自己定位為一個(gè)關(guān)鍵的機(jī)器學(xué)習(xí)硬件提供商。
在去年11月舉行的洛杉磯Automobility LA貿(mào)易展覽會(huì)上,英特爾首席執(zhí)行官Brian Krzanich稱自動(dòng)駕駛是現(xiàn)今最大的游戲改變者,因?yàn)樵摴拘际召?gòu)Mobileye公司后已經(jīng)生產(chǎn)了一款新的SoC、EyeQ5。
Tera每秒運(yùn)算(TOPS)是用于高性能SoC的通用性能指標(biāo)。每瓦TOPS可以擴(kuò)展該測(cè)量來(lái)描述性能效率。每瓦TOPS越高,芯片的效率越高。深度學(xué)習(xí)TOPS(DL)是指進(jìn)行深度學(xué)習(xí)相關(guān)的操作的效率。根據(jù)英特爾的基于模擬的測(cè)試,EyeQ5預(yù)計(jì)將提供每瓦2.4 DL TOPS,是Nvidia的Xavier效率的兩倍多,它的效率大約是每瓦執(zhí)行1 DL TOPS。
英特爾自動(dòng)駕駛集團(tuán)(ADG)高級(jí)副總裁兼總經(jīng)理Doug Davis在接受《設(shè)計(jì)新聞》時(shí)表示,“英特爾選擇將重點(diǎn)放在每瓦特的DL型電腦上,因?yàn)樗M阎攸c(diǎn)放在處理器效率上,而不是其他指標(biāo)。關(guān)注DL每瓦功耗是電源消耗的一個(gè)很好的指標(biāo),但是如果你考慮這個(gè)問題,它也會(huì)影響重量、成本和散熱的問題,所以我們真的覺得效率是關(guān)注的重點(diǎn)。”
Davis補(bǔ)充表示,“總是圍繞絕對(duì)性能進(jìn)行大量的討論,但是當(dāng)我們考慮這個(gè)問題時(shí),應(yīng)該從更實(shí)際的角度出發(fā),因?yàn)槲覀兛紤]了不同類型的工作量。深度學(xué)習(xí)是能夠識(shí)別對(duì)象并做出決策,并盡可能快速有效地完成這一任務(wù)的關(guān)鍵。“
然而,英偉達(dá)公司已經(jīng)對(duì)英特爾的數(shù)據(jù)提出了異議,尤其是考慮到EyeQ5的估計(jì)是基于模擬的,SoC將在兩年內(nèi)不可用。 今天所知道的是我們宣布的Xavier將于2018年初開始提供,相比于EyeQ5純粹的24 TOPS兩年后的模擬預(yù)測(cè),30 TOPS的性能更高。
GPU是否注定要AI?
GPU制造商已經(jīng)發(fā)現(xiàn)自己掌握著可能處于人工智能革命最前沿的技術(shù)。GPU曾被認(rèn)為是CPU的補(bǔ)充單元(許多CPU將GPU集成到GPU中以處理圖形處理),GPU已經(jīng)擴(kuò)展到以圖形和視頻為中心的領(lǐng)域之外,并進(jìn)入深度學(xué)習(xí)領(lǐng)域,GPU制造商表示他們提供的性能遠(yuǎn)優(yōu)于CPU。
▲Titan V GPU
雖然GPU市場(chǎng)上有少數(shù)幾家公司,但似乎Nvidia更像這個(gè)技術(shù)的代名詞。根據(jù)Jon Peddie研究公司的報(bào)告,Nvidia在2017年第三季度的GPU出貨量上升了29.53%,主要競(jìng)爭(zhēng)對(duì)手AMD和Intel都出局。AMD的出貨量增加了7.63%,而Intel的出貨量增加了5.01%。當(dāng)然,這主要是由視頻游戲市場(chǎng)推動(dòng)的,但Jon Peddie Research的分析師認(rèn)為,與加密貨幣挖掘有關(guān)的應(yīng)用程序和對(duì)高端性能的需求也對(duì)出貨量有所貢獻(xiàn)。
對(duì)于能夠處理需要高性能的特定任務(wù)的處理器(如加密貨幣挖掘和AI應(yīng)用程序)的需求正是GPU發(fā)現(xiàn)自己處于AI硬件對(duì)話最前沿的原因。 GPU包含數(shù)百個(gè)可同時(shí)執(zhí)行數(shù)千個(gè)軟件線程的內(nèi)核,同時(shí)比CPU更節(jié)能。盡管CPU是普遍化的并且傾向于跳躍,執(zhí)行許多不同的任務(wù),但是GPU擅長(zhǎng)在大批量數(shù)據(jù)上一次又一次地執(zhí)行相同的操作。
就在今年十二月份,Nvidia宣布推出了一款基于PC的GPU Titan V,專為深度學(xué)習(xí)而設(shè)計(jì)。新的GPU基于Nvidia的Volta架構(gòu),該架構(gòu)利用了Nvidia稱之為Tensor Cores的新型核心技術(shù)。Nvidia所做的是開發(fā)具有復(fù)雜架構(gòu),專門用于處理深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)計(jì)算的需求。
Titan V包含210億個(gè)晶體管,能夠提供110 teraflops的深度學(xué)習(xí)性能。 Nvidia將目標(biāo)瞄準(zhǔn)從事人工智能和深度學(xué)習(xí)的開發(fā)人員。Titan V.公司創(chuàng)始人兼首席執(zhí)行官Jensen Huang在一次新聞發(fā)布會(huì)上表示,“Titan V是有史以來(lái)為個(gè)人電腦開發(fā)的最強(qiáng)大的GPU。我們對(duì)Volta的愿景是推動(dòng)高性能計(jì)算和人工智能的外部極限。我們開發(fā)了新的處理器架構(gòu)、指令、數(shù)字格式、內(nèi)存架構(gòu)和處理器鏈接。隨著泰坦V的出現(xiàn),我們把Volta推向世界各地的研究人員和科學(xué)家手中。”
一個(gè)由張量構(gòu)成的世界
提到張量的概念,那就不得不提谷歌公司了。在過去的一年,這個(gè)搜索巨頭發(fā)布了一個(gè)名為TensorFlow的深度學(xué)習(xí)開發(fā)的已經(jīng)流行的開源框架。如Google所述,“TensorFlow是一個(gè)使用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算的開源軟件庫(kù)。圖中的節(jié)點(diǎn)表示數(shù)學(xué)運(yùn)算,而圖邊表示在它們之間通信的多維數(shù)據(jù)陣列(張量)。靈活的體系結(jié)構(gòu)允許您使用單個(gè)API將計(jì)算部署到桌面、服務(wù)器或移動(dòng)設(shè)備中的一個(gè)或多個(gè)CPU或GPU上。”
▲Google的張量處理單元(TPU)
TensorFlow的機(jī)器學(xué)習(xí)應(yīng)用程序庫(kù)包括面部識(shí)別、計(jì)算機(jī)視覺,當(dāng)然還有其他應(yīng)用程序中的搜索,在2016年的時(shí)候就已經(jīng)被證明非常流行,以至于2016年英特爾一直致力于優(yōu)化其處理器來(lái)運(yùn)行TensorFlow。在2017年,谷歌還發(fā)布了針對(duì)移動(dòng)和Android開發(fā)者的精簡(jiǎn)版TensorFlow。
但Google沒有讓軟件成為人工智能野心的終點(diǎn)。在2016年,該公司發(fā)布了第一代稱為張量處理單元(TPU)的新處理器。 Google的TPU是一個(gè)專為機(jī)器學(xué)習(xí)而設(shè)計(jì)的ASIC,專為運(yùn)行TensorFlow而量身定制。而第二代TPU在今年五月份宣布,據(jù)Google稱,它能夠提供高達(dá)180 teraflops的性能。
作為加拿大多倫多第44屆計(jì)算機(jī)體系結(jié)構(gòu)國(guó)際研討會(huì)(ISCA)的一部分,Google于2017年6月發(fā)布了一項(xiàng)研究報(bào)告,將其在數(shù)據(jù)中心部署的TPU與Intel Haswell CPU和部署在同一數(shù)據(jù)中心的Nvidia K80 GPU進(jìn)行了比較, TPU平均比GPU和CPU執(zhí)行速度快15到30倍。每瓦TPU的TOPS也高出約30到80倍。 Google表示,TPU正在推動(dòng)其所有在線服務(wù),如搜索、街景、Google相冊(cè)和Google翻譯。
在一份詳細(xì)介紹最新熱塑性聚氨酯(TPU)的文章中,Google的工程師們表示,早在六年前,當(dāng)Google發(fā)現(xiàn)自己將深度學(xué)習(xí)融入越來(lái)越多的產(chǎn)品時(shí),熱塑性聚氨酯的需求就出現(xiàn)了。Google工程師認(rèn)為,“如果我們假設(shè)人們每天只使用Google語(yǔ)音搜索三分鐘,并且在我們正在使用的處理單元上運(yùn)行深度神經(jīng)網(wǎng)絡(luò)來(lái)處理語(yǔ)音識(shí)別系統(tǒng),那么我們必須加倍的增加Google的數(shù)據(jù)中心!”
Google的工程師在設(shè)計(jì)TPU時(shí)表示,他們采用了他們所說(shuō)的“收縮性設(shè)計(jì)”。“這種設(shè)計(jì)被稱為收縮性的,因?yàn)閿?shù)據(jù)通過芯片流動(dòng),這讓人想起心臟泵血的方式。矩陣乘法單元MXU中的特殊類型的脈動(dòng)陣列針對(duì)執(zhí)行矩陣乘法時(shí)的功率和面積效率進(jìn)行了優(yōu)化,不適合于通用計(jì)算,于是它做了一個(gè)工程折衷:限制寄存器、控制和操作的靈活性,以換取效率和更高的操作密度。”
在一些非常高端的AI應(yīng)用中,TPU也已經(jīng)證明了自己。 TPU是Google著名的AlphaGo AI背后的大腦,在去年擊敗了世界冠軍,引起人們對(duì)于人工智能的關(guān)注。經(jīng)過短短幾個(gè)月的訓(xùn)練,AlphaGo的最新版本AlphaGo Zero就能夠?qū)⒆约旱哪芰h(yuǎn)遠(yuǎn)超過人類專家。對(duì)于國(guó)際象棋(一個(gè)復(fù)雜的游戲,但是比Go要小得多),在幾個(gè)小時(shí)內(nèi)的訓(xùn)練之后也能達(dá)到比較顯著的效果。
FPGA - AI競(jìng)賽中的黑馬
那么,TPU是AI的未來(lái),對(duì)嗎?微軟認(rèn)為,在可擴(kuò)展性和靈活性方面,基于FPGA的解決方案可能將優(yōu)于CPU、GPU或TPU提供的解決方案。
▲微軟的Project Brainwave以39.5萬(wàn)億次浮點(diǎn)運(yùn)算的速度運(yùn)行,在英特爾層的10個(gè)fpga上運(yùn)行時(shí),它的延遲時(shí)間還不到一毫秒
盡管基于處理器的解決方案在某種程度上由于其設(shè)計(jì)而局限于特定的任務(wù),但是由于FPGA的靈活性和可編程性,所以或許可以使用FPGA來(lái)提供更容易的升級(jí)和更好的性能。根據(jù)微軟的說(shuō)法,在Intel Stratix 10 FPGA上運(yùn)行時(shí),微軟的Project Brainwave以39.5 teraflops的速度執(zhí)行,延時(shí)不到1毫秒。
FPGA是否為人工智能提供最佳選擇與其他方面一樣值得商榷。微軟認(rèn)為創(chuàng)造人工智能專用ASIC的生產(chǎn)成本太高,而另一些人則認(rèn)為FPGA將永遠(yuǎn)無(wú)法完全實(shí)現(xiàn)專為人工智能設(shè)計(jì)的芯片性能。
在3月份的“現(xiàn)場(chǎng)可編程門陣列國(guó)際研討會(huì)”(ISFPGA)上發(fā)表的一篇文章中,一組來(lái)自英特爾加速器架構(gòu)實(shí)驗(yàn)室的研究人員評(píng)估了兩代英特爾FPGA(Arria10和Stratix 10)與Nvidia Titan X Pascal Titan V)處理深度神經(jīng)網(wǎng)絡(luò)(DNN)算法。據(jù)英特爾研究人員稱:“我們的研究結(jié)果顯示,Stratix 10 FPGA的性能(TOP / sec)比Titan X Pascal圖形處理器在[矩陣乘法](GEMM)操作上的性能提高了10%、50%甚至5.4倍。在Ternary-ResNet上,Stratix 10 FPGA可以比Titan X Pascal GPU提供60%的性能提升,性能功耗比提高2.3倍。我們的結(jié)果表明,F(xiàn)PGA可能成為加速下一代DNN的首選平臺(tái)。”
誰(shuí)將戴上皇冠?
在這個(gè)特定的時(shí)間點(diǎn),就整體性能而言,很難不爭(zhēng)論這些硬件在人工智能領(lǐng)域的表現(xiàn),也很難不比較巨頭們之間的表現(xiàn)。但是,就小編的粗淺認(rèn)識(shí)來(lái)看,很多硬件并不是單純的誰(shuí)取代誰(shuí)的角色,可能面對(duì)不同的用戶、不同的細(xì)分領(lǐng)域就會(huì)有不同的選擇,
就落地的應(yīng)用來(lái)說(shuō),自動(dòng)駕駛汽車正在成為將人工智能應(yīng)用于更廣泛的公眾意識(shí)中,這可能是機(jī)器人、制造業(yè)、甚至娛樂領(lǐng)域的進(jìn)步,真正推動(dòng)人工智能的發(fā)展,但這并不是為了阻斷新興應(yīng)用的誕生之路。
當(dāng)發(fā)展步入正軌時(shí),它可能不是一家企業(yè)主宰人工智能領(lǐng)域,未來(lái)可能會(huì)看到硬件領(lǐng)域的爭(zhēng)斗越來(lái)越激烈,也或許是別的,時(shí)間會(huì)證明一切。