英偉達的gpu已經占據了大量深度學習神經網絡解決方案的市場,比如圖像識別技術——這是人工智能在過去5年里取得的最大突破之一。但英特爾一直試圖通過收購諸如神經緊張、Mobileye和Movidius等公司來定位自己。而當英特爾在2016年以3.5億美元收購了神經系統公司時,該公司的首席執行官Naveen Rao也獲得了該公司的支持。
Naveen Rao擁有計算機架構師和神經學家的背景,他現在是英特爾人工智能產品集團的副總裁兼總經理。他在本周的一次活動上發表了講話。英特爾宣布,其Xeon處理器在2017年創造了10億美元的收入,用于人工智能應用。Rao認為,到2022年,人工智能芯片的總市場將達到80-100億美元。
為了實現這一目標,英特爾可能不得不從頭開始打造人工智能芯片,并擊敗英偉達和其他創業公司。本周,我在加州圣克拉拉的英特爾以數據為中心的創新峰會上與拉奧討論了競爭。
有一些有趣的數字。Xeon的價值數十億美元與1300億美元相比,這很有趣。這是一個開始。
Naveen Rao:在創業世界里,這是一個巨大的市場。突然間,你就成了一家價值200億美元的公司。這是市場的開始。人工智能才剛剛開始。現在是第二局的第一名。我們還有很長的路要走。
VentureBeat:你的策略似乎是在掩蓋這樣一種觀點,即人工智能芯片需要被設計成人工智能芯片,而不是cpu或gpu。
Naveen Rao:我會給你一個來自我們競爭對手的好例子。他們幾乎做到了這一點。他們把他們的GPU,釘在一個張量核上,這完全是人工智能的東西。你可以這樣想,他們的生態系統是GPU,所以他們把另一件事放在了模具上。與我們所做的相反,我們的生態系統是整個計算機。這是CPU。我們將這些能力建立在這種加速器中。這對他們的策略有好處,但并沒有利用GPU。為了解決這個問題,它幾乎是在從頭開始建造一些東西。
我認為,這方面已經有了證據。但也就是說,我們在進化CPU。這是一個進化的弧線,因為它支持許多不同的應用。它支持我們在CPU數據中心中所喜愛的規模。我們想要小心我們怎么做。我們必須確保我們能夠在所有重要的工作負載上保持領導地位,然后添加對未來工作負載很重要的新功能。我們理解未來工作負荷的方式是建立加速器,這實際上是矛的尖端,弄清楚哪些能力是有意義的回到宿主的。
VentureBeat:英偉達會不會回來說,“你們只是在做一些事情來做更好的圖像識別”,你是否仍然覺得我們正在為現有的東西添加額外的東西?在那之后會發生什么?
Naveen Rao:接下來要做的是了解如何在計算中有效地將數據移動到AI的工作負載中。這就是波峰線一直以來的樣子。我們如何有效地做到這一點并達到最大的性能?你可以在今天的GPU上看到它。利用率非常低,因為他們沒有采用整體的方法。
再一次,這對他們來說是一個很好的策略,因為他們把他們的平臺發揮到了極致。這是正確的做法。同樣地,我們已經看到了——推斷是在數據中心中擴展循環次數的非常快的路徑。考慮到Xeon在數據中心中的位置,我們很自然地添加了這些功能。工作負載組合隨著時間的推移而變化。這在五年前是不存在的。就像我們說的,現在是10億美元。在更大的數據中心市場的背景下,這個市場規模約為2000億美元,這是微不足道的。但它的擴張速度非常快。
VentureBeat:在情況如此緊張的情況下,你會得到更多的人工智能設計嗎?
Naveen Rao:沒錯。
VentureBeat:當你這樣做的時候,與向CPU添加東西相比,有什么完全不同的呢?
Naveen Rao:你管理數據的方式通常不會自動管理緩存。這是一個方面。對特定數據類型的承諾,不需要支持100種不同的工作負載。你支持那些對AI很重要的人。您可以更精確地了解您的數據類型。這影響了你連接所有東西的電線。您可以優化芯片上的互連,甚至基于此,這會給您帶來性能提升。
分配工作負載的能力,是不需要是通用的。你不會做很多不同種類的并行分布式計算。你要做一組特定的集合。您可以為這些集合構建構念。它可以讓你在你的技術中更有針對性,并能得到一些工作。如果你試著從一開始就把海洋煮沸,你就永遠不會這么做。
VentureBeat:對于推理和訓練,是否會有不同的解決方案,更專業化?
Naveen Rao我想我們會看到,你可以稱它們為專門的解決方案,但實際上它們是按不同的方向調整的。我們已經看到的是,TCO,每瓦特的性能,對于推理來說是極其重要的。你做了大規模的工作。它與你的應用程序綁定在一起。綁定到堆棧和非常好的TCO是很重要的。
對于培訓來說,TCO不那么重要。人們對事情沒有被完全占據的情況是可以接受的,因為當工程師打電話并想要完成一份培訓工作時,他們希望盡快完成。最大的性能更大。從技術的角度來看,你可以從技術的角度來看待這個問題,好吧,我的訓練解決方案的力量在哪里?內存接口是it的重要組成部分,并計算。
在我的推理解決方案中,我不需要內存。它不是內存密集型的。我可以把它關掉。我使用不同的記憶技術。如果你正在構建一個橫向擴展推理技術,你就不會使用HBM。太耗電了。它有更好的性能,但是你不需要它,所以讓我們使用低功率的東西,每瓦性能更好。您的緩存可能不同。在芯片上實際使用的東西是不同的。
再一次,你調整了所有這些參數。它們的工作原理類似于一個產品系列,但它們實際上是不同的旋鈕,它們扭曲了不同的方法來優化特定的任務。
VentureBeat:對于自動駕駛汽車來說,你有多種不同的解決方案,無論是在汽車里還是在云端,都能與汽車交流。我和Vinod Dham談過他的新創業公司AlphaICs。他說,強大的人工智能和基于代理的人工智能可能更有必要解決自動駕駛問題。這是多么嚴肅的事情,成為每個人都要去的方向?
Naveen Rao:讓我給你更多的上下文答案。如果我們觀察一個大腦,我們觀察它的部分,就有能力處理視覺環境,來分割它。這些都是植物。這是人行道。這是一個光。這是一個方面。這就是我們今天要做的。我們所稱的人工智能是在處理復雜的數據,并將其簡化為具有潛在可操作性的東西。當我制造一輛自動駕駛汽車時,我將在道路所在的地方,行人所在的地方,并將其輸入到一些更聲明性的編碼中。“如果孩子在我面前,踩剎車。”
人工智能的下一個層次是不斷學習和依附于環境。作為一個神經學家,這是我研究過的。如果我想要完成一個動作,拿起我的手,把它移動到這個空間的這個點,我必須弄清楚需要發送什么樣的運動指令,并準確地預測出什么是感官的結果。當它達到那個位置時,我的眼睛會是什么樣子,感覺就像我手臂上的傳感器?如果出現不匹配,就會發生錯誤。如何修復這種不匹配?我從我的錯誤中吸取了教訓。
它是一個不斷進化的行動循環,環境,后果,和學習。這就是我們想要達到的目標。我相信,要想讓機器人在世界上獲得完全的自主權,這是一輛自動駕駛汽車,我們可能確實需要解決其中的一些問題。我們還沒到那一步。