英特爾正在發力人工智能技術,試圖在這一領域挑戰領先者英偉達。近期收購的Nervana Systems將是英特爾開拓人工智能市場的先鋒。
英特爾已公布了關于人工智能的計劃,但至少有一塊關鍵拼圖尚未完成。
英特爾此前收購了Nervana Systems,并宣布將繼續銷售該公司的所有產品。這些產品面向高端應用,尤其是神經網絡的訓練。這一領域目前的領先者是英偉達。與此同時,英特爾收購Movidius的交易尚未完成,因此在計算機視覺和邊緣網絡方面還有很大的缺失需要填補。此外,英特爾還公布了多個人工智能軟件產品、服務和合作項目。
在近期舉行的英特爾人工智能活動上,Movidius CEO曾短暫露面。他沒有透露,這筆交易將于何時完成以及障礙是什么。他表示:“我們期待加入英特爾大家庭。”他介紹了應用至汽車、無人機、安防攝像頭和其他產品的低功耗芯片的計劃。
即使這筆交易完成,英特爾也無法提供完整的人工智能產品。不過,毫無疑問這是英特爾的目標所在。
英特爾CEO科再奇(Brian Krzanich)在此次活動的主題演講上表示:“人工智能將變革我們目前所知的大部分行業,因此我們希望成為人工智能領域可信賴的領導者和開發者。”
Nervana CEO及聯合創始人奈文·拉奧(Naveen Rao)是此次活動上的明星。英特爾已經為Nervana的全系列產品大開綠燈,其中涉及處理器、板卡、系統、軟件和人工智能云計算服務。
Nervana的加速處理器Lake Crest將于明年推出。據稱在同樣的能耗水平上,相對于目前的頂級圖形處理器,這款產品在運行神經網絡任務時將會有更好的性能。這款芯片將使用臺積電的28納米工藝制造。
拉奧首次展示了這款芯片從頭開始設計的架構。這款芯片可以加速各類神經網絡,例如谷歌TensorFlow框架。芯片由所謂的“處理集群”陣列構成,處理被稱作“活動點”的簡化數學運算。相對于浮點運算,這種方法所需的數據量更少,因此帶來了10倍的性能提升。
Lake Crest利用私有的數據連接創造了規模更大、速度更快的集群,其拓撲結構為圓環形或其他形式。這幫助用戶創造更大、更多元化的神經網絡模型。這一數據連接中包含12個100Gbps的雙向連接,其物理層基于28G的串并轉換。
這一2.5D芯片搭載了32GB的HBM2內存,內存帶寬為8Tbps。芯片中沒有緩存,完全通過軟件去管理片上存儲。
英特爾并未透露這款產品的未來路線圖,僅僅表示計劃發布一個名為Knights Crest的版本。該版本將集成未來的至強處理器和Nervana加速處理器。預計這將會支持Nervana的集群。不過英特爾沒有透露,這兩大類型的芯片將如何以及何時實現整合。
拉奧表示,整合的版本將會有更強的性能,同時更易于編程。目前基于圖形處理芯片(GPU)的加速處理器使編程變得更復雜,因為開發者要維護單獨的GPU和CPU內存。
拉奧還表示,到2020年,英特爾將推出芯片,使神經網絡訓練的性能提高100倍。一名分析師表示,這一目標“極為激進”。毫無疑問,英特爾將迅速把這一架構轉向更先進的制造工藝,與已經采用14納米或16納米FinFET工藝的GPU展開競爭。
最初的加速處理器需要通過PCI-E總線去連接主機。近期,英特爾決定更進一步,不僅提供應用,也提供云計算服務。
這款產品是英特爾大膽的一步。英特爾希望憑借這款產品取得相對于英偉達的技術優勢。目前,后者的GPU芯片被廣泛用于神經網絡的訓練。這是一項非常依賴于處理器的任務。百度等公司的研究人員表示,為了限制數據集的規模,他們往往要花幾個月時間。
拉奧表示:“目前,藝術級的神經網絡模型需要花幾周到幾個月時間去訓練。”他指出,百度研究院使用的一個模型需要消耗百萬萬億次運算。
科再奇則表示:“Nervana定位高端,給我們帶來了深度學習最頂尖的性能。”
然而,這仍是一個規模較小的新興市場。
英特爾數據中心集團總經理戴安·布萊恩特(Diane Bryant)指出,去年只有0.15%的服務器被專門用于神經網絡訓練。布萊恩特指出,英特爾收購人工智能云計算服務Saffron Technologies已吸引了終端用戶。
4名研究員已同意加入Nervana的人工智能顧問委員會,幫助該公司芯片架構未來的發展。Nervana將研究多種方式去優化算法,簡化神經網絡模型,探索降精度運算的新方向,以及如何擴大芯片規模。
分析師則對英特爾擁抱非x86架構表示看好。
Moor Insights &Strategy總裁帕特里克·莫爾海德(Patrick Moorhead)表示:“如果去看看,他們如何迅速將Altera、Nervana、Phi、至強和其他所需的軟件整合在一起,那么對英特爾這么大規模的公司而言,這令人印象深刻。目前的情況將取決于英特爾如何無錯地執行。”
盡管沒有針對人工智能進行優化,但英特爾仍然非常專注于至強Phi。這類多核x86芯片正被越來越多地用于超級計算機的加速處理器。
明年將推出的Knights Mill版本將可以支持最多400GB的主內存,遠遠超過當前GPU的16GB主內存。Knights Mill使用其中一個x86核心作為集成的主控制器,并支持多種精度的運算。
英特爾已開發了系統,使用最多128個當前Knights Landing版本的Phi芯片。英特爾并行計算實驗室主任普拉迪普·杜貝(Pradeep Dubey)表示:“我們計劃將芯片個數擴大至數百個,甚至數千個。”
在軟件方面,英特爾明年初將發布并開源面向Nervana的圖形編譯器。英特爾也在優化運行在x86處理器之上的主流人工智能框架,包括在今年底之前推出TensorFlow的一個版本。用于深度學習的SDK將于1月份推出。
英特爾正在從多個方面去培育人工智能開發者社區。
英特爾與谷歌達成了廣泛合作,優化基于x86處理器的云計算代碼。英特爾宣布了為期5年、總額2500萬美元的投資,與Broad Institute合作開發用于基因處理的工具和參考架構。英特爾還專門為Nervana架構創建了新的開發者社區,并啟動了新的人工智能學生開發者項目。