這些是Facebook最近發(fā)表的一篇研究論文的一些內(nèi)容,他們詳細(xì)介紹了他們?nèi)绾尾坏貌幌氤龈鞣N各樣的技巧來解決移動設(shè)備的硬件缺陷。
其中包括調(diào)整應(yīng)用程序中有多少“線程”來實現(xiàn)多種不同芯片設(shè)計和功能的共同點。這意味著他們通常無法“優(yōu)化”給定設(shè)備的代碼。
他們寫道,盡管Facebook擁有巨大的資源,但整個行業(yè)都需要做很多事情。
此外: Android手機上的人工智能仍在進(jìn)行中
該論文“Facebook機器學(xué)習(xí):理解邊緣推理” 發(fā)表在Facebook研究網(wǎng)站的出版物頁面上,由Carole-Jean Wu和25位同事撰寫。它已提交給明年2月在華盛頓特區(qū)舉行的IEEE高性能計算機體系結(jié)構(gòu)國際研討會
作者概述了雙管齊下的問題:越來越多的人需要在手機上執(zhí)行AI。但設(shè)備中芯片和軟件的格局是“狂野的西部”,不同部分的混亂,不同的軟件API,以及通常較差的性能。
在“邊緣”設(shè)備上需要應(yīng)用程序,包括智能手機,還有Oculus Rift耳機和其他設(shè)備,以執(zhí)行“推理”,這是計算機使用其訓(xùn)練有素的神經(jīng)網(wǎng)絡(luò)來回答問題的機器學(xué)習(xí)的一部分。
此外:Facebook偽造了人工智能模糊,使VR變得更加真實
作者引用了一些事情,例如對將要上傳到Instagram的圖像進(jìn)行實時推斷,作為需要本地處理的任務(wù),以避免進(jìn)入云進(jìn)行推理的延遲。
但考慮到野外的大量智能手機,F(xiàn)acebook正面臨著嚴(yán)峻的硬件。
他們指出,該公司的“神經(jīng)網(wǎng)絡(luò)引擎部署在超過10億個移動設(shè)備上”,包括“超過兩千個獨特的SOC [片上系統(tǒng),半導(dǎo)體不僅包括微處理器,還包括其他計算模塊]。” 這是一萬種不同型號的手機和平板電腦。
平均而言,這些手機中的CPU并不是那么出色:“幾乎所有的移動推理都在CPU上運行,大多數(shù)已部署的移動CPU內(nèi)核都是舊的和低端的。” 具體來說,今年,他們看到的所有智能手機中只有四分之一是運行2013年或之后設(shè)計的CPU。
此外:芯片創(chuàng)業(yè)公司Efinix希望在物聯(lián)網(wǎng)中引導(dǎo)AI的努力
而且這不僅僅是因為那里有很多舊手機:“這些智能手機的主要部分在最近的一到兩年內(nèi)銷售。”
此外,“沒有標(biāo)準(zhǔn)的移動SoC進(jìn)行優(yōu)化,”他們感嘆道,最常見的芯片市場份額不到4%。“數(shù)據(jù)很清楚:沒有'典型的'智能手機或移動SOC。” 芯片有一個“特別長的尾巴”。
擁有一個機載“加速器”,如GPU,有幫助,但沒有那么多強大的那些。
“不到20%的移動SoC擁有比CPU強3倍的GPU。” 他們寫道,手機上的大多數(shù)人工智能功能“甚至都沒有使用GPU”。
此外:AI啟動Flex Logix的表現(xiàn)遠(yuǎn)遠(yuǎn)高于Nvidia
DSP或數(shù)字信號處理器具有相同的缺點,它們相關(guān),并且所有這些加速器幾乎無法訪問高帶寬內(nèi)存。對機器學(xué)習(xí)核心的關(guān)鍵矢量結(jié)構(gòu)的支持很少,大多數(shù)人都需要數(shù)年才能獲得這種能力。
混亂的另一部分是軟件:很難為AI編寫這些芯片。有一個廣泛的API在移動設(shè)備上有用,“OpenCL”,但“不是Android系統(tǒng)的正式部分”,并且與其他API沒有達(dá)到相同的標(biāo)準(zhǔn)。其他API,包括“OpenGL ES”,一種適用于圖形的桌面API和“Vulkan”,很有前景,但只是部署得很薄。
另外:AI Startup Cornami揭示了神經(jīng)網(wǎng)絡(luò)芯片的細(xì)節(jié)
他們寫道,蘋果公司脫穎而出:它的iOS“金屬”API運行在一致的芯片平臺上,平均而言,這些芯片中的GPU性能更高,“使具有GPU的iOS設(shè)備上的Metal成為高效神經(jīng)網(wǎng)絡(luò)的有吸引力的目標(biāo)推理。” 然而,即便如此,對六代Apple“A”系列芯片的推斷速度進(jìn)行“嚴(yán)格”檢查的結(jié)果表明,在每一代芯片中仍然存在“廣泛的性能變化”。