▲AT&T貝爾實驗室 在這個傳奇的實驗室里,不僅誕生了7位諾貝爾獎獲得者,還是誕生了世界上第一個晶體管、蜂窩式電話系統、通訊衛星、有聲電影、太陽能電池、C/C++語言、UNIX系統…… 不僅如此,世界上第一塊人工智能芯片也同樣誕生于此。 1992年,馬克·扎克伯格只有8歲,離他后來創辦世界第一大社交網絡Facebook還有12年時間,離“卷積神經網絡之父”Yann LeCun加入Facebook人工智能研究院還有21年。 就在這一年,世界上第一塊——同時也被當時研究頻頻受挫的Yann LeCun稱為“可能是世界上最后一塊”——神經網絡芯片ANNA,就誕生AT&T貝爾實驗室里。
▲1992年的AT&T貝爾實驗室一景
一、ANNA之興與卷積神經網絡之衰
眾所周知,無論是“人工智能”、“深度學習”還是“神經網絡”,這些近年來大火的概念其實都可以追溯到幾十年前。但由于這些算法對于數據與計算量都有著極大的要求,當時的軟硬件條件都無法滿足,因而這類研究一直到近些年才大火起來。 不過,即便在眾人并不看好深度學習的年月里,依然有一小群在“神經網絡寒冬”里也堅持信念的科學家們,Yann LeCun就是其中一個。 1988年10月,在學習完神經科學、芯片設計,并師從多倫多大學深度學習鼻祖Geoffrey Hinton后,年僅27歲的年輕博士后Yann LeCun來到美國新澤西州,正式成為傳奇的AT&T貝爾實驗室的一員。 在當時的貝爾實驗室里,已經有一組研究員在進行英文字母識別的研究,并且積累下了一個擁有5000個訓練樣本的USPS數據集——這在當時已經是一個非常龐大的數據集。 在這個數據集的幫助下,Yann LeCun在三個月內便打造并訓練了第一個版本的卷積神經網絡LeNet one,在字母識別上取得了有史以來最高的準確率,也正式標志著卷積神經網絡的誕生。 不過,Yann LeCun的研究并沒有止步在軟件層面。1989年,Yann LeCun與實驗室的其他實驗員Bernhard Boser、Edi Sackinger等人共同撰寫了一篇新論文,介紹了他們所研制的一款名為“ANNA”的神經網絡芯片。
▲“ANNA”神經網絡芯片 ANNA中包括64個計算單元,專門針對卷積神經網絡進行了優化,其峰值吞吐量為每秒40億次加法。 雖然在此之前,神經網絡作為一個新興的研究方向已然小有名氣,有不少研究人員也嘗試打造過神經網絡芯片,但它們都無法放在板級(Board-Level)測試環境中,也就無法在真實世界中應用。 除了ANNA之外,貝爾實驗室還曾在1991年打造過一款Net32K芯片。在Yann LeCun等人隨后發布了一系列論文中,他們不僅介紹了ANNA在板級測試中的優秀表現,還展示了ANNA在利用卷積神經網絡在文本傾斜檢測、手寫數字識別等應用上的優異表現(比單獨的DSP快10到100倍),讓ANNA當之無愧地成為了世界上第一塊“能用的”人工智能芯片。
▲搭載ANNA的測試板原理示意圖 不過,天有不測風云。1996年,AT&T公司進行了一輪拆分,通信運營業務保留在新AT&T中,一部分貝爾實驗室和AT&T的設備制造部門被剝離出來形成了朗訊科技,另一部分負責計算機業務的部門則組建了NCR公司。
▲Yann LeCun(后排中間)與新AT&T實驗室成員,攝于2002年 Yann LeCun留在了新AT&T的實驗室里,擔任AT&T實驗室圖像處理研究部門負責人,然而極其不幸的是,卷積神經網絡的專利卻被律師團隊最終決定分給了NCR公司(這一專利在2007年過期)。 用Yann LeCun的話來說,“當時NCR手握卷積神經網絡的專利,卻完全沒有人知道卷積神經網絡到底是什么”,而自己卻因為身處另一家公司而無法繼續進行相關研究。 然而,在1996年后的時間里,科學界對神經網絡的興趣逐漸走向衰微,越來越少人進行相關研究,一直到2010年以后才重新興起。
二、AI芯片浪潮襲來
讓我們把時間調回現在。 在過去的這十年間,AI領域迎來了一場新浪潮。 人工智能這一項新興技術,在經歷了技術積累、升級、發酵之后,正在以AI芯片作為載體而全面崛起。據智東西報道了解得知,目前全球至少有50家初創公司正在研發語音交互和自動駕駛芯片,并且至少有5家企業已經獲得超過1億美元的融資,這一數目還在不斷增加當中。(
深度 | AI芯片終極之戰
) 除了創業市場一片興盛外,各大科技巨頭也毫不示弱。除了谷歌、蘋果、華為、百度、英特爾、賽靈思等巨頭陸續重拳入局AI芯片外,亞馬遜也被曝出擁有449人的芯片團隊,設計定制AI芯片的消息基本坐實。 作為目前全球市值最高的第五大科技企業,日活躍用戶達14.5億、月活躍用戶達22億的全球第一大社交網站Facebook自然也不會缺席這場戰役。 2013年,時任紐約大學教授的Yann LeCun宣布加入Facebook,幫助建立Facebook人工智能研究院(FAIR)。
▲部分Facebook人工智能研究院成員 在成立五年以來,Facebook人工智能研究院已經在美國加州門洛帕克(Facebook總部)、美國紐約、法國巴黎、以及加拿大蒙特利爾等地建有六所人工智能研究所,擁有超過115位科學家,各自專攻機器視覺、機器學習、自然語言處理等領域,包括何凱明、田淵棟等國內熟悉的人工智能學者。 在Yann LeCun的帶領下,Facebook人工智能研究院中不僅誕生了著名的Caffe、Caffe2深度學習開源框架,也讓Facebook在這人工智能浪潮當中能夠與谷歌等巨頭一爭高下。 早在2017年底,Facebook就已經作為英特爾的首位合作伙伴,內部測試了英特爾AI云端芯片Spring Crest,并與英特爾合作進行了AI芯片的研發與優化,一時間有關“Facebook要打造自己的云服務器AI芯片”的傳言塵囂甚起。 不過我們綜合各方線索來看,Facebook最先打造的應該并不會是一款能夠支持多種AI應用的通用云端AI芯片,而是一款主攻視頻的AI芯片,不過目測這款芯片不會在近期與眾人見面。
三、挖角谷歌,大規模擴建AI芯片團隊
從2018年年中開始,Facebook就在AI芯片方面頻頻發聲。 5月,在巴黎Viva科技峰會上,Yann LeCun首次直接披露了Facebook在AI芯片方面的具體方向:視頻實時監測。 由于這兩年來視頻直播的盛行,越來越多用戶選擇使用這種方式分享自己的生活,這位Facebook的視頻實時分析、實時審核過濾帶來了極大的壓力。 2017年的復活節時,一名男子在Facebook上直播開槍殺人,該視頻在Facebook上停留了超過2個小時后才被刪除,引起了社會的極大恐慌。 傳統軟硬件不僅分析過濾不及時,對于越來越大量的視頻壓縮、審核、監管等應用,傳統軟硬件在計算資源和功耗控制上都達不到要求。 Yann LeCun說,“Facebook之所以要自己做芯片,是因為傳統資源無法滿足新時代需求,傳統方法已經失效,我們需要一款AI芯片,實時分析和過濾視頻內容。” 順便一提的是,今年1月,Yann LeCun宣布將不再擔任FAIR負責人,將由前IBM大數據集團CTO Jérôme Pesenti接任。LeCun表示他將改任Facebook的首席AI科學家,專注于AI學術研究以及對FAIR進行方向性指導。
▲Shahriar Rabii的LinkedIn界面 目前。Facebook的AI芯片團隊還處在早期的起步組建階段。就在上周,Facebook才剛剛從谷歌挖來一員大將——谷歌前芯片產品開發部門負責人Shahriar Rabii跳槽,擔任Facebook副總監及芯片部分負責人一職。 Shahriar Rabii曾在谷歌工作7年,離職前職位為高級工程師主管、芯片產品開發部門負責人。他負責帶隊進行了大量針對消費者用戶的芯片研發工作,其中最值得一提的是為“谷歌親兒子”Pixel智能手機打造的Visual Core定制化AI視覺芯片,這枚芯片能夠為智能手機攝像頭帶來機器學習AI功能。 更早之前的4月19日,Facebook的第一條AI芯片招聘信息開始在線上流傳。在招聘信息當中,Facebook宣布即將為招聘一名管理者(Manger)來組建“端對端SoC/ASIC固件和驅動開發組織”,該管理者需要“針對多個垂直領域開發定制解決方案,包括人工智能和機器學習”。
在同日的另一則招聘啟事中,Facebook則表示正在招聘“ASIC&FPGA設計工程師”,該工程是需要擁“架構和設計半定制和全定制ASIC的專業知識、能夠與軟件和系統工程師合作,了解當前硬件的局限性,并利用他們的專業知識打造針對多種應用(包括人工智能/機器學習,壓縮,視頻解碼等)的定制解決方案。 時至今日,Facebook依然有不少AI芯片相關的崗位招聘掛在LinkedIn頁面上,并且在持續更新中:比如五天前跟新的一條“內存&芯片產品總監”招聘信息、以及三天前更新的兩條“ASIC&FPGA工程師”、“ASIC/FPGA技術項目主管”招聘信息。 從高調挖人到大規模招聘,可見Facebook在AI芯片的決心與投入。不過如果按照芯片18個月的設計制造周期來說,如果Facebook現在才開始招募團隊,那么離芯片真正量產就還有至少一年時間。
結語:AI芯片的巨大想象空間
隨著AI算法的進一步發展,人工智能在不同應用領域的分化也越來越明顯。對于任何一個業務體量巨大的科技公司而言,專為自己業務線所打造的定制化AI芯片能夠帶來的成本縮減與效率提升有著巨大的想象力,任何一個科技巨頭都不會輕易放過這一機會。 雖然硬件研發一直都不是Facebook的強項,但是如果瞄準的只是視頻壓縮與審查這一領域,那么AI芯片打造的難度將會大大小于通用云端AI芯片(君不見英特爾的AI芯片一再推遲面世),可能會比預期更早與世人見面。