按:作者系SenseTime(商湯科技)深度學習科學家周斌博士,中國首位HPC(High-Performance Computing,高性能計算)和GPU跨領域研發高級工程師,中科大客座研究員。
SenseTime 最近推出了超算平臺SenseBox,其存儲和計算能力據稱可以讓深度學習項目獲得更快的訓練時間和更好的訓練數據,從而培育出新一代的更強“大腦”。
如果有一天醒來,發現自己成了上帝(無所不能的感覺真好!),你會怎么樣?這樣的場景雖然只存在于科幻中,但是隨著深度學習所引領的人工智能技術的進步,人類創造出強人工智能已經成為了一個嚴肅的科研問題。人類,乃至宇宙,可能是某個“上帝”所制造的程序代碼,就像羅伯特 . J . 索耶在《計算中的上帝(Calculating God)》所描述的那樣。在我們創造的人工智能體眼中,我們就是上帝。
上帝的計算機長什么樣?
我們作為人工智能體的上帝,還是需要一臺計算機(請原諒我狹隘的想象力,作為深度學習+的程序員,他的身邊永遠都有幾臺計算機)來運行上帝的代碼——虛擬的宇宙和智能,這樣的計算機長什么樣?
這是個很有意思的話題:上帝的計算機需要無窮快的速度,無窮大的存儲,無窮智能的接口……幻想到此打住,歸根結底,我們雖然是上帝,但只是我們創造的智能體的上帝。回歸到現實,為了創造容納智能體的計算機,我們需要利用手邊的材料來搭建能夠用于進行深度學習的超級計算機。
曾幾何時,在我剛開始深入研究這個領域的時候,超級計算機還是躲在深閨大院、處于廟堂之上,研究物理、化學、生物、數學、密碼、氣象等等高深莫測的科學(我都有所涉獵,很多問題歸結為數學和計算)。現在,信號處理、圖形圖像、視頻、天氣預報、生物信息學、網絡搜索等等應用領域都能發現超算平臺的身影:
在氣象領域,超算平臺可以顯著提升天氣預報和沙塵暴模擬的精確程度,這也是我在美國喬治梅森大學所做的研究。我國新一代全球與區域同化預報系統(Global—Regional Assimilation and Prediction Systems,簡稱“GRAPES”)也是基于超算平臺的氣象項目,中國國家氣象局的天氣預報正在應用“GRAPES”系統;
在醫療領域,實現醫學圖像的有效識別是目前計算機科學和醫學交叉領域研究的熱點,在腫瘤圖像識別的相關研究領域,超算平臺的應用能使GPU的識別速度和精度得到大幅提升,從而整體提升醫療服務質量;
在軍事領域,超算平臺堪稱現代化國防建設的重要科技支柱,中國目前最先進的中程空對空導彈“霹靂12”就應用了相關技術。
以上種種進步都離不開平臺超算本身的發展、迭代,中國的超級計算機一直處于世界領先地位:“天河一號”超級計算機GPU系統研發時,運算水平就曾排名世界第一;現在“天河二號”超級計算機系統更是連續五次位列世界超級計算機500強排行榜之首。上帝的計算機或許是個玩笑,但是作為智能體上帝的計算機,很可能就誕生在現在的各種超算之中。
深度學習之超算平臺
如今,為了容納深度學習的超大規模計算需求,超級計算機已經成為訓練各種深度神經網絡的利器。深度學習技術試圖通過大規模的神經網絡和大數據提供的海量訓練集合,將大腦學習識別的過程加以抽象,從而獲得極高的識別準確度,這些都帶來了極大的計算需求和吞吐需求。于是,這些以往高居廟堂的屠龍之技有了用武之地:GPU協處理器、高速InfiniBand網絡、RDMA、GPUDirect等成了利器,提供著高吞吐、低延遲、高性能的系統平臺。雖然離著無窮還有無窮,但是為分布式大規模的深度學習算法提供了極高的帶寬和極低的延遲,使通信的開銷最小化,為訓練各種深度網絡提供了強大的平臺。
谷歌、百度、Facebook、微軟等互聯網巨頭都在投入巨資研發深度學習系統和與之配套的深度學習平臺。其中,Google采用了超過1000個節點的CPU集群來進行GoogleNet的計算;百度的Minwa則采用了36個服務器,每臺服務器配備4顆NVIDIA公司的Tesla K40m GPU加速處理器,互聯網絡采用FDR Infiniband (56Gb/s)。
(有人會問:用這樣的設備玩游戲會不會很快?答案是:土豪。)
從超算到服務,超算的未來已成雛形
在讀本科和研究生的時候,我曾參加過很多的機器人競賽,大多都與遙感、圖像識別相關,但在當時,我就能明顯地感受到神經網絡訓練的局限性,對于學生而言,成本、資源問題堪稱科研路上的緊箍咒。
并不是所有人和團隊都有能力搭建如此強大的計算機或建立復雜的深度神經網絡,但所有人都渴望擁有人工智能體的創造權。如果有哪個土豪公司將自己這方面的資源開源,讓更多開發者定制專屬的深度神經網絡,或許某一天,你可以下單訂購你個人專屬人工智能體,她知道你的愛好、理解你的行為:可以照顧生活、準備飯菜、照看孩子、安排日程、同期翻譯……
當然,現在的服務還需要你確認特定的應用領域,給出訓練樣本和指標,深度學習平臺如同一所學校,它將托管模型,運行培訓,給出學習成果。可能運行于專用的深度學習云之上,各種應用需求都可以通過高速的互聯網絡獲得基礎支撐。深度學習服務,作為可以定制的專屬人工智能,將滲透到各個行業領域。或許未來已經到來,我的目標就是在未來把真正的智能推廣到每個人生活中。
機器人統治人類?別擔心,還早著呢
我們期望我們所創造的人工智能具有強大的智力但又忠心耿耿,但是包括霍金、Elon Musk等在內的很多科學家,都表達了對強人工智能的恐懼。誠然,具有自主意識的人工智能,可能不會甘愿接收人類的統治,進而和人類產生沖突和矛盾,但現在大可不必擔憂——我們最優秀的深度學習算法,也只是在某些特定領域和應用超過人類,離形成意識的強人工智能還有較遠的距離。我們的服務平臺培訓的智能模型,都是深入的服務特定的應用,離著天網般智能爆炸的終極審判還有十萬八千里。
如果說“黑客帝國”所代表的科幻電影中描述人類將智能上傳到計算機是可能的,那么創造出這一平臺的,必然是超級計算機。現在的深度神經網絡,是向終極智能探索的一小步,卻可能是從0到1的積累,智能爆炸的奇點,很可能在不久的將來出現。深度學習的探索和研究,推動了智慧的進步,而終極的智能,則可能成為未來超級人類的母體。