優(yōu)化系統(tǒng)有助于加速深度學(xué)習(xí)計算,全棧式AI集成開發(fā)平臺可以使AI開發(fā)變得更加高效快捷,全周期集成開發(fā)套件則為開發(fā)者提供大量方便可用的高階AI工具和服務(wù)。
微軟亞洲研究院副院長、人工智能系統(tǒng)聯(lián)合中心負(fù)責(zé)人周禮棟博士一開場便強(qiáng)調(diào)系統(tǒng)的重要性:“沒有系統(tǒng),一切都是海市蜃樓、空中樓閣。”根據(jù)科普中國的定義,系統(tǒng)是指將零散的東西進(jìn)行有序的整理、編排形成的具有整體性的整體。通俗點講,系統(tǒng)就好比大樓的地基,是大樓能經(jīng)年累月屹立不倒的關(guān)鍵。在計算機(jī)發(fā)展過程中,每一次大的突破,背后都有很多系統(tǒng)理論和設(shè)計作為持久推動力。周禮棟博士認(rèn)為,系統(tǒng)研究和創(chuàng)新正進(jìn)入黃金時代,到2020年,AI應(yīng)用將全方位覆蓋人類生活,把信息轉(zhuǎn)換成有用服務(wù),為人類帶來福利。
深度學(xué)習(xí)本質(zhì)上是基于統(tǒng)計的科學(xué),依賴于強(qiáng)大的計算能力,對AI發(fā)展起到?jīng)Q定性作用。訓(xùn)練一個模型,需要考慮樣本規(guī)模、網(wǎng)絡(luò)復(fù)雜度以及計算時長等問題。
優(yōu)化深度學(xué)習(xí)計算,首先要降低大量通信開銷和與逆行開銷;其次需獲得快速、高效的計算方法,既要最大化多機(jī)并行度,還要提高GPU等單個計算單元的效率;最后,實現(xiàn)系統(tǒng)軟件自動優(yōu)化也很關(guān)鍵,方便用戶操作,降低AI研發(fā)門檻。
針對上述優(yōu)化方法,微軟展示了三種系統(tǒng)優(yōu)化路徑。
1、RDMA,加速分布式深度學(xué)習(xí)訓(xùn)練
多機(jī)間的通信開銷是分布式訓(xùn)練的主要瓶頸。資深研究員伍鳴介紹了一種硬件網(wǎng)絡(luò)技術(shù)RDMA網(wǎng)卡(Remote Direct Memory Access,可繞過TCP/IP協(xié)議棧進(jìn)行通信,遠(yuǎn)程訪問內(nèi)存時不受遠(yuǎn)程機(jī)器上CPU的干預(yù)),目前許多以深度學(xué)習(xí)為目標(biāo)應(yīng)用的GPU機(jī)群都部署了這樣的網(wǎng)絡(luò)。為了更好利用RDMA的能力,微軟巧妙設(shè)計零拷貝通信機(jī)制,將Tensor數(shù)據(jù)直接傳輸?shù)澜邮斩恕=?jīng)TensorFlow上的實驗,該方法在一系列神經(jīng)網(wǎng)絡(luò)模型上的收斂速度均提高2-3倍。
2、內(nèi)核融合,帶來大幅性能提升
內(nèi)核融合(Kernel Fusion)的主要思路是如何自動對任意深度學(xué)習(xí)網(wǎng)絡(luò)模型實施優(yōu)化,提升單個計算單元運(yùn)算效率。
上圖是將循環(huán)神經(jīng)網(wǎng)絡(luò)RNN放在三個平臺上訓(xùn)練的實驗結(jié)果,由右邊圖表可以看出,內(nèi)核融合后的運(yùn)行速度遠(yuǎn)低于在Tensorflow和谷歌XLA的運(yùn)行速度,實現(xiàn)約10.9倍的性能加速。
3、擴(kuò)展API,將壓縮量化過程變簡潔
微軟正在嘗試擴(kuò)展TensorFlow API,使用戶可以在模型腳本中直接控制壓縮和量化。另一個思路是將輸入數(shù)據(jù)異步拷貝到CPU中,掩蓋數(shù)據(jù)拷貝的開銷,這種做法需要和內(nèi)核融合結(jié)合。
想要進(jìn)一步了解從系統(tǒng)層面優(yōu)化深度學(xué)習(xí)計算,可以訪問鏈接:https://www.msra.cn/zh-cn/news/features/deep-learning-optimization-in-framework
隨著AI技術(shù)的快速發(fā)展,各種深度學(xué)習(xí)框架層出不窮。為了更好地使AI落地,提高開發(fā)者編程效率,MSRA和STCA聯(lián)合研發(fā)創(chuàng)立了Open Platform for AI(OpenPAI),希望為深度學(xué)習(xí)提供一個優(yōu)化的大規(guī)模AI集群管理平臺,讓AI堆棧變得簡單、快速、可擴(kuò)展。
5月22日,微軟亞洲研究院聯(lián)合北京大學(xué)、中國科學(xué)技術(shù)大學(xué)、西安交通大學(xué)和浙江大學(xué)四所國內(nèi)頂尖高校共建新一代人工智能開放科研教育平臺,以助力中國AI領(lǐng)域科研和教育事業(yè)的發(fā)展。OpenPAI是MSRA為該教育平臺提供的三大關(guān)鍵技術(shù)之一。
中科大基于OpenPAI所搭建起的私有云平臺已初見成效,極大減輕了科研人員的工作量。未來OpenPAI將繼續(xù)擴(kuò)展、支持類腦智能技術(shù)及應(yīng)用國家工程實驗室的科研工作。
想要進(jìn)一步了解Open API,可以訪問鏈接:https://www.msra.cn/zh-cn/news/features/openpai
Tools for AI由微軟中國研發(fā)團(tuán)隊主導(dǎo)研發(fā),為開發(fā)者提供業(yè)界第一款針對AI的全平臺、全軟件產(chǎn)品生命周期的集成開發(fā)套件。5月21日召開的2018微軟人工智能大會(Microsoft AI Innovate 2018)上,微軟推出這項新工具。
Tools for AI具有一鍵安裝功能,可配合Visual Studio (Code)為開發(fā)者提供一個可以快速入門的AI開發(fā)集成環(huán)境。該工具還支持多種云端資源,能充分利用云端計算資源加速訓(xùn)練。此外,微軟提供統(tǒng)一的可視化界面,方便開發(fā)者使用完整的AI開發(fā)生命周期管理功能,并允許用戶利用如微軟認(rèn)知服務(wù)Cognitive Services等預(yù)先開發(fā)好的高階AI模型和服務(wù)。
Tools for AI致力于為開發(fā)者提供一個熟悉、一致和開放的開發(fā)環(huán)境,使之快速實現(xiàn)AI開發(fā)全周期工作。不僅幫助開發(fā)者靈活使用AI技術(shù)解決行業(yè)內(nèi)的重要問題,有助于提高多方科研技術(shù)水平,還將為中國AI的發(fā)展提供更大的動力。
想要進(jìn)一步了解Tools for AI,可以訪問鏈接:https://www.msra.cn/zh-cn/news/features/tools-for-ai
傳統(tǒng)機(jī)器學(xué)習(xí)開發(fā)還存在的問題有:流程繁瑣,需經(jīng)反復(fù)迭代尋找更好模型;模型選擇和調(diào)參需要人工手寫冗余代碼;難以并行在分布式集群上。針對上述問題,研究員薛卉介紹了智能化自動化的深度學(xué)習(xí)模型開發(fā)流程N(yùn)NI(Neural Network Intelligence)。
NNI定義了全新的搜索空間語言,允許一鍵部署在不同的云服務(wù)或本地空間上,底層支持不同的深度學(xué)習(xí)框架。它可以自動數(shù)據(jù)分析、用工具包自動迭代,為用戶提供更方便開發(fā)流程。用戶可以將代碼發(fā)布到不同集群,通過評估找更好的超參數(shù)組合和模型結(jié)構(gòu)。可視化工具可以幫助用戶直觀的查看超參數(shù)組合、時間等數(shù)據(jù)。
該工具不久后會以開源形式和大家見面。
微軟亞洲研究院研究人員提出對未來系統(tǒng)的愿景:隱形無界的系統(tǒng),無處不在的智能。設(shè)計系統(tǒng)非常繁復(fù),每一步都會造成損耗,所以每一步都要做統(tǒng)一精準(zhǔn)的考量。研究人員們正在努力打造簡約的抽象加全新的平臺工具,期望從系統(tǒng)層面進(jìn)一步推動深度學(xué)習(xí)乃至人工智能的發(fā)展,努力在高效計算方法、兼容性、全面且精簡等方面有更大的提升。
AI系統(tǒng)具有良好的普適性,隨著其性能的提高,很多領(lǐng)域的“大餅”會變成現(xiàn)實。在一些AI領(lǐng)域,比如家用機(jī)器人、智能音箱等,優(yōu)化系統(tǒng)能夠使小型芯片亦有出色的性能體驗。再比方說,云對話可以做到自然流暢無延遲地回復(fù)對話,這也和系統(tǒng)優(yōu)化密不可分。開發(fā)者可以在全棧式開發(fā)平臺上使用強(qiáng)大的AI套件盡情編譯代碼,無需關(guān)心資源來自哪里,也無需考慮速度、消耗等的問題。傳統(tǒng)開發(fā)者也能從最熟悉的環(huán)境開始,逐步轉(zhuǎn)型為AI開發(fā)者。
當(dāng)被問及微軟在AI方面的關(guān)注點與其他企業(yè)有什么不同時,研究人員告訴記者,微軟想以更全面的方式看問題,希望提供整體的解決方案,并表示不排斥任何有益的東西,愿意通過和包括競爭對手在內(nèi)的各企業(yè)、各高校合作互通,為共同未來AI的發(fā)展添磚加瓦。
德國建筑大師密斯有一句名言:“當(dāng)技術(shù)實現(xiàn)了它的真正使命,它就升華為藝術(shù)。”這句話套在人工智能系統(tǒng)上,似乎也極其適用。