呂克·貝松執導的《超體》,讓人們再一次將目光投向大腦開發。而對于眾多從事人工智能研究的工程師們來說,讓機器“超體”則是夢寐以求的目標。在人工智能領域,智能語音識別被眾多專家認為是未來10年間信息技術領域十大重點發展技術之一,而一項由科大訊飛主導的“訊飛超腦計劃”正在致力于將這一夢想變成現實。
無解?人腦能耗比=天河2號的200萬倍
智能語音目前主要依靠深度學習的技術實現,作為機器學習的一個重要分支,深度學習在于建立、模擬人腦進行分析學習的神經網絡,使得機器能從大量歷史數據中學習規律,從而對新的樣本做智能識別或對未來做預測,以達到具有人類一樣的思考能力。目前,Facebook、Google、IBM、蘋果、微軟、百度、科大訊飛等均在此方面做了多種嘗試。
深度學習技術有很多支撐的計算機算法,而目前最常用的是DNN算法(k近鄰分類算法),它能比較好地模擬人腦神經元多層深度傳遞的過程,解決智能語音中的復雜問題。然而,要模擬人腦絕非易事,人腦的計算能耗比是世界上最快的超級計算機天河2號的200萬倍,據了解,人類大腦大致有1000億神經元,每個神經元有大約5000個神經突觸。要使機器無限接近人類的思考能力意味著要模擬出更多的神經元和神經突觸,這就會帶來巨大的計算挑戰。
挑戰!模擬1/10人腦神經元
對于神經學領域的工程師們來說,他們所面臨的最終挑戰就是在提供更好配置性和規模的同時,實現類似于人腦一般的超高能耗比。
在現階段,即使世界IT巨頭都無法徹底解決上述難題,不過科大訊飛卻宣布要實現基于類人神經網絡的認知智能引擎,預期成果是實現世界上第一個中文認知智能計算引擎。
目前,科大訊飛已經集結了在認知智能領域最強研究團隊,將在知識圖譜構建與推理、人工神經網絡模擬、人腦原理分析模擬幾個方向展開研究。
為了搶占國內智能語音市場先機,科大訊飛計劃將模擬人腦神經元的1/10,以期讓該公司的智能語音設備擁有初步的人類思考能力。
破題!算法優化+高效集群
要實現人腦神經元的1/10的深度模擬,意味著科大訊飛面臨著數千倍訓練數據及數千倍模型參數的巨大挑戰,迫切需求更大規模、更多存儲的超算平臺集群建設、更優的深度學習并行化及集群調度算法和深度定制的人工神經網絡專屬芯片系統。
面對這些棘手的問題,該采用何種方式有效解決?首先是算法上優化,科大訊飛將整個DNN環節進行優化壓縮,只保留部分核心等流程,整個架構循環由優化了40%,大幅度的增加了運算速度與效率。
在算法調整完以后面臨的就是基礎設施的建設,如何設計一套占地面積小、計算性能高、又綠色節能的高性能計算集群成為科大訊飛面臨的下一個難題。浪潮曾參與研制天河1A、天河2號超級計算機具備非常豐富和領先的系統構建能力,并且擁有一支上百人的應用專家團隊,對高性能計算的專業應用也十分了解,因此浪潮成為科大訊飛的選擇的廠商之一。
浪潮!伙伴的力量
針對該公司面臨的問題,雙方聯合設計了針對DNN算法特點的GPU集群并行計算框架,通過GPU提高計算能力、通過IB網絡提速節點之間的通信速度,最終完成GPU集群版的DNN并行算法,大幅減低了DNN的計算時間。
除了為科大訊飛構建高性能集群系統,浪潮還特別在軟件方面與該公司算法專家團隊共同成立專門聯合項目組,節點內使用CPU+GPU協同計算,大幅降低了計算時間。雙方聯合針對GPU架構進行了算法層面的優化,重寫了計算部分代碼,將整體速度大幅提升。
解決了算法和平臺的問題,浪潮成功幫助科大訊飛有效提升了語音識別的正確率。浪潮-英特爾中國并行計算聯合實驗室首席工程師張清介紹:“浪潮已經分別與英特爾和英偉達成立聯合并行計算實驗室,合作開發優化基于MIC和GPU的并行應用。目前已經建立了一套非常完善的高性能計算集群解決方案,將不僅為用戶提供好用的高性能計算集群,還會針對每一個用戶的應用特點量身定制集群解決方案,這也就說明未來浪潮將跟用戶在應用測試、集群搭建、加速優化等各方面展開合作,把用戶的需求看作是浪潮設計構建集群的根本要求。”而這些聯合實驗室的成果對于支持科大訊飛人工智能超算應用需求起到了關鍵性的作用。