20世紀50年代人工智能研究曾達到過一個高潮,設(shè)想比現(xiàn)在還要大膽。大家甚至擔憂過未來人工智能的發(fā)展將非常恐怖,很多年后世界會是機器人的世界,機器人將統(tǒng)治這個世界。當然這樣大膽的設(shè)想并沒有實現(xiàn),因為人工智能作為一個學科來說,是從機器推理開始取得的進展,通過搜索取得的進展都和人工神經(jīng)網(wǎng)絡(luò)深度學習取得的進展相關(guān)。
我們看到,人工智能正在與各種行業(yè)應用越來越緊密結(jié)合,而這,也正是當前人工智能與20世紀50年代人工智能研究的本質(zhì)區(qū)別。
HPC----高性能計算,是各種科學研究、氣象測算、海洋勘探的必備輔助,沒有HPC,很多科學研究將無法開展。怎樣才能保證人工智能與HPC的成功融合?
未來HPC的三大緯度
中國科學院計算所所長孫凝暉認為,高性能計算未來將向三個緯度發(fā)展,即:算得快、算得多和算得穩(wěn)。
首先,傳統(tǒng)HPC的要求便是算得快,中國高性能計算的發(fā)展,已從1P到100P到1000P甚至1億P的發(fā)展,計算算力要求無止境,這是永遠的緯度。
其次,還要算得多,包括以下兩個層次:首先是數(shù)據(jù)多,比如互聯(lián)網(wǎng)的數(shù)據(jù)非常大,主要靠數(shù)據(jù)采集和處理來獲得收益;再如傳統(tǒng)計算密集的石油勘探領(lǐng)域數(shù)據(jù)量也已經(jīng)達到了幾十P的量;再如中國科學院也正在產(chǎn)生的大量數(shù)據(jù),中國科學院正在制定新的發(fā)展規(guī)劃,國家投入建設(shè)了上海、合肥和懷柔三個科學中心,這三個大型科學中心將配備最頂級的科學裝置,不僅是傳統(tǒng)的天文望遠鏡,還有生物領(lǐng)域觀察的設(shè)備,對地球觀察的設(shè)備,對物質(zhì)科學的觀察設(shè)備等等。這些大的科學裝置都會產(chǎn)生大量的數(shù)據(jù)。第二個層次是如何解決數(shù)據(jù)的傳輸、移動和高效計算的問題,這將比純粹的計算更加重要。因此,AI在高性能計算領(lǐng)域的應用,雖然需要GPU很強的計算能力,但其核心還是要解決數(shù)據(jù)處理的問題,把數(shù)據(jù)處理好才能產(chǎn)生更大的智能。因此,讓計算機如何算得多,算得更加好,是第二個非常重要的發(fā)展方向。
第三,算得穩(wěn),云計算和物聯(lián)網(wǎng)發(fā)展的應用特征,需要計算用戶質(zhì)量能更好地得到保障,物聯(lián)網(wǎng)應用,智能汽車等對延遲的要求更加苛刻,因此,計算的負載保證用戶任務(wù)完成時間上要求更穩(wěn)定的供給,如何在計算負載劇烈變化,負載類型多樣的情況下,保證資源利用率,保證用戶體驗的穩(wěn)定,算得穩(wěn)也將是高性能計算非常重要的發(fā)展方向。
算得快、算得多和算得穩(wěn)這三個緯度把高性能計算空間撐得更大,未來的科學研究還是企業(yè)運用出將會有更大的發(fā)展空間。
AI成功的四大要素
顯而易見,計算、算法和數(shù)據(jù)是人工智能的三大基礎(chǔ)。如何保證AI的成功呢?聯(lián)想集團副總裁、企業(yè)服務(wù)云計算研究室、無線研究實驗室黃瑩博士認為:AI成功需要滿足四大要素,稱之為ABCD。
A是算法上的創(chuàng)新;
B是商業(yè)方面要有定向,即怎么樣才能夠應用好;
C是計算力,也就是如何將GPU、CPU、TPU進行更好的結(jié)合;
D是數(shù)據(jù),即怎么樣才能把數(shù)據(jù)更好處理好等等。
因此,AI的成功因素之一是算法,算法是很重要的一個方面,從AlphaGo上也可以看到算法的重要。目前,計算engine上,Nvidia、TensorFlow、Caffe、Torch等比較領(lǐng)先。
第二,進行大數(shù)據(jù)處理。未來數(shù)據(jù)量將越來越龐大,需要對大數(shù)據(jù)進行很好的處理。
第三是計算力,怎么樣能夠在TPU、GPU和FPGA等加速器上進行組合則是HPC專家的研究重點。因為GPU或者TPU或者FPGA不完全跟上和算法完全匹配時,要靠人做很多的調(diào)優(yōu)才能把GPU集群真正用好,這其中會面對極大的挑戰(zhàn)。以谷歌做翻譯訓練為例,一般的訓練要在12臺帶8個GPU的機器上算一周,但如果沒有這么好的集群,只能在一臺帶8個GPU上訓練需要計算三個月;如果只有一個GPU的機器則需要算兩年。因此,很多這種研究需要AI專家、分布式計算專家、網(wǎng)絡(luò)、存儲工程師等一群專家在一起工作。這種深度學習的訓練便導致了AI鴻溝,因為一般企業(yè)和一般的研究所沒有這么多專家在一起做這樣的事情。
基于上述思考,聯(lián)想推出了HPC+AI智能超算平臺LiCO,LiCO是提供強大計算力的最佳平臺,在HPC軟硬件平臺上整合支撐了各種深度學習應用,并融合了主流的人工智能框架。
聯(lián)想HPC的AI創(chuàng)新
聯(lián)想是全球領(lǐng)先的HPC廠商,聯(lián)想于2001年成立了高性能服務(wù)器事業(yè)部,開始了在HPC領(lǐng)域的探索。而在剛剛結(jié)束的ISC 2017上,聯(lián)想以91套高性能計算系統(tǒng)入圍全球HPC TOP500份額榜,連續(xù)三年獲得中國第一,繼續(xù)蟬聯(lián)全球第二。
在產(chǎn)品和技術(shù)上,聯(lián)想也正在步入世界先進行列,聯(lián)想的x86服務(wù)器產(chǎn)品性能和品質(zhì)全世界上共知,物理機計算節(jié)點可靠性有著很好的口碑。聯(lián)想獨創(chuàng)了45攝氏度溫水水冷技術(shù),相比傳統(tǒng)的空氣冷卻,最高可降低40%的能耗,比其他廠商的水冷技術(shù)能耗也低了近20%。通過聯(lián)想水冷能夠使得數(shù)據(jù)中心的PUE值降低到1.1,這遠低于1.8-2.0的業(yè)界平均水平,能幫助客戶大大節(jié)省整體投資,提升AI計算的效能。目前,聯(lián)想與全球最大的7個數(shù)據(jù)中心中的6個達成了合作,繼續(xù)在HPC領(lǐng)域展露鋒芒。上一個財年,聯(lián)想以17%的增長率成為全球增速最快的HPC廠商。
上圖為:聯(lián)想首席科學家祝明發(fā)
聯(lián)想首席科學家祝明發(fā)介紹:聯(lián)想近日推出的深騰8810集群由聯(lián)想自主研發(fā),擁有多項HPC和AI的關(guān)鍵技術(shù),包括46項國家發(fā)明專利。其搭載的全新HPC+AI智能超算平臺LiCO,不僅強化了上一代LiCO的全部功能,更在HPC軟硬件平臺上整合支撐了各種深度學習應用,融合了谷歌的Tensorflow、臉書的Caffe、微軟的MXNET等主流的人工智能框架;另外,LiCO分布式的資源調(diào)度系統(tǒng),可以幫助用戶從容應對人臉識別、自然語言處理等各種深度學習訓練不斷增長的計算需求;其任務(wù)模板可以讓不同類型的用戶,如初學者、專家、數(shù)據(jù)科學家,都能夠快速上手; 而LiCO端到端的解決方案包含數(shù)據(jù)預處理、訓練、參數(shù)調(diào)整、過程監(jiān)控、測試等,能讓用戶能夠集中精力在AI算法和業(yè)務(wù)應用。
在生態(tài)聯(lián)盟方面,聯(lián)想進一步加強了與各領(lǐng)域合作伙伴的密切聯(lián)系,打造HPC+AI的完整生態(tài)圈。除了在硬件層面繼續(xù)加深與Intel、NVIDIA、Mellanox等廠商的合作,聯(lián)想還在軟件層面主動開放生態(tài)系統(tǒng),吸引主流軟件廠商例如Redhat加入聯(lián)盟。同時,聯(lián)想創(chuàng)投還不斷發(fā)掘應用層面具有潛力的科技創(chuàng)新公司,投資了Face++、銀河水滴科技等,以更快的速度搶占AI的制高點。另外,聯(lián)想與科大訊飛、滴滴出行、今日頭條等人工智能領(lǐng)先公司在系統(tǒng)與應用方面的深入緊密合作,也能幫助客戶在語音、圖像、視頻、搜索、網(wǎng)絡(luò)等方面取得幾何數(shù)量級的應用性能提升。
采訪小記
無論如何,我們都正在進入一個人工智能研究及應用創(chuàng)新集中爆發(fā)的時代,我們不再像20世紀50年代一樣擔憂人類將會被機器人統(tǒng)治,我們更愿意用人工智能與應用結(jié)合,讓這個世界變得更美好。當然,人工智能也只有在強大計算力的支持下,通過和成熟的算法、大數(shù)據(jù)相結(jié)合,才能真正做到改變。