摘要 : 在云計算領域建樹頗豐的百度,進軍超級計算機是否畫蛇添足?
《華爾街日報》5月12日報道,百度近日表示已在人工智能基準測試中取得了全球最佳成績,其研發(fā)的超級計算機Minwa掃描了ImgaeNet數(shù)據(jù)庫里的100多萬張圖片,并能按照先前制定的標準,自動將其分為1000多種不同的類別,錯誤率僅為4.58%,而人眼在ImageNet物體分類測試中的錯誤率約為5%,微軟和谷歌分別為4.94%和4.8%。同時百度還透露正在通過超級計算機,進一步完善百度搜索引擎的中英語音識別系統(tǒng)。未來18個月,百度計劃研發(fā)出一個更強大的設備,能夠進行每秒7千萬億次的計算。一旦成功,該設備將躋身全球十大超級計算機計算機之列。信息量比較大,我更關注的是,在云計算領域建樹頗豐的百度,進軍超級計算機是否畫蛇添足?
超級計算機與云計算之爭
先看看什么是超級計算機。百度百科顯示,
超級計算機指能夠執(zhí)行一般個人電腦無法處理的大資料量與高速運算的電腦,其基本組成組件與個人電腦的概念無太大差異,但規(guī)格與性能則強大許多,是一種超大型電子計算機。超級計算機是計算機中功能最強、運算速度最快、存儲容量最大的一類計算機,多用于國家高科技領域和尖端技術研究,是一個國家科研實力的體現(xiàn),它對國家安全,經(jīng)濟和社會發(fā)展具有舉足輕重的意義。是國家科技發(fā)展水平和綜合國力的重要標志。
在沒有云計算之前,超級計算機代表著一個國家的科研實力,圍繞超算出現(xiàn)了跑分競賽,核心指標是計算效率,即每秒的浮點運算次數(shù)。中國超級計算機在2009年開始在國際上嶄露頭角,天河1號、天河1號A相繼穩(wěn)定世界TOP500榜,天河2號已連續(xù)三次奪得超級計算機TOP500競賽冠軍,并且在下一次競賽中依然穩(wěn)操勝券。在現(xiàn)在的超級計算機排行榜中,天河2號計算速度為33.86千萬億次/秒,第二名是位于美國能源部(DOE)橡樹嶺國家實驗室中的Titan,17.59千萬億次/秒,與天河2號差距甚大,百度7千萬億次/秒的超級計算機面世,在這個榜單中只能屈居第六。
云計算出現(xiàn)之后,超級計算機的不少計算場景都被前者所瓜分。超級計算機單機運算能力非常驚人,云計算方案則是基于多臺計算機,基于Hidoop為代表的集群計算系統(tǒng)進行并行計算,Hidoop負責計算任務分發(fā)調度歸總。兩個方案中真正負責計算的都是處理器,一般是CPU,百度已開始嘗試GPU。超級計算機將多個處理單元集中在一起減少任務劍通信延遲,云計算要跨越不同計算機,乃至跨越不同機房進行協(xié)同計算,存在任務間通信延遲。
超級計算機更適合密集型計算場景,比如武器研發(fā)、飛行模擬、氣候模擬、生育模擬和基因測序。不過從阿里云與華大基因、氣象局合作可以看出,就算是密集型計算云計算依然有用武之地。超級計算機如果能夠完成云計算的任務自然不應該被替換,不過它有著幾個顯著的曲線:成本和能耗。天河二號總造價成本便高達18億元人民幣,在滿載情況下,天河二號每天耗費是40萬人民幣,考慮到超級計算機通常負載率不會超過60%,通常耗費還相應降低。如果再加上軟件研發(fā)和升級、硬件維護和折舊、研發(fā)團隊人力成本這些,年運轉成本將十分可觀。因此,往往只有政府支持的實驗室才肯投入超級計算機研究,實際上TOP10超級計算機幾乎都來自政府或高校背景實驗室,只有少數(shù)是IBM這樣的企業(yè)參與。
百度為何做超級計算機Minwa?
網(wǎng)上曾經(jīng)出現(xiàn)過一篇《為跑分而生的超級計算機》,質疑超級計算機的投入產(chǎn)出比太高,人們對我國是否應該繼續(xù)投入超級計算機莫衷一是。現(xiàn)在百度卻高調進入這個領域,確實讓人覺得有些意料之外,畢竟百度在云計算上已經(jīng)投入巨大并且做得很好了。它在陽泉建立了亞洲最大數(shù)據(jù)中心,在GPU計算、綠色計算上都取得了領先。能夠證明其計算實力的還有兩點,一個是百度大腦,這是一個人工智能引擎,李彥宏曾對外表示它已具備3歲小孩智力,底層驅動正是百度云計算平臺;另一個是百度大數(shù)據(jù)引擎,這是全球首個開放式大數(shù)據(jù)引擎,百度已將它的大數(shù)據(jù)處理能力開放出來。
百度在大力投入云計算的同時投資超級計算機,自然不是為了前面所說的“跑分”,進入全球第7、很難做到第1,與天河2號競爭這不符合百度的風格和利益。我認為有以下幾個原因促使百度進入超級計算機:
1、科研的需要。超級計算機在商用上還缺乏有說服力的競爭力,不過在科研上它卻有著不可替代性,尤其是大規(guī)模、實時數(shù)據(jù)處理。百度在研發(fā)上投入力度前所未有,在中國同行中名列前茅,已連續(xù)6個季度增長率超過10%,其中很大部分放到了語音、圖像、大數(shù)據(jù)這些需要強大計算能力的技術上,有了超級計算機或許可以做得更好,正如開篇所提,百度在人工智能基準測試取得全球最佳成績正是基于Minwa。這些技術最終目標是要讓百度的產(chǎn)品尤其是移動搜索,變得更加智能,而百度已立志成為一家人工智能公司。
2、技術的突破。人們在過去太過于關心超級計算機的運算能力這樣的指標,對于它的能耗、成本卻鮮有關注,同時也一直沒有太大的突破。百度的超級計算機Minwa很可能是基于GPU計算,這比CPU更節(jié)能,且計算能力更強——只是對計算任務有所要求,它更適合圖像處理。百度此前已在陽泉數(shù)據(jù)中心采取GPU計算,百度首席科學家吳恩達(Andrew Ng)是人工智能領域的權威學者,他在一個實驗后的結論是,三臺服務器共裝了12個GPU就可以達到12 萬億次/秒的運算能力,遠遠超過谷歌1000節(jié)點CPU群的運算能力。因此,百度下一代超級計算機很可能采取了GPU計算,進而在能耗和成本上有所突破。英偉達早在2011年就表示將會使用自己的高端GPU和新的GPU+ARM芯片在西班牙制造一臺新的超級計算機。
3、超級云計算。將普通服務器組合成集群的云計算平臺可以與一臺超級計算機實力相當,倘若將超級計算機連接起來構成集群,計算能力則會指數(shù)級增長。這看上去還有些癡人說夢,不過未來超級計算機組網(wǎng)進行計算,形成超級計算機集群,超級云計算平臺應該是必然結局。百度如果要大力發(fā)展云計算和大數(shù)據(jù)技術,很可能會進行這類方向上的嘗試,不過這得擁有自己的超級計算機。
4、客戶的需求。百度已推出大數(shù)據(jù)引擎旨在為第三方開發(fā)者尤其是大中型企業(yè)提供大數(shù)據(jù)處理服務,同時百度還有PaaS形態(tài)的云計算平臺。它的一些潛在客戶,比如華大基因、中國氣象局、動漫企業(yè)等等很可能有需要超級計算機才能完成的計算需求,百度擁有自己的超級計算機并將之與云計算平臺集成將可以滿足所有計算需求。天河1號在2011年將嘗試過通過云計算平臺將冗余計算能力開放出來做動漫渲染。
最后,不得不用那句俗套的話來總結本文:意料之外,情理之中,這可以回答百度為何要做超級計算機這個問題。