9月23日,由企業(yè)網(wǎng)D1Net、信眾智(CIO智力輸出及社交平臺)和中國企業(yè)數(shù)字化聯(lián)盟共同主辦的2023北京部委央企及大型企業(yè)CIO年會(秋季)在京順利閉幕。本次大會匯聚了央國企部委及大中型企業(yè)CIO、信息主管以及數(shù)字化一線廠商,以“數(shù)字化轉(zhuǎn)型”為主題,圍繞大模型、多元算力、國產(chǎn)化智慧辦公、RPA、低代碼、數(shù)據(jù)資產(chǎn)管理、數(shù)字資產(chǎn)保值增值、數(shù)字安全和數(shù)據(jù)安全治理,央國企數(shù)字化轉(zhuǎn)型場景、轉(zhuǎn)型探索與實踐等熱門議題展開深入探討。
浪潮信息集團客戶部首席解決方案架構(gòu)師王寶偉在本次大會上分享的主題為“數(shù)智企業(yè),共創(chuàng)多元算力世界”。以下是現(xiàn)場速記。
浪潮信息集團客戶部首席解決方案架構(gòu)師王寶偉
王寶偉:各位領(lǐng)導(dǎo),大家早上好!先自我介紹一下,我是浪潮信息解決方案架構(gòu)師王寶偉,很高興今天有此機會向各位領(lǐng)導(dǎo)匯報我們浪潮信息在企業(yè)信息化數(shù)智化過程中一些認(rèn)識。今天我要分享主題是“數(shù)智企業(yè),共創(chuàng)多元算力世界”。
接下來我們看一下無處不在的計算。
今天我們在工作、生活、娛樂,各個領(lǐng)域可以說計算是無處不在的。比如我們打開手機看股票的時候,當(dāng)我們開車在路上去查詢路線看導(dǎo)航的時候,當(dāng)我們進入辦公室去刷臉考勤的時候,我們坐在辦公桌前,我們?nèi)?chuàng)建文檔,制作演示文稿,管理郵件進行數(shù)據(jù)分析的時候。當(dāng)我們在生產(chǎn)領(lǐng)域,我們?nèi)ナ褂肅AD、CAM這些計算機輔助軟件去完善我們產(chǎn)品設(shè)計和計算過程的時候,這一切都是由計算在完成的。
在人工智能和大數(shù)據(jù)、物聯(lián)網(wǎng),云計算新技術(shù)的驅(qū)動下,數(shù)字經(jīng)濟得以快速的發(fā)展,不僅在量上得到增長,而且在質(zhì)上也在不斷地創(chuàng)新和優(yōu)化。計算力是什么?是指對數(shù)據(jù)分析獲取信息的能力,而這種能力在當(dāng)今數(shù)字經(jīng)濟時代是一種關(guān)鍵的生產(chǎn)要素,既然提到了生產(chǎn)要素也就是生產(chǎn)力,所以我們就提到了生產(chǎn)關(guān)系。所謂生產(chǎn)關(guān)系的改變,比如說我們現(xiàn)在對我們的影響,每個人都深受影響。比如我們?nèi)c外賣,以前你很難點外賣,你要打電話去點外賣,現(xiàn)在我們通過美團就可以了。我們今天來開會的時候,在路上只需打開滴滴叫個車就OK了,而以前我們需要去路邊招手叫出租車,現(xiàn)在可以網(wǎng)約車,能夠享受更好的服務(wù)。
據(jù)統(tǒng)計,計算力的投入每增加1元會帶動3到4元的GDP的增長,考慮GDP總量增長來看,算力投入對于增長是相對顯著的。計算力每平均增長1個點,數(shù)字經(jīng)濟會增長3.5%,而對GDP來說會增長1.8%。中國的算力水平目前來說在全球是領(lǐng)先的,我們的算力增長水平是13.5%,是我們當(dāng)前主要的驅(qū)動力。
AI算力目前在國內(nèi)來說也是達到了處于領(lǐng)跑全球,我們在過去五年15個AI算力國家的支出當(dāng)中,接近60%來自我們中國。
前面講了我們有各種應(yīng)用,這些應(yīng)用給我們工作和生活帶來了便利。而每個應(yīng)用背后都有一個強大的服務(wù)平臺作為算力的支撐。這些算力從哪來?很顯然就是由基礎(chǔ)算力的提供者也就是我們的CPU芯片,而在計算機行業(yè)流傳三個定律:摩爾定律、登納德等比率縮放定律還有安迪比爾定律。
從70年代一直到2000年一直處于斜率是非常好的,到2002年之后摩爾定律和登納德等比率縮放定律開始逐漸失效,計算機性能提升開始放緩,意味著我們不能再單純的通過提升硬件的性能來滿足日益增長的算力的需求。而同時安迪比爾定律,英特爾所能提供的算力都被windows拿走了,也就是這個一直存在,并沒有發(fā)生變化,這就對我們的計算來說出現(xiàn)了非常大的供需不平衡。
我們怎么解決這個問題?這是一個懸念。先放一放。
接下來看前面的問題,而實際上我們這個智能制造,我們說中國制造2025主要指的就是智能制造,它更加關(guān)注數(shù)字化、網(wǎng)絡(luò)化和智能化。我們要實現(xiàn)柔性的制造、高效和定制化生產(chǎn),對我們制造過程進行智能化升級,提高我們的生產(chǎn)率,降低生產(chǎn)成本,提升我們產(chǎn)品品質(zhì)和我們的服務(wù)水平。這些新技術(shù)的應(yīng)用促使我們數(shù)據(jù)中心發(fā)生爆炸式的增長。
這是IDC報告里面找到的,2025年我們?nèi)驍?shù)據(jù)中心的算力規(guī)模將達到6381億EFLOPS比2020年將近翻了30倍,而我國數(shù)據(jù)中心建設(shè)規(guī)模從2019年到2025年數(shù)據(jù)中心規(guī)模復(fù)合增長率也高達24.6%。再看當(dāng)前的AI,我們知道機器視覺從2012年開始,2014年正式商用,人臉識別開始變得成熟。從2012年開始一直到2022年,AI模型的算力需求每隔三到四個月就會翻一倍。
前面講到我們有強大的算力需求以及我們前面有矛盾,而隨著年初ChatGDP爆火,大模型訓(xùn)練也井噴式的發(fā)展,更有大戰(zhàn)的勢頭。隨著人工智能和深度學(xué)習(xí)的發(fā)展,大模型的應(yīng)用會越來越廣泛,這在一定程度上也加劇了算力資源不足的問題,也就對應(yīng)著摩爾定律事項在后摩爾定律時代需要大量計算模型和存儲空間,這使得供需之間矛盾進一步加劇。
大模型促進了算法,同時也促進算力多樣化的需求。不同的應(yīng)用場景,不同的計算方式,因此不同類型的算力來滿足不同的需求。比如說在大模型的訓(xùn)練階段,主要進行模型的訓(xùn)練需要大量的數(shù)據(jù),涉及計算量是非常大的。比如矩陣乘法、卷積運算需要高速CPU和GPU以及充足的內(nèi)存和存儲空間來提供數(shù)據(jù)存儲和做數(shù)據(jù)推理。以分類和檢測、識別任務(wù),這個階段需要的算力相對少,不過它對延時又提出新的需求,需要計算低延時,這時候就需要專用的芯片對人工智能推理進行優(yōu)化。此外,推理過程中還需要高速網(wǎng)絡(luò)和存儲資源。 我們當(dāng)前面對的大模型的算力不足,同時又促進了我們算力的多樣化。
接下來要分享的是多元算力的解決方案,怎樣解決前面遇到的問題?算力不足以及算力多樣化的需求。
前面提到算力不足之后,針對前面的需求,浪潮信息作為全球領(lǐng)先的算力基礎(chǔ)方案和服務(wù)提供商,我們以系統(tǒng)設(shè)計為中心,建立多元算力融合,軟硬件協(xié)同優(yōu)化的技術(shù)發(fā)展路線,針對業(yè)務(wù)場景提供多樣化的算力解決方案。通過對特定的應(yīng)用進行優(yōu)化,解決咱們算力不足的問題。
一般我們把企業(yè)信息化的系統(tǒng)簡單分為綜合的辦公系統(tǒng),比如OA、郵件,也就是經(jīng)營管理即CRM、財務(wù)、生產(chǎn)運營系統(tǒng)(MES)以及科研管理系統(tǒng),為了更好的滿足不同業(yè)務(wù)場景的需求,算力多樣化它是一種必然趨勢。比如咱們說的財務(wù)系統(tǒng)里,它對計算需求要求是高穩(wěn)定、高可靠、高安全,它對數(shù)據(jù)來說是有強一致性的要求。而在咱們科研仿真領(lǐng)域?qū)τ诟↑c計算有極高要求,這時候只有AI算力才能滿足需求,而在生產(chǎn)質(zhì)檢過程當(dāng)中,因為我們的流水線是不能停的,所以它對實時性也提出要求。所以我們在解決這個問題時候就需要通過邊緣計算的方式才能支撐滿足我們的業(yè)務(wù)需求。
計算的多樣化,算力的多元化是當(dāng)前數(shù)字化時代我們企業(yè)構(gòu)建數(shù)據(jù)中心的一個必然選擇,它為不同的業(yè)務(wù)場景更加靈活的需求,有助于推動數(shù)字化轉(zhuǎn)型和創(chuàng)新發(fā)展。
前面講了我們算力的多元化,業(yè)務(wù)的多樣化以及到算力的多元化。在多元化的基礎(chǔ)上,我們還要做的是對特定領(lǐng)域的算力資源進行專業(yè)的優(yōu)化。為了方便大家理解,我們對CPU和GPU進行簡單的介紹。
這是十四年前英偉達發(fā)布的一個視頻,我想很好的解釋了我們CPU和GPU之間的差距。
(視頻播放)
大家可以看到這個CPU跟GPU由于它的架構(gòu)設(shè)計的不同,在我們實際使用過程當(dāng)中這個差距是非常明顯的,因為CPU相對是通用的計算,它能夠處理各種不同的任務(wù),通過順序執(zhí)行這個指令來完成計算任務(wù)。而GPU在設(shè)計之初就是為圖形處理做并行計算,它里面通過高效大規(guī)模的并行計算對圖像進行渲染和設(shè)計。前幾天我在家里面做過一個實驗,我在做語言識別測試的時候,我就用我的電腦i511代CPU我去算只是一分鐘的MP3音頻,然后我用I5去做語音轉(zhuǎn)成文字,竟然用了40多分鐘。而我放到英偉達的公有云上去做同樣的模型,不到一秒的時間,一分鐘的音頻就出來了。我這個測試,大家感覺不明顯,哪怕我用一個小時的音頻,如果我放到公有云上,通過GPU去算的話,這個也是非常快的,它也不會超過十幾秒的時間。
所以我們很直觀的感受CPU和GPU之間,他們所擅長的領(lǐng)域是不同的。針對特定領(lǐng)域進行專業(yè)優(yōu)化的算力資源,在我們構(gòu)建企業(yè)智算中心的時候一個必然的選擇。
前面講到我們對于算力特定的優(yōu)化,另外我們回到站在系統(tǒng)的視角,這些年我們大家深有體會,如果說告訴你這臺服務(wù)器的CPU我們就大致能評估出這臺服務(wù)器它的能力水平會是什么樣的。比如我說一個智強的處理器比如6230,我們大概能猜出來,通過它的CPU核數(shù)、它的主頻,它能引出多少的PCIE,PCIE的帶寬以及它是幾代,我們就能評估出大致的計算能力。
多年來浪潮信息一直思考這樣的問題,有沒有一種方法可以改變這種以CPU為中心的計算系統(tǒng)的設(shè)計?經(jīng)過多年的不懈努力,我們終于找到了。也就在上個月8月14日OCT大會上,我們浪潮發(fā)布了面向未來的融合3.0架構(gòu)。
這里同樣是一個視頻,更直觀的讓各位領(lǐng)導(dǎo)來了解我們的產(chǎn)品。
(視頻播放)
在這種情況下我們可以得到全解耦的數(shù)據(jù)中心,計算單元和我們主機進行了解耦。我們可以看到在剛才的視頻演示過程當(dāng)中,我們是把內(nèi)存做了內(nèi)存的盒子,所有的我們CPU可以不是一個型號或者一個類型的CPU,我們可以做到不同技術(shù)路線的CPU放在一個計算系統(tǒng)里面來。就像這張圖,X86通過共享內(nèi)存池的方式解決以往以CPU為中心,以AI訓(xùn)練為例,我們在做訓(xùn)練的時候我們的數(shù)據(jù)需要從硬盤讀出來寫到內(nèi)存,然后再到我們CPU,CPU把數(shù)據(jù)搬到GPU計算完之后再搬回我們的硬盤,當(dāng)這臺設(shè)備處理完會通過網(wǎng)絡(luò)給到下一臺設(shè)備。我們CPU在持續(xù)讀取數(shù)據(jù)形成大量并發(fā)的IO,GPU始終都在計算,數(shù)據(jù)在不同的內(nèi)存和硬盤之間進行多次數(shù)據(jù)的搬遷。而我們改變思路之后,以內(nèi)存為連接的核心,構(gòu)建一個內(nèi)存池,讓我們CPU、GPU甚至不同架構(gòu)的CPU共享內(nèi)存,這就是我們浪潮能給出的應(yīng)對算力不足的解決方案。
我們前面解決了算力不足的問題,接下來我們要聊的是對算力的管理。也就是說我們需要一個統(tǒng)一的多元算力資源的管理平臺或者管理框架。對多種類型的計算資源進行管理和優(yōu)化,這種調(diào)度可以發(fā)生在不同層次或者不同的力度上,比如對計算任務(wù)或者計算節(jié)點或者我們的某一個核或者內(nèi)存,在這之間進行調(diào)度,統(tǒng)一多元算力調(diào)度目的是為了提高資源效率,降低能耗,提高系統(tǒng)的整體穩(wěn)定性。通過集中管理和調(diào)度可以避免資源的浪費和沖突,可以根據(jù)任務(wù)和我們資源進行特定的優(yōu)化,使我們的整體性能達到最高。
前面講完了我們對算力的管理,算力不足問題解決之后,還有一點就是我們的綠色算力的需求。智算中心的建設(shè)要面臨雙碳目標(biāo)的挑戰(zhàn),首先智算中心要滿足企業(yè)自身信息化、數(shù)字化的發(fā)展需求,擴大算力服務(wù)范圍,讓我們所建的智算中心更有意義。其次智算中心要減少碳排放,這是建設(shè)者也要考慮的問題。
2021年時財政部和生態(tài)環(huán)境部多個部委聯(lián)合下發(fā)了文要求大型數(shù)據(jù)中心建設(shè)PUE值要小于1.3,這是政策要求。另外再算一筆經(jīng)濟賬,以12千瓦機柜的能耗來算,一年將近有1200萬的支出,如果我們把能耗降低15%,每年能節(jié)省將近200萬,有沒有方案?只需要我們把傳統(tǒng)的風(fēng)冷換成我們的液冷就可以很好地解決這樣的問題。
前面講到我們浪潮信息對算力不足以及算力多樣化需求的解決方案,我們要做到算力整體平衡。根據(jù)業(yè)務(wù)需求平衡多種算力資源,平衡信創(chuàng)算力的選擇,通過算力硬件解決算力不足的問題。經(jīng)過多年努力,浪潮信息在計算領(lǐng)域也取得了一些成績,在此感謝在座的各位客戶、合作伙伴對浪潮的支持與認(rèn)可。最后誠邀各位專家蒞臨、指導(dǎo)浪潮!
關(guān)于企業(yè)網(wǎng)D1net(hfnxjk.com):
國內(nèi)主流的to B IT門戶,同時在運營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。同時運營19個IT行業(yè)公眾號(微信搜索D1net即可關(guān)注)。