NEWS專欄 | 未來3年，智能算力將順著這條路徑發(fā)展

責(zé)任編輯：yang |來源：企業(yè)網(wǎng)D1Net 2023-11-07 16:09:58 本文摘自：CIO時代網(wǎng)

NEWS專欄引讀：
生成式AI將為全世界新創(chuàng)造“一個英國的GDP”，而國內(nèi)大語言模型爭先恐后地推出，也說明中國將在這場生成式AI變革中占據(jù)自己應(yīng)有的位置。因此，推動生成式AI發(fā)展的算力基礎(chǔ)設(shè)施，也就必須保持在高水平之上。而建設(shè)生成式AI算力支撐的難點，在于要在許多基本技術(shù)原理被重新改寫的情況下提前進行，在這方面，作為生成式AI應(yīng)用的先行者，北美數(shù)據(jù)中心市場已經(jīng)出現(xiàn)了數(shù)據(jù)中心容量供需失衡的情況。
《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》為智能算力未來3年的發(fā)展確定了綱要，但如何確定生成式AI算力支撐的提前量，還需要各位CIO根據(jù)自己企業(yè)與行業(yè)的發(fā)展現(xiàn)狀，做出精準(zhǔn)的判斷。從北美市場的情況來看，人工智能將進一步加速數(shù)據(jù)中心的需求，所以針對這個問題的解決措施，需要從現(xiàn)在開始立即推出。
工業(yè)和信息化部、中央網(wǎng)信辦、教育部、國家衛(wèi)生健康委、中國人民銀行、國務(wù)院國資委等六部門近日聯(lián)合印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》（下稱：行動計劃），業(yè)界認為這份行動度劃指明了未來3年算力基礎(chǔ)設(shè)施的發(fā)展方向。雖然行動計劃面向智能計算、邊緣計算、超級計算等多種算力需求，但其中特別提到2025年智能算力占比要達到35%。針對當(dāng)前智能算力支撐所面臨的問題，行動計劃可謂是提前給出了應(yīng)對之策。

生成式AI的潛力

ChatGPT問世以來，生成式人工智能的經(jīng)濟潛力越來越被關(guān)注。麥肯錫在《生成式人工智能的經(jīng)濟潛力：下一波生產(chǎn)力浪潮》報告中指出，如果將分析的63種生成式AI應(yīng)用于各行各業(yè)，將為全球經(jīng)濟每年帶來2.6萬億至4.4萬億美元的增長。與英國2021年的GDP總額3.1萬億美元對比，生成式AI可能每年為全球經(jīng)濟貢獻“一個英國的GDP”，由此可見生成式AI所具備的巨大潛力。
從生成式AI具體應(yīng)用情況來看，調(diào)查顯示，使用生成式AI助手，企業(yè)不僅可以多完成12.2%的任務(wù)，還能將速度提升25.1%，同時工作結(jié)果的質(zhì)量也因此而提升40%。再從技術(shù)發(fā)展角度來看，下一代大型語言模型將比目前的GPT-4(OpenAI)、Palm 2(Google)、Llama(Meta)和Claude 2(Anthropic)更復(fù)雜、更通用。因此，一場圍繞著生態(tài)為核心的大語言模型之間的競爭已經(jīng)展開。
從生態(tài)的角度來看，決定著生成式AI能否發(fā)揮出巨大潛力的，是生態(tài)的強弱，而決定生態(tài)能否最終勝出的因素是應(yīng)用。本次行動計劃有四個主要目標(biāo)，其中之一就是針對這個問題的應(yīng)用賦能。力圖打造一批算力新業(yè)務(wù)、新模式、新業(yè)態(tài)，在工業(yè)、金融等領(lǐng)域算力滲透率顯著提升，醫(yī)療、交通等領(lǐng)域應(yīng)用實現(xiàn)規(guī)模化復(fù)制推廣，能源、教育等領(lǐng)域應(yīng)用范圍進一步擴大。每個重點領(lǐng)域打造30個以上應(yīng)用標(biāo)桿。概括起來，就是通過一體化算力服務(wù)體系的構(gòu)建，實現(xiàn)“算力+工業(yè)”、“算力+教育”、“算力+金融”、“算力+交通”、“算力+醫(yī)療”、“算力+能源”的多行業(yè)算力補強。這將對生成式AI在這些行業(yè)的應(yīng)用起到極大的助力作用。

三個難題的解決之策

當(dāng)生成式AI在算法層面取得大舉突破之時，生成式AI的研發(fā)和應(yīng)用卻可能遭遇算力瓶頸。算力是集信息計算力、網(wǎng)絡(luò)運載力、數(shù)據(jù)存儲力于一體的新型生產(chǎn)力，生成式AI所需的算力支撐，在計算力、運載力、存儲力都和傳統(tǒng)應(yīng)用有所不同，因而在這三個層面都面臨著難題。
在計算力層面，傳統(tǒng)應(yīng)用的算力支撐更多地依靠CPU，而AI所需的智能算力在CPU之外，還需要大量GPU以及如ASICs和FPGAs等專用硬件參與。此外，用于人工智能的機架必須重新設(shè)計，以適應(yīng)額外的重量和熱量。因此，智能計算的數(shù)據(jù)中心建設(shè)因此而呈現(xiàn)出高密化趨勢，并需要通過異構(gòu)計算來突破算力瓶頸。
在網(wǎng)絡(luò)層面，大模型AI場景下海量的參數(shù)分布于多個服務(wù)器的多個GPU之上，由于需要用到成千上萬個GPU來訓(xùn)練數(shù)十TB級甚至更大的數(shù)據(jù)集，大量的GPU之間的通信容易出現(xiàn)由于網(wǎng)絡(luò)HASH負載分擔(dān)不均而導(dǎo)致的網(wǎng)絡(luò)吞吐下降，從而引發(fā)AI訓(xùn)練性能整體下降等問題。
在存儲層面，由于大語言模型的訓(xùn)練參數(shù)越來越多，因此智能算力可能面臨著幾十T數(shù)據(jù)的存儲和應(yīng)用，還必須實現(xiàn)高速存儲訪問，以滿足人工智能工作訓(xùn)練和推理所需。
針對這些問題，行動計劃給出了未來3年算力基礎(chǔ)設(shè)施發(fā)展的具體目標(biāo)。其中，在計算力方面，算力規(guī)模超過300EFLOPS，智能算力占比達到35%。在運載力（網(wǎng)絡(luò)）方面，國家樞紐節(jié)點數(shù)據(jù)中心集群間基本實現(xiàn)不高于理論時延1.5倍的直連網(wǎng)絡(luò)傳輸，重點應(yīng)用場所光傳送網(wǎng)（OTN）覆蓋率達到80%，骨干網(wǎng)、城域網(wǎng)全面支持IPv6，SRv6等新技術(shù)使用占比達到40%。在存儲力方面，存儲總量超過1800EB，先進存儲容量占比達到30%以上。

更為重要的，行動計劃從全局的高度出發(fā)，對于算力均衡發(fā)展進行了統(tǒng)籌。不僅優(yōu)化算力設(shè)施建設(shè)布局、推動算力結(jié)構(gòu)多元配置、推動算力標(biāo)準(zhǔn)體系建設(shè)，還通過優(yōu)化算力高效運載質(zhì)量、強化算力接入網(wǎng)絡(luò)能力、提升樞紐網(wǎng)絡(luò)傳輸效率、探索算力協(xié)同調(diào)度機制，提升了算力高效運載能力。這為生成式AI應(yīng)用的爆發(fā)奠定了基礎(chǔ)。

算力的可持續(xù)之道

數(shù)據(jù)中心在2022年使用的電力已達到200T瓦時，這一電量已經(jīng)占到全球電力使用量的2%。預(yù)計到2030年，全球數(shù)據(jù)中心耗費的電量將占到全球總電量的5%，達到576T瓦時，這個數(shù)字將會超過韓國、加拿大或德國的單個國家用電量。生成式AI的崛起使得能耗問題變得更加嚴(yán)峻。
由于AI所需的智能計算需要GPU驅(qū)動的機架，與同等CPU容量相比，它會消耗更多電量、散發(fā)更多熱量并占用更多空間。這就意味著人工智能計算能力通常需要更多的電源連接或替代冷卻系統(tǒng)。為此，為了保障智能算力的可持續(xù)發(fā)展，包括高壓直流、預(yù)制化、液冷、自然冷卻等新一代綠色技術(shù)已經(jīng)逐漸走向數(shù)據(jù)中心。
行動計劃同樣關(guān)注到了這個問題，在基本原則中就強調(diào)了綠色低碳，在促進綠色低碳算力發(fā)展方面，通過提升資源利用和算力碳效水平、引導(dǎo)市場應(yīng)用綠色低碳算力、賦能行業(yè)綠色低碳轉(zhuǎn)型，力求全面提升算力設(shè)施能源利用效率和算力碳效（CEPS）水平。推動了算力在重點行業(yè)發(fā)揮應(yīng)用賦能作用，促進了企業(yè)經(jīng)營活動數(shù)智化發(fā)展，通過構(gòu)建“算力+”綠色低碳生態(tài)體系，助力各行業(yè)綠色低碳發(fā)展，這為智能算力的可持續(xù)發(fā)展提供了必要的保障條件。
未來3年內(nèi)，通過加強統(tǒng)籌聯(lián)動、加大金融支持、深化交流協(xié)作、強化平臺支撐，《行動計劃》的落地實施最終將為智能算力的發(fā)展提供保障，也將為生成式AI的發(fā)展和應(yīng)用奠定堅實的基礎(chǔ)。

關(guān)鍵字：發(fā)展智能未來