最近,我刷到一張圖,看完腦瓜子嗡嗡的。
它,小小一顆,冷靜內斂,卻有力量!
這是一顆被稱為DPU的數據處理芯片,數智時代的核心芯片之一,速度飚到400Gbps,國內領先,堪稱芯片界的超跑!
最終,還是被“國家隊”搞出來了!
這顆芯片的相關消息,是從剛剛落幕的「2024中國移動算力網絡大會上」 爆出來的!100% 真實!
我忍不住好奇起來:除了這顆芯片外,以中國移動為代表的“國家隊”,這些年在五大核心技術上(芯片、計算、存儲、網絡、數據庫), 有哪些突破?在業界處于什么水平?
這五大技術可以看作是IT領域的基石,每一樣拿出來都能“卡脖子”。
于是,我再次回看這屆大會,發現了不少“線索”。
原來,近幾年,在公眾視線之外,中國移動靠著一股自主創新研發的狠勁,悶頭把這五座高峰,輪番爬了一遍。
今天我們就來扒一扒,到底有哪些突破?↓
一、芯片的突破
DPU是數智化時代的核心芯片之一,必須拿下!
未來數據中心的標配是【CPU+GPU+DPU】,CPU 負責通用計算,GPU 負責AI 加速計算,DPU 則專注于數據處理。
DPU如同數據中心里的“快遞員”。
不僅跑得飛快(擁有高速數據處理能力),還特別擅長打包(數據壓縮)、加密(確保安全)、分類(數據篩選)以及高效配送(數據傳輸)。
于是,中國移動聯合產業鏈共同打造出一款中國芯:大云磐石DPU。
這款芯片到底啥水平?
帶寬達到 400Gbps,論性能,算是王炸級別!
“磐石”不止有DPU,還有服務器,中國移動一鼓作氣推出了「大云磐石服務器」,其中就搭載了這顆DPU!
有人說,大云磐石服務器就像是“海王”,一機多芯,能搭載四種不同品牌的CPU。
“變芯”麻煩嗎?嘿嘿,相當簡單!
只需通過更換計算板即可平滑完成平臺切換,磐石服務器內部構件都極為標準化和模塊化,方便國產化替換、零部件能復用,成本可控。
最終,多芯異構下的磐石服務器,就成了數據中心中最狠的那個“角兒”了!
扛起各種狠活、大活兒,不在話下!
二、算力架構的突破
先看一條炸裂新聞↓
NEWS:
4 月 28 日消息,中國移動宣布全球運營商最大單體智算中心 ——中國移動智算中心(呼和浩特)目前已投產使用。
該中心入選“2023年度央企十大超級工程”,支持萬張 AI加速卡互聯并行訓練,部署約 2 萬張 AI 加速卡, AI 芯片國產化率超 85%,智能算力規模高達 6.7EFLOPS。
萬卡集群,如何調度?如何激發其最強戰斗力?
移動云自研了超大規模高性能的異構計算架構——大云COCA2.0, 能夠操控不同處理器(CPU、GPU、NPU),為不同計算任務匹配最佳算力資源。
大云COCA2.0是異構計算架構,包含三大核心模塊(DPU、GPU、HPN),同時支持多種指令集的CPU(X86、ARM等)。
由此,移動云完整的計算能力體系展現出來:底層是國產化磐石算網原生硬件,中間是自研的大云COCA異構計算架構,上層是自主可控的新一代云計算產品。
底座堅如“磐石”,大云COCA軟硬協同,云產品托起百業千行。
三、存儲的突破
在存儲這塊兒,移動云發布了大云天權存儲2.0創新技術和企業級數據湖存儲產品。
「大云天權存儲2.0」包含一系列存儲創新技術,其中,移動云存儲團隊自主研發的新一代全閃存儲引擎,成為構建移動云先進存力的基石。
這塊“基石”,面向多協議、百萬級IO、EB級規模設計,統一存儲架構,全面支撐起移動云上各項存儲產品和服務。
為了飆到極致性能,“天權2.0”采用了端到端RDMA和全用戶態技術棧,消除額外開銷,單路時延低至150μs,端到端吞吐突破4GB/s。
面對當前AI大模型對高性能文件存儲的需求,移動云依托自研「天權存儲2.0」的創新能力,讓文件存儲的能力再次飛躍,支持百GB/s帶寬吞吐,大模型訓練快照秒級加載。
同時,通過自研數據鏈接(Bucket-link)技術,實現對象存儲和文件存儲間的數據高效流轉。
這種能力不僅提升了大模型訓推場景的文件流轉效率,對于數據備份、數據遷移、跨區域數據共享等場景,也有巨大提升。
移動云文件存儲系列在智算實戰中,海量小文件OPS可達數十萬級。
同時通過客戶端緩存能力,多輪epoch訓練數據加載性能提升5倍,成為大模型訓練、推理的首選存儲類型。
此外,移動云還發布了企業級數據湖存儲產品。
該產品基于存算分離架構,內置數據加速引擎,通過緩存加速來支持各種計算任務,提升數據湖存儲的性能,從而幫助企業更高效的進行數據分析和處理,釋放數據價值。
四、網絡的突破
中國移動在網絡領域的突破,主打“算網一體化”,承載“通智邊端”多樣化算力,覆蓋入算、算內、算間多場景連接,滿足高可靠、低時延、大帶寬需求。
首先看全棧信創云網絡架構, 其核心是移動云新一代SDN。
作為整張云網絡的大腦,實現了業務面、參數面一體化管控,智算、通算一體化納管,萬卡集群多租戶隔離,公有云、私有云、專屬云、智算云架構歸一。
同時,SDN全部組件已完成國產化適配,支持國產網絡芯片可編程,支持開放白盒,保障供應鏈安全。
移動云構建了彈性開放的NFV平臺, 支持功能豐富的云原生網元,單實例百G吞吐,秒級擴縮容。
并且開放標準接口,支持第三方網元接入(FW、WAF等),功能更豐富。
在這其中,為了提高虛擬網絡轉發性能,基于磐石服務器+磐石DPU,移動云研發了遵循COCA架構高性能網關(vRouter),單設備吞吐>600Gbps,芯片轉發時延<3μs。
面向智算集群對高性能、低延遲網絡的需求,移動云推出了磐石智算交換機, 這是運營商領域首款51.2T高性能交換機,支持大規模萬卡集群組網。
不僅如此,為進一步優化智算網絡、降低GPU空載等待時間,移動云還研發了端網一體全自適應路由協議, 并主導IETF國際標準協議FARE(即全自適應路由以太網)。
交換機側和智能網卡側協同,采用“包噴灑”技術+亂序重排,實現逐包(per-packet)全局負載均衡,全面提升鏈路利用率。
最后,面向算網融合、多云協同場景,移動云又拿出了業界首個異構多算力互聯產品, 為用戶提供靈活入算、算力互聯、按需彈性、差異化的網絡服務。
五、數據庫的突破
移動云自研了新一代云原生數據庫, 包含三種產品形態:集中式、分布式、分析型。
集中式云原生數據庫,好比“中央金庫”,采用四元解耦架構,突破單機瓶頸,支持存算一體和存算分離雙形態。
分布式云原生數據庫,就像各地“分行”,實現應用無限擴展,全局事務強一致,金融級保障客戶服務在線。
而分析型云原生數據庫,像給客戶請了個“精算師”。支持數據實時分析,使用0-ETL一鍵入倉,打造企業級數倉。
一圈扒下來,越扒越驚喜。
沒想到,中國移動悄悄地爬過了一山又一山,五座高峰全部登頂!
登頂之后的中國移動,毫不懈怠,繼續堅持自主創新的發展戰略,為各行各業的數字化轉型提供強有力的技術支撐。
寫這篇文章時恰值517世界電信日,而今年電信日的主題為“數字創新促進可持續發展”。
這就好像是為中國移動量身定制的攀登背書,技術創新,自研為王,攻堅克難,志在巔峰…
突然間,畫面感很強!