近一兩年來,大禹智芯在專注于做DPU產品研發的同時,也接觸了很多企業客戶,與客戶做深入合作交流的過程讓我們有更多機會切身了解到他們在使用DPU過程中面臨的挑戰,以及思考DPU如何才能發揮真正的價值。大禹智芯借鑒或參考客戶給予的反饋,也不斷對產品規劃和技術實現路線進行更加貼合客戶實際需求的調整。
一直以來,大禹智芯從未停止過思考如何用DPU幫助企業打破技術壁壘以滿足業務需求,以及如何解決企業在使用DPU過程中所遇到的實際問題,從而幫助客戶真正享受DPU在基礎設施層面發揮的技術紅利。這些思考也正推動著大禹智芯更好地對產品進行定義和研發以及對解決方案的打磨。今天將這些思考分享給大家,希望對大家有一些啟發和幫助。
以下內容源自大禹智芯解決方案負責人余曦老師今年5月在蘇州DPU線下Meetup的分享。
大禹智芯成立于2020年,是國內最早一批專注于做 DPU產品和研發的科技初創公司,致力于向廣泛用戶提供包括芯片、硬件產品、系統軟件、應用集成等一整套圍繞DPU/智能網卡的軟硬件產品及服務。目前,大禹智芯已經推出了多款DPU產品。
大禹智芯以DPU作為基礎設施服務底座的產品化實現和解決方案的打造,是緊密圍繞云化裸金屬的形式來呈現的,這是由技術總體發展趨勢和路線決定的。云計算的發展初始是使用虛擬機,隨后在發現企業上云過程中面臨很多重載業務無法上云的問題,當時應對這種問題的方法有不少,有的是給用戶提供一臺物理機去承載那些重載業務,有的是采用虛擬機一虛一的方式供用戶承載相對較重的業務,這樣可以把一臺物理機性能最大化地釋放給虛擬機,但虛擬化所帶來的性能損失,導致仍然無法完全滿足重載應用的部署要求。隨著云計算的逐漸普及,為了滿足靈活性和可拓展性等需求,裸金屬云服務出現并得到廣泛應用,裸金屬是為了解決企業上云過程中的產品化問題。
為了滿足市場對運行效率,彈性及性能的不斷提升的要求,基于云化裸金屬狀態去做虛擬化和容器,可獲得比傳統模式更好的性能和更高的效率。云化裸金屬從原先的一種云計算產品形態,逐漸變為了云計算基礎設施服務的基座,基于此基座構建多種形式的算力服務輸出,是當前云計算發展的一個重要趨勢。
因此,大禹智芯的產品和服務緊密圍繞以云化裸金屬作為基座,把虛擬化的網絡、虛擬化存儲以及云管控平面全部放到 DPU 上實現,形成云化裸金屬狀態,基于此構建虛擬機和容器的服務,同時向上層提供三種服務能力。
首先,我們將傳統存算一體的HCI(Hyper Converged Infrastructure)結構向存算分離的CDI(Composable Disaggregated Infrastructure)結構轉變。在CDI 結構中,物理機上沒有本地存儲單元,即不存在任何物理介質盤,所有的物理介質是存在于數據中心內的云盤狀態資源池內。這個云盤為整個計算側節點提供通過網絡遠程訪問塊存儲的服務。通過DPU,將位于整個塊存儲服務上操作系統和數據拉到本地,在剝離網絡部分后向主機側暴露本地的塊存儲設備,對于本地應用或操作系統來說,所使用到的存儲均為“本地存儲,但實質上這是經過了一層網絡協議卸載或網絡處理來實現將網絡存儲轉換成本地存儲的,因為這部分工作是由DPU來“無感知”地完成的。
第二個就是虛擬網絡能力,包括物理機邏輯組上或者容器、虛擬機上運行應用,所使用的網絡接口全部由DPU來暴露,網絡接口在DPU上可呈現出多種豐富的overlay網絡能力。再基于此,我們實現了一系列虛擬機網絡高級功能,例如QoS、CT等。
接下來非常重要的是云平臺組件的卸載。隨著網絡功能和存儲功能從主機側下沉到DPU,跟網絡和存儲相關功能組件的控制單元也要隨之下沉。同時,計算資源管控也會有下沉到DPU的需求,大禹智芯也聯合合作伙伴通過DPU實現了這樣的功能。在4月21日上海舉辦的2023 openEuler開發者日,大禹智芯受邀與OpenInfra基金會、openEuler社區聯合對外發布了DPU無感卸載的Demo。在Demo呈現的演示環境中,主機側和DPU側分別運行著openEuler操作系統,利用openEuler自身在兩個操作系統后端的通路,將libvirtd虛擬化上計算側資源控制組件下沉到DPU上。虛擬機開通和銷毀等操作可全部在DPU上完成,不需要延伸到客戶的操作系統上去實現。如此一來,網絡存儲和計算側控制的完整上云組件可完全卸載至DPU,由DPU全權承載,通過DPU提供的額外算力單元(或算力組件)承載所有上云系統和實現上云組件的部署,同時還能夠保持DPU與上層主機側之間的隔離和獨立性。
基于以上特性,大禹智芯可通過DPU及配套組件為企業用戶提供快速搭建云化裸金屬平臺的服務。客戶可在構建的平臺上根據自己需求實現虛擬化或容器化工作,實現Anystack功能。這是目前大禹智芯做的存算分離架構的集中化體現。
而說到存算分離架構的優勢業界有目共睹也深有體會,這個架構對未來基礎設施層面結構的發展具有深遠影響。目前,國內眾多存儲廠商也正擁抱這個趨勢,逐漸向存算分離架構演進方向去更新迭代存儲產品。
存算分離架構中需要重點解決的問題是如何充分利用額外算力單元從而不過多占用計算側算力資源。這就是涉及到從計算側到存儲資源側的打通,DPU可以在當中作為紐帶將計算側的節點和存儲資源中的存儲資源單位建立有機連接,操作系統或數據均可放到遠端云盤體系之內,再按需通過DPU拉到本地提供給上層主機側使用。
這樣可帶來飛躍式優勢:一方面可真正實現存儲資源的彈性使用,并大幅提升存儲物理介質的利用率,提升投資回報率;另一方面,在遇到計算側界面的故障時可實現分鐘級的業務恢復,大幅度顯著提高企業用戶的運維效率。而在傳統存算一體架構中是要實現快速的業務恢復是非常困難的,因為數據、操作系統和應用都在本地,設備故障之后,需要找相同配置的設備把操作系統、數據和應用都分別恢復,這個過程往往對于業務感知來說是漫長和復雜的。
基于云化裸金屬方案,大禹智芯可助力企業級用戶實現虛擬云和容器云/云原生的應用。一方面,為傳統數據中心提供云化裸金屬服務能力,借助該服務傳統數據中心可搭建一套完整的裸金屬服務平臺,從而助力其提供比擬公有云部署方式和交互體驗的云服務,以滿足其客戶對IDC服務的更高服務需求。另一方面,對于擁有物理位置零散、物理配置不統一的眾多服務器,但希望高效統一納管這些服務器并快速上云的企業級用戶,大禹智芯云化裸金屬解決方案可提供物理機上云的一站式服務,通過DPU和管控平臺相結合,讓企業快速實現分散的物理服務器資源統一納管,實現中心與邊緣、新舊IT設備的整合,快速完成全面“上云”。
大禹智芯以交鑰匙模式向企業用戶提供完整的云化裸金屬服務,讓企業用戶簡單快捷地享受DPU技術紅利,更高效靈活搭建滿足自身業務需求的云平臺。
大禹智芯產品介紹
一、大禹智芯DPU產品
為滿足不同客戶及不同場景的DPU使用需求,大禹智芯堅持從貼近用戶需求的場景出發,遵循明確的產品規劃路線,提供Paratus系列DPU產品,目前已推出2個產品序列:
1.0序列產品——Paratus 1.0、Paratus 1.5
Paratus 1.0和Paratus 1.5是大禹智芯的第一款DPU產品。通過運行在ARM SoC上的Linux操作系統及DPDK、SPDK開發套件,用戶可將原先運行在主機側的功能方便的下沉到DPU上運行,實現主機側算力資源的釋放。基于相同的DPU開發運行環境,大禹智芯也提供了虛擬化網絡組件,存儲客戶端組件以及與開源云管平臺Openstack和Kubernetes集成所必要的相關組件。用戶通過Paratus1.0構建高性能的裸金屬云、虛擬機云及容器云等服務。Paratus 1.0可廣泛應用于公有云,邊緣云,企事業內部私有云及其他復雜網絡流量處理等場景。
2.0序列產品——Paratus 2.0
Paratus 2.0是大禹智芯在1.0序列產品基礎上,通過增加FPGA組件而打造的全新DPU產品。采用ARM SoC + FPGA的硬件架構,在保持了與第一款DPU產品相同的軟件開發運行環境的同時,提供了基于FPGA的網絡數據處理通路,大幅提升了網絡流量處理能力。
在此基礎上,Paratus 2.0還具有一些獨特的功能:大禹智芯自研高性能網絡協議HPRT™的實現可充分釋放RDMA應用的潛力;無感知端到端網絡數據加密功能可最大化保證數據網絡傳輸可靠性,其功能及性能均為業界領先水平;網絡上層應用行為分析功能可為網絡入侵行為判斷提供實時可靠的數據支撐。
二、大禹智芯裸金屬服務管理平臺
大禹智芯通過對數據中心基礎設施能力進一步分析與整合,針對企業上云過程中遇到的難點、痛點,與大禹智芯自研云管平臺相結合,推出完整的以DPU為底座的云化裸金屬方案,該方案面向廣泛行業用戶,加速企業自有IT系統上云進程,為企業數字化轉型提供基礎設施層服務支撐。
其中,大禹智芯自研裸金屬云服務管理平臺具備完整的計算資源管理,存儲資源管理,網絡資源管理功能,允許用戶按需創建、配置和管理裸金屬服務器資源。
- 用戶可以根據應用程序的性能要求和資源需求選擇合適的計算實例類型,并隨時調整資源分配。
- 允許用戶創建和管理虛擬網絡資源,這些網絡資源使用戶能夠在云上構建復雜的網絡架構,實現安全的資源隔離和訪問控制。
- 云平臺為用戶提供多種存儲選項,包括普通云盤和SSD云盤等。這些存儲服務旨在滿足不同類型的應用程序和數據存儲需求。用戶可以根據性能、可靠性和成本要求選擇合適的存儲服務,并隨時擴展或縮小存儲容量。