想要踏上人工智能(AI)與非結構化數據的開創性融合之旅,企業需要一個能夠適應復雜性并可伴隨創新伸縮自如的強大存儲架構。深受信賴的領先存儲解決方案PowerScale旨在簡化IT環境,以前所未有的速度、簡易性和成本優勢加快AI模型的交付。
揭秘PowerScale架構
PowerScale的核心是一個由OneFS軟件驅動的AI架構,專用于管理分布式環境中的非結構化數據。具體來說,包含以下三個基礎層。
客戶端訪問層:網絡文件系統的這一關鍵組成部分可確保從各種客戶端和工作負載對非結構化數據的無縫訪問。客戶端訪問層使用高速以太網連接并支持多種協議,例如網絡文件系統(NFS)、服務器消息塊(SMB)和Hadoop分布式文件系統(HDFS),簡化并統一了不同工作負載的文件訪問。該層采用NVIDIA GPUDirect Storage、遠程直接內存訪問(RDMA)等前沿技術,為AI應用在GPU內存與存儲設備之間直接數據傳輸提供了便利。它還通過智能負載均衡策略優化性能和可用性,同時利用多租戶控制確保安全性和量身定制的服務級別。
OneFS文件呈現層:該層統一了整個集群的數據訪問,讓用戶不再為數據的物理位置而煩惱。OneFS無縫集成了卷管理、數據保護和分層功能,簡化了各類存儲的大型數據卷管理。憑借高可用性且可連續無中斷運行的特點,該層助力用戶輕松實現升級、擴展和遷移,為其提供一個可適配各種需求的智能、高效文件系統。
PowerScale計算和存儲集群層:作為骨干層,該層提供節點和節點間的網絡元素,實現可擴展且高可用性的文件集群。從處理基礎容量和計算任務的經濟型小型集群,到可容納PB級數據的大型配置,PowerScale都能在不增加任何管理負擔的情況下,輕松擴展和自動平衡集群。節點專為方便生命周期管理而設計,因此不再需要中斷集群運行便可實現升級、遷移和技術更新。
以上三層構成了AI部署的基礎,為高性能的數據獲取、處理和分析提供了靈活、永不間斷的助力。
PowerScale的核心功能
在PowerScale全閃存技術和OneFS軟件最新創新成果的加持下,開發人員可加速從數據準備到模型推理的整個AI生命周期。由Dell PowerEdge服務器驅動的PowerScale具有更強大的性能,可加快高級AI模型的流式讀寫速度。與高性能、高密度的節點相結合,這些核心功能以非凡的速度與精度為實現數據驅動的智能決策鋪平道路。
GPUDirect實現超高性能:PowerScale利用GPUDirect存儲技術在GPU內存和存儲之間建立直接路徑,從而減少延遲并提高帶寬。由于支持采用GPUDirect的服務器以及NFS Over RDMA技術,PowerScale能夠提高吞吐量并降低CPU的利用率,可將帶寬和吞吐量提高至多8倍。
支持高吞吐量以太網的客戶端驅動程序:可選的客戶端驅動程序允許使用多個TCP同時連接到不同的PowerScale節點,提高了NFS客戶端在高速以太網網絡上的性能。這種分布式架構能夠增加I/O操作的吞吐量,通過提高單個NFS掛載性能并平衡網絡流量防止出現瓶頸。
伸縮自如的橫向擴展:無論是小型集群還是具有多個PB級容量數據的環境,PowerScale都能憑借自身的無縫擴展性,滿足AI不斷發展的需求。通過輕松添加和升級節點,PowerScale即使在不同的節點類型和配置中也能確保一致且可預測的性能。
靈活支持存儲層:PowerScale提供全閃存、混合和歸檔節點,可滿足不同的存儲需求和預算。智能負載均衡策略可優化資源利用率,在線數據縮減可刪除重復或冗余數據,降低有效存儲成本。
現在開始使用PowerScale交付AI成果
在AI領域,架構的選擇至關重要。作為加速AI流程并優化成果的絕佳解決方案,PowerScale憑借GPU直接通信、高速數據處理、無縫擴展等獨樹一幟的功能,為AI工作流程開辟出一條前所未有的創新之路。