精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:存儲企業動態 → 正文

XSKY開源InfiniBand RDMA互聯支持 加速Ceph能效再創新高

責任編輯:editor005 |來源:企業網D1Net  2016-10-24 14:25:15 本文摘自:TechTarget中國

近日,國內軟件定義存儲企業XSKY向Ceph社區提交了IB RDMA的協議棧代碼,將歷時近1年時間研發的基于Ceph的IB RDMA互聯支持進行開源。

網絡連接廠商Mellanox研發部門同時表示也將參與其中,基于該部分代碼,雙方將共同孵化和完善基于AsyncMessenger的網絡通信引擎,試圖大幅度提升IO路徑上的網絡性能。此外,XSKY將協同一些企業用戶基于此進行大規模Ceph集群測試。

在Ceph社區中,XSKY一直圍繞高性能方面提供代碼貢獻,此次將IB RDMA開源將對加速Ceph高性能步伐具有重大意義。

RDMA(Remote Direct Memory Access)是通過利用硬件 Offload 能力,解決網絡傳輸中的延遲,提供吞吐的技術。在高性能計算領域中, RDMA 被大量使用于網絡數據傳輸與運算交互。

RDMA 定義了一種異步網絡編程接口,稱做 RDMA Verbs。應用程序主要于 Verbs 交互實現 RDMA 的優勢。Verbs 掩蓋了底層硬件差異,因此,無論 InfiniBand 還是以太網都可作為 Verbs 的后端,于是可實現RoCE(RDMA over Converged Ethernet)。

在 RDMA 的世界里,主要有幾種協議簇。第一是 RDMA 之下的協議棧,如iWARP,RoCE,Infiniband HCA,RoCE v2 甚至 Software RoCE。這些主要是為RDMA提供底下的傳輸真實介質和鏈路實現。第二種是RDMA之上的應用協議,在存儲領域包括iSER(iSCSI over RDMA),SMB 3 with SMB Direct,NFS/RDMA,SRP(SCSI over RDMA),以及現在最火熱的NVMe over Fabric。

Host Network現在于NVMe Over Fabric的領域最為火熱,如下圖所示,Head Node Cluster Network和Storage Network 實際上作為傳統存儲機頭的交換網絡以及機頭跟存儲介質池的網絡。前者過去通常是PCIe或者InfiniBand,后者通常是SAS或者Infiniband。在Ceph中,這兩個也對應了 Ceph 的 Public Network 和 Cluster Network。

xsky3

而在目前主流分布式軟件定義存儲里,僅華為公司的 FusionStorage 對外公開支持 InfiniBand/RDMA。而 Ceph 過去的 Infiniband/RDMA 雖然在社區被提及過,實際上是概念驗證階段,最大的原因也許是 Ceph 的網絡接口以及規定語意比較復雜,使得在2014 年就已經進入主線的 XioMessenger(基于 AccelIO)至今未能滿足Ceph核心對于網絡層狀態的需求而被投入應用。

今年在Raleigh舉行 的 Ceph Next Day 上,有一個專門的話題,討論 XioMessenger 無法滿足 Ceph 語意的問題。主要在于 Ceph 所規定的 Messenger 語意和 Policy 太過復雜,使得非 TCP/IP 棧在無法充分測試的情況下,基本上很難達到要求。因此,為了解決 RDMA 進入 Ceph 的問題,主要發展出兩個方向。第一個是降低 Ceph核心對于網絡層狀態的要求,減少 Messenger 需要實現的邏輯。但這個方向一開始就被開發者否決了,因為減少了Messenger的邏輯就意味著要增加其他地方的邏輯,改動量太大。第二個方向就是基于目前 AsyncMessenger 的框架(得益于之前 DPDK 的引入定義),擴展出不同的網絡后端而無需關心上層會話邏輯。

xsky4

因此,基于 AsyncMessenger 的 RDMA 實現成為 Ceph 支持 RDMA 的計劃。在最近一次跟社區的交互中,這個方向已經被社區領袖 Sage Weil 認為是正確的做法。

在10月19日,XSKY 正式把孵化出來的基于 AsyncMessenger 的 RDMA 網絡引擎提交到 Ceph 社區,并開始進入 K 版本的 Pending 窗口。通過 AsyncMessenger 的 RDMA 網絡引擎,最大優勢是簡單且高性能。不同于 XioMessenger 基于 AccelIO 的復雜抽象,該RDMA實現跟大多數RDMA應用一樣直接采用原生的 Verbs 接口,充分整合到 Ceph 已有的框架中。大大降低了復雜度,提高了易用性。

至此,在一個版本周期內,Ceph完成了整個網絡層的大重構,從啟用AsyncMessenger作為默認網絡引擎,到釋出DPDK+SPDK的網絡棧,現在的RDMA引擎支持。使得Ceph在網絡層面允許用戶選擇不同要求、性能的網絡棧。

以上三種引擎,歷時一年,多次更新并提交到社區,皆由XSKY團隊發起并與硬件領導廠商Intel、Samsung、Mellanox等共同優化維護。三種網絡引擎分別適配用戶對于不同場景,不同特點的網絡要求。之前Ceph結合DPDK+SPDK的實踐,或代表了未來高速以太網的黃金配合,但最大的遺憾是需要等待Ceph BlueStore的成熟以及SPDK生態的穩定。但RDMA提供了合適的折中,在硬件配置較優的條件下,能夠跟已有成熟的Ceph IO棧快速整合使用。

Red Hat 首席存儲科學家Sage Weil在關于此次更新的意見中提到,“This definitely seems like a nice way to approach RDMA support since it doesn't require a full rewrite of the messenger protocol like msg/xio.”我們相信,這次RDMA之于Ceph upstream的變化在提升性能方面意義重大,雖然不能說這一網絡層改進立即就適當應用于普通企業的生產,但通過社區和硬件領導廠商配合下的持續優化,可以期待Ceph效能再創新高不會太久。

關鍵字:RDMAceph

本文摘自:TechTarget中國

x XSKY開源InfiniBand RDMA互聯支持 加速Ceph能效再創新高 掃一掃
分享本文到朋友圈
當前位置:存儲企業動態 → 正文

XSKY開源InfiniBand RDMA互聯支持 加速Ceph能效再創新高

責任編輯:editor005 |來源:企業網D1Net  2016-10-24 14:25:15 本文摘自:TechTarget中國

近日,國內軟件定義存儲企業XSKY向Ceph社區提交了IB RDMA的協議棧代碼,將歷時近1年時間研發的基于Ceph的IB RDMA互聯支持進行開源。

網絡連接廠商Mellanox研發部門同時表示也將參與其中,基于該部分代碼,雙方將共同孵化和完善基于AsyncMessenger的網絡通信引擎,試圖大幅度提升IO路徑上的網絡性能。此外,XSKY將協同一些企業用戶基于此進行大規模Ceph集群測試。

在Ceph社區中,XSKY一直圍繞高性能方面提供代碼貢獻,此次將IB RDMA開源將對加速Ceph高性能步伐具有重大意義。

RDMA(Remote Direct Memory Access)是通過利用硬件 Offload 能力,解決網絡傳輸中的延遲,提供吞吐的技術。在高性能計算領域中, RDMA 被大量使用于網絡數據傳輸與運算交互。

RDMA 定義了一種異步網絡編程接口,稱做 RDMA Verbs。應用程序主要于 Verbs 交互實現 RDMA 的優勢。Verbs 掩蓋了底層硬件差異,因此,無論 InfiniBand 還是以太網都可作為 Verbs 的后端,于是可實現RoCE(RDMA over Converged Ethernet)。

在 RDMA 的世界里,主要有幾種協議簇。第一是 RDMA 之下的協議棧,如iWARP,RoCE,Infiniband HCA,RoCE v2 甚至 Software RoCE。這些主要是為RDMA提供底下的傳輸真實介質和鏈路實現。第二種是RDMA之上的應用協議,在存儲領域包括iSER(iSCSI over RDMA),SMB 3 with SMB Direct,NFS/RDMA,SRP(SCSI over RDMA),以及現在最火熱的NVMe over Fabric。

Host Network現在于NVMe Over Fabric的領域最為火熱,如下圖所示,Head Node Cluster Network和Storage Network 實際上作為傳統存儲機頭的交換網絡以及機頭跟存儲介質池的網絡。前者過去通常是PCIe或者InfiniBand,后者通常是SAS或者Infiniband。在Ceph中,這兩個也對應了 Ceph 的 Public Network 和 Cluster Network。

xsky3

而在目前主流分布式軟件定義存儲里,僅華為公司的 FusionStorage 對外公開支持 InfiniBand/RDMA。而 Ceph 過去的 Infiniband/RDMA 雖然在社區被提及過,實際上是概念驗證階段,最大的原因也許是 Ceph 的網絡接口以及規定語意比較復雜,使得在2014 年就已經進入主線的 XioMessenger(基于 AccelIO)至今未能滿足Ceph核心對于網絡層狀態的需求而被投入應用。

今年在Raleigh舉行 的 Ceph Next Day 上,有一個專門的話題,討論 XioMessenger 無法滿足 Ceph 語意的問題。主要在于 Ceph 所規定的 Messenger 語意和 Policy 太過復雜,使得非 TCP/IP 棧在無法充分測試的情況下,基本上很難達到要求。因此,為了解決 RDMA 進入 Ceph 的問題,主要發展出兩個方向。第一個是降低 Ceph核心對于網絡層狀態的要求,減少 Messenger 需要實現的邏輯。但這個方向一開始就被開發者否決了,因為減少了Messenger的邏輯就意味著要增加其他地方的邏輯,改動量太大。第二個方向就是基于目前 AsyncMessenger 的框架(得益于之前 DPDK 的引入定義),擴展出不同的網絡后端而無需關心上層會話邏輯。

xsky4

因此,基于 AsyncMessenger 的 RDMA 實現成為 Ceph 支持 RDMA 的計劃。在最近一次跟社區的交互中,這個方向已經被社區領袖 Sage Weil 認為是正確的做法。

在10月19日,XSKY 正式把孵化出來的基于 AsyncMessenger 的 RDMA 網絡引擎提交到 Ceph 社區,并開始進入 K 版本的 Pending 窗口。通過 AsyncMessenger 的 RDMA 網絡引擎,最大優勢是簡單且高性能。不同于 XioMessenger 基于 AccelIO 的復雜抽象,該RDMA實現跟大多數RDMA應用一樣直接采用原生的 Verbs 接口,充分整合到 Ceph 已有的框架中。大大降低了復雜度,提高了易用性。

至此,在一個版本周期內,Ceph完成了整個網絡層的大重構,從啟用AsyncMessenger作為默認網絡引擎,到釋出DPDK+SPDK的網絡棧,現在的RDMA引擎支持。使得Ceph在網絡層面允許用戶選擇不同要求、性能的網絡棧。

以上三種引擎,歷時一年,多次更新并提交到社區,皆由XSKY團隊發起并與硬件領導廠商Intel、Samsung、Mellanox等共同優化維護。三種網絡引擎分別適配用戶對于不同場景,不同特點的網絡要求。之前Ceph結合DPDK+SPDK的實踐,或代表了未來高速以太網的黃金配合,但最大的遺憾是需要等待Ceph BlueStore的成熟以及SPDK生態的穩定。但RDMA提供了合適的折中,在硬件配置較優的條件下,能夠跟已有成熟的Ceph IO棧快速整合使用。

Red Hat 首席存儲科學家Sage Weil在關于此次更新的意見中提到,“This definitely seems like a nice way to approach RDMA support since it doesn't require a full rewrite of the messenger protocol like msg/xio.”我們相信,這次RDMA之于Ceph upstream的變化在提升性能方面意義重大,雖然不能說這一網絡層改進立即就適當應用于普通企業的生產,但通過社區和硬件領導廠商配合下的持續優化,可以期待Ceph效能再創新高不會太久。

關鍵字:RDMAceph

本文摘自:TechTarget中國

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 南岸区| 池州市| 沂源县| 济南市| 丁青县| 开原市| 永清县| 福建省| 漳平市| 苍南县| 杭州市| 兴城市| 新津县| 寿宁县| 太湖县| 呈贡县| 天台县| 晋宁县| 肃宁县| 开平市| 鹤庆县| 遂川县| 新密市| 永顺县| 资源县| 电白县| 宁陵县| 昆山市| 通辽市| 中西区| 日土县| 和政县| 柘荣县| 莆田市| 榆中县| 平潭县| 福贡县| 灵武市| 霍林郭勒市| 南涧| 佛学|