在北京舉行的LUG(Lustre User Group)2015會議上,做為主辦方Intel的合作伙伴,戴爾公司高性能計算技術顧問凌巍才先生發表了主題為《面向高性能計算的Dell/Intel Lustre存儲解決方案》的演講。
在本文中,小編截取了演講里的一些精華內容,并加入部分自己的理解和認識。希望能夠對大家有所幫助。
Lustre并行文件系統的優勢和挑戰
根據上面的圖表,IDC在2014年5月的統計數字顯示50%的高性能計算存儲使用了Lustre文件系統,GPFS和NFS的份額分別為21%和17%。而在2013年另一家分析機構的存儲管理軟件調查中,Lustre也高居第一位。
開源的Lustre屬于一種分布式文件系統,同時也是并行文件系統。它的優勢包括提供單一命名空間;可增加節點數來擴展容量和性能,并支持在線擴展;支持多個客戶端并發讀/寫,通過分布式鎖機制保障數據一致性等。
有人說與開源伴生的一個名詞是折騰。筆者很早就聽說過Lustre對設計、部署和調優的技術要求較高;其實別的一些文件系統(乃至商業文件系統)也類似,用起來不難,但真正用好了不容易。
如上圖,存在挑戰之處可能包括:應用設計、工作負載模型、網絡帶寬、IO模型(主要影響元數據性能)、OSS(對象存儲服務器)和LUN的負載均衡、故障切換以及I/O優化等方面。那么對于在Lustre技術上積累還不夠的用戶,怎樣快速有效地解決這些問題呢?
戴爾HPC方案架構、存儲配置建議
Lustre最主要的用途是高性能計算,上圖為戴爾的HPC方案架構,存儲是其中的一個部分。關于計算節點的選擇,刀片服務器有著靈活的配置和可管理性;傳統機架服務器可以提供大內存節點;云服務器兼具密度和性價比,還有專門針對GPU設計的機型;工作站用于高性能計算通常為視覺效果要求高,配置專業顯卡。
如上圖,除了IB交換機來自合作伙伴Mellanox之外,在Lustre存儲典型配置“Boulder”中戴爾能提供全部的服務器、存儲和網絡設備,包括MDS元數據服務器+MD3420雙控SAS陣列,OSS對象存儲服務器+ MD3460雙控高密度SAS陣列+MD3060e高密JBOD擴展柜;還有管理節點、千兆/萬兆以太網交換機。
戴爾不僅是簡單地提供設備,在磁盤陣列RAID配置等方面都有具體的建議。比 如連接到OSS的MD3460/MD3060e,其中60塊硬盤建議做成6組RAID,每組10塊盤配置為RAID6(8+2),這樣LUN(OST)可 以達到比較理想的性能。在這里未配置熱備盤,應該是HPC系統的可控性比OLTP等關鍵業務要高,在有硬盤故障Rebuild時可以酌情安排出停機時間, 或者減少用戶對存儲的訪問。由于采用了RAID10(MDT元數據存儲) 和RAID 6 技術,所以可以采用冷備磁盤的方式,來處理磁盤故障問題。
性能測試:吞吐量和元數據
上面是Boulder配置的IOzone性能測試結果,單一客戶端讀寫性能分別達到0.75GiB/s和0.63GiB/s,24客戶端時的最大聚合性能,讀寫分別達到10.04GiB/s和5.68GiB/s。用戶可以此對比自己的實際需求,戴爾能夠幫助給出適合您的配置建議。
MDtest元數據測試主要用于評估小文件較多的應用場景。Boulder配置在單客戶端測試中,每秒文件創建操作500次,文件狀態(列表)2000次,文件刪除1800次;而到了240線程,每秒總文件創建達到15K,文件狀態(列表)400K;文件刪除性能在192線程時最高為100K操作每秒。
企業版Lustre:融合HPC和大數據
在 2013年春季IDF期間,筆者曾簡單總結過Lustre的歷史:“Lustre項目從1999年起始,2003年成立CFS公司并發布1.0版本。 2007年開始屬于Sun,并于2009年發布版本1.8。2010年,隨著Sun被Oracle收購而加入甲骨文,發布了2.0版本。同一 年,Lustre團隊應該是從Oracle獨立出來,并成立了Whamcloud公司。Lustre建立OpenSFS和EOFS兩個開源社區。去 年,Whamcloud被Intel收購,之后發布了2.3版。”(引用自:《Lustre:Exascale文件系統的前世今生》)
Intel 在保持Lustre開源的同時,也推出了自己的企業版軟件(IEEL),上圖中的綠色和紅色方框里就是企業版才有的部分。其中包括生產級質量的文件系統增 強;專用的Intel管理器;針對Apache Hadoop和Cloudera Hadoop的適配器能夠提供MapReduce訪問數據所需的HDFS接口;分級存儲管理支持,包括POSIX拷貝工具和強大的策略引擎;使用ZFS最 大化數據保護(數據完整性和快照);針對Xeon Phi的客戶端及優化;使用不同的存儲服務改進小文件性能;24x7企業級支持、專業服務和培訓等。
戴爾正是憑借著和Intel的緊密合作,支持在IEEL軟件的戴爾存儲上運行Hadoop(相當于Lustre文件系統代替了HDFS)。目前該方案已經至少在兩所大學有成功案例,它主要的好處就是將HPC和Hadoop的數據融合到了一套存儲系統中。
綜上所述,戴爾不僅是一家數據中心硬件設備提供商,還擁有自己的軟件部門,并與眾多合作伙伴聯合提供各種行業應用解決方案的咨詢等增值服務。