5月,是一個特別的月份,阿明已知的有關存儲的大型發布活動就涉及好幾個廠商。5月5日,當華為與EMC在高端存儲領域進行了一場前所未有的撕逼大戰,華為這場“就是要治各種不服”的高端存儲宣言引發了存儲業界的熱論,之后,世界似乎也沒有改變,因為EMC依然還是EMC,華為還是華為。
但是,令業界意想不到的是,有一種比高端存儲更有實際意義的方式正在悄然興起,并悄悄地為用戶的存儲應用帶來新的革命。
事實上,一直以來,存儲這個行業似乎都始終保持著它獨有的活力與青春,活力在于技術的革新,青春在于分分合合的更替。
大家都知道高端存儲之所以牛掰,在于其高性能、高可靠、高可用等特點,但價格也高啊。如何將這種高大上的高端存儲以一種創新的方式來替代,一直是許多用戶面臨的挑戰也是最大的渴望。
用戶永遠都是現實主義者,便宜又好的存儲沒人不喜歡。用戶需求所在,就是用戶痛點所在。于是,業界有人提出了超融合的概念,也有人很早提出了分布式存儲的概念,然而這兩種方式還是不能滿足用戶對存儲的擴展性、可用性、可靠性與價格之間的平衡。
就在這個當頭,有人設想將Hyper-Converged超融合與Scale-out存儲架構相結合,沒有想到這樣的設想很快變成了現實。一種創新的模式已經誕生,阿明暫且稱呼它為分布式融合存儲。但這種創新存儲引發了業界的許多爭議,有人說這種方式沒有傳統集中存儲那樣更利于企業級用戶管理,有人說這樣的方式更利于提高存儲效能……實屬不易的是,就在大家眾說紛紜之下,分布式融合存儲打破廠商限制的僵局,已經找到了政府、電信運營商、醫療、教育等多個領域用戶的成功應用。
那么,為什么分布式融合存儲能夠如此快地獲得許多成功應用?它正在革誰的命呢?
閃存真的在加速“去中心化”嗎?
不管你承認與否,存儲領域一切似乎照常,一切又都在變化。因為存儲創新不斷,技術更新不斷,變化不斷,但唯一照常不變的就是最大化地提高存儲效率與價值。
近些年來,用戶追求存儲速度與性能是前所未有的,隨著閃存這種新介質的誕生,確實帶給了許多企業級用戶的福音。我們可以從閃存卡、SSD盤、全閃存陣列與混合陣列的逐漸鋪開得到驗證,閃存以一種前所未有的革新速度正在改變著存儲行業的格局。
閃存存儲介質變化引發了一場存儲更新,成為不爭的事實。
實際上,在閃存領域應用最為廣泛的就是閃存卡和SSD盤,閃存也加速了分布式應用的推進,為什么這么說呢?大家都清楚最早應用在互聯網領域的分布式架構,以其靈活擴展、價格可選、性能優越、可控可用的特點備受企業級用戶的關注,但是要將分布式架構特別是分布式存儲應用到企業級用戶領域,雖然不難,但也不容易。
隨著x86成為企業級用戶行業的新主流,由x86架構帶來的分布式部署成為一種大趨勢,但是在分布式部署過程中,用戶依然面臨存儲性能提升的問題。用戶不可能再回去采用高大上的高端存儲,那么如何在分布式存儲方案中實現性能的提升呢?
最簡單最快捷的方式就是應用閃存,包括閃存卡和SSD盤,特別是閃存卡與服務器的結合,一方面滿足了用戶對于存儲性能的需求,另一方面也滿足了用戶對于x86靈活的分布式擴展。在閃存這種快速提升服務器性能的應用帶動下,必然也加快了用戶“去中心化”的發展。由此,閃存與服務器有效結合下,不僅很快提升了存儲性能,也擴大了用戶對于分布式存儲的應用前景。
也因為這股勢力最初來自互聯網領域用戶去中心化的應用,因而閃存卡也最先在互聯網領域應用開來。但是,當“去IOE”這樣的思路從阿里誕生以來,就逐漸將這種“去中心化”的影響,從互聯網擴展到了企業級用戶領域,為此“去中心化”、“去IOE”也就成為了焦點。其間,分布式成為了實現“去中心化”打破原廠限制的最佳途徑,可是又必須結合企業級用戶自身的關鍵業務應用的特殊性,那么就必然需要一種新的創新與改變。
分布式融合存儲能否“挑大梁”?
談到“去中心化”,我們可能會想到傳統的統一存儲,它雖然能夠實現設備的整合,但犧牲了性能和效率,對于x86成為用戶主流選擇的趨勢下,需要一種更新的架構來改變這一切。
之前,阿明的好朋友、業界資深存儲專家董唯元認為,在存儲技術領域,以及其它分布式、虛擬化、軟件定義等技術領域中,已經存在從“分”到“合”的總體趨勢。當然這種融合不是消滅新技術,而是縱向整合系統的軟硬件功能層次,同時增加橫向擴展聯通能力,藉此令系統基礎架構保持豐富內涵的同時,極大簡化建設交付和使用維護的復雜程度,最終目的還是為用戶業務邏輯騰出更大空間,而不是聽憑本該靜默的基礎架構喧賓奪主。
那么,基于董唯元的思路,就必須創新一個新的方式,可以更好互聯,可以充分利用閃存性能,并且必須基于x86計算架構,采用分布式存儲方式,可以通過軟硬件配合緊密耦合的計算和存儲資源池化,并提供高性能數據庫訪問。這種方式的誕生勢必會改變現有傳統的IOE在用戶中的地位,當然,這種方式的實現,最先去掉的應該是E的高端存儲。
似乎在前段時間,阿明看到有企業級用戶包括某些運營商用戶開始采用這種方式,在很大程度上做到使用分布式融合存儲來替換了高端存儲的工作。既然可以實現,并且有了成功案例,那么我們不妨來挖挖這個方面的情況。
超融合給scale-out分布式存儲帶來了什么?
前段時間,有一個一體機國產廠商曾經干敗了數據庫一體機大佬,采用的創新架構就是分布式融合存儲。一旦超融合與scale-out分布式存儲有機結合起來,對于用戶的需求滿足也是前所未有的,一種性能與價格兼顧、一種擴展與可靠兼顧、一種可用與可控兼顧的解決方案必然贏得更多的市場回應。
這里阿明不得不提一下來自天璣數據的數據庫一體機產品PBData。它的最大特點在于高性能X86服務器與高速Infiniband互聯技術以及閃存技術的高度融合,通過軟硬件配合形成緊密耦合的計算和存儲資源池化的高性能數據庫云平臺,具備分布式存儲的擴展優勢,也具備高端存儲的性能特點。從近幾次用戶現場測試情況來看,這是一個可以落地的、在不改變原有應用的前提下實現UNIX平臺向X86平臺業務平滑遷移的有效解決方案之一。并且,PBData是國產化X86產品,從性價比以及技術自主可控方面都具備較大的優勢。
不過,分布式融合要達到用戶對于高端存儲的需求效果,就不得不突出高可用。當然,高可用不是隨便說說而已,在某運營商的測試結果中,足以說明PBData數據庫一體機所具備的技術優勢是其他友商現有產品現階段所難以具備或本就沒有的,比如PBData一體機的所有節點均為冗余設計,不會因為單硬盤故障、單個計算節點和存儲節點故障、單臺交換機故障導致業務停頓或者數據丟失,能夠滿足企業級環境下的高可用需求。
PBData架構設計可以滿足在數據庫場景下的大吞吐、高并發以及低時延的性能要求。首先需要指出的是其Cache機制,PBData通過SSD磁盤作為存儲的smart cache,每個節點可以配置12個 或 20個SSD盤。
對于OLTP系統,命中率要求在90%以上。Cache命中率非常關鍵,在業務數據無熱度時延時較達30ms,IOPS較低不足8000,是傳統存儲的1/3。在預熱后命中率達90%以上后,只有不到1ms的延時,IOPS高達7W以上,是傳統存儲的3倍以上。
針對OLAP系統,強調大并發的場景下的存儲帶寬。而PBData融合架構中采用了互聯機制,要知道InfiniBand本身擁有高吞吐的特性,可以把分布式存儲集群的高并發能力提升到極致。不僅如此,因為融合架構的節點還融合了計算與存儲,使交互與處理在最大限度上保留在節點內完成,無需通過網絡傳輸,自然也提高了處理效率。
特別需要說一下互聯機制,它不僅通過HCA卡和高速Infiniband交換機進行互聯,具有高吞吐,其主流卡達到40Gb/S,適應OLAP高并發場景。通過RDMA協議等實現的信息交互,延時短,釋放CPU負荷,降低延遲,用于優化OLTP場景。
其次就是存儲冗余機制,PBData( Oracle)一體機通過ASM來實現存儲冗余,在計算節點,OS指標中寫的IOPS和吞吐為有效IOPS和吞吐的2倍。對磁盤失敗引起的問題,通過ASM層面進行處理。
為此,我們基本明了PBData數據庫一體機的技術架構,由于PBData采用SAS磁盤和SSD磁盤混合的存儲,同時兼容閃存卡,并使用了Infiniband的互聯機制。對于高吞吐MBPS,主要取決于帶寬和磁盤的吞吐。對于高IOPS,則取決于smart cache的命中率。為此, 基于企業級用戶不同的業務場景特點,PBData需要進行優化配置,這樣可以帶來用戶實際部署與應用的更好結果,達到用戶在高性能、低延遲、高可用和自主可控的完美目標。
不僅如此,PBData也對產品做了細致規劃,分為全冗余全閃存、重點優化OLTP的E系列;同構節點便捷擴展、重點優化OLAP的H系列;節點分工資源獨立、OLTP/OLAP混合負載的V系列。每個系列針對用戶的需求也細分出不同的型號,有針對性的面對用戶不同規模和場景的需求,很大程度上可以滿足更大范偉企業級用戶應用更細分的需求。
分布式存儲為什么不能單打獨斗?
分布式融合存儲正在革誰的命?相信大家都明了了,但閃存在其中的價值也體現了出來,不過這種架構不是一個單一的方式,既然強調融合,因此分布式融合存儲必須基于高性能X86服務器,并且借助高速Infiniband互聯技術和閃存技術,才能發揮出真本事,從而可以實現高性能數據庫云平臺的功能。
分布式存儲為什么不能單打獨斗,答案自然見分曉。
同時,因為分布式融合存儲也可以更好地實現“去中心化”,徹底打破原創限制,所以,未來它必然可以為用戶提供更加靈活高效、利于擴展的存儲解決之道。