如果把20名數據中心管理者放在一起并詢問他們最佳的數據存儲方法是哪種,你恐怕會得到至少45種答案。
伴隨著戴爾完成對EMC的收購計劃,長久以來停滯的存儲技術正迅速發展著。從開源存儲到專有存儲,從iSCSI區塊存儲到Ceph,以及從固態存儲到基于云端的存儲服務,可選內容眾多。想要走出這個迷宮,數據中心必須制定自己的路線圖。
磁盤正在消亡
緩慢的磁盤存儲正在被以SSD為主的企業級存儲方法全面取代。據稱SSD的成本很高,但不少這樣的比較目的僅僅在于制造恐懼、不確定和疑問。在服務器領域,SSD的成本確實要比10,000 RPM轉速的HDD磁盤來的低。
HDD磁盤唯一比SSD成本低的領域就是在低端的3.5英寸驅動器上。即使是這些散裝的3.5英寸驅動器也正面臨著SSD在尺寸方面給予的壓力。目前SSD在價格方面還是會高些,但相信這一劣勢會在2016和2017年就消失殆盡。
SSD以及適應大型數據中心的全閃存陣列,才是值得你進行存儲投資的地方。SSD的性能從根本上改變了數據中心的動態性能。以SSD作為主要存儲,數據中心運營部門可以進一步壓縮作為次要存儲的散裝低成本硬盤驅動器的數量。
再加上主要存儲和次要存儲按照閃存和SSD各自速度進行的再平衡,我們將在主存儲中看到更少的TB級存儲。歸功于數據壓縮技術,按照當前的估算容量,數據中心未來將只需要當前次要存儲總容量的20%即可滿足應用。
這樣的好處就是不再需要大量的人力維護,而且一些大型的投資也可以節省下來,卻同時帶來更好的性能。
備份和主云存儲
基于云端的存儲在很多人看來是備份和歸檔的一種選擇。這很說得通,云端可以為實現災難備份而自動創建離線備份。但并不是所有的備份都一模一樣,Google的Nearline就是一種基于磁盤的,據說是采取每小時通過Amazon的Glacier節拍訪問時間數據的備份工具。
拋開備份和歸檔不談,基于云的存儲總是個充滿爭議話題。總有人在討論公有云上的IT工作信息問題,公司持續不斷地提交重要的IT工作信息到公有云,而為這些工作信息所準備的主要存儲也同樣處在遷移之中。在室內數據中心硬件和公有云之間傳送數據是相當緩慢和昂貴的,這也成為阻礙混合云方法普及的障礙。
基于混合云工作信息的數據存儲方法所遇到的問題不會在短期內解決。除非谷歌開始在自己的工具中提供光纖,否則電話公司該開始編造光纖沒有用的借口了。
存儲架構
我們存儲數據的方式也在經歷著變化。區塊存儲的概念已經束縛我們太久,相關的應用程序都是基于這種方式編制,很難放棄這種方式。其實文件存儲的方式也一樣夠快,真正的問題在于我們能否用對象存儲的方式取代現有方式?
存儲及計算供應商Data Direct Networks已經通過演示證明對象存儲可以做的很快,但這種方式主要面向存儲例如數據庫這樣實時都在咀嚼數據的整個對象而非文件。這使得對象存儲在需要經常性改寫數據的應用程序上并不那么有用。
對象存儲軟件已經在上述問題上有所突破。現在已經有辦法像支持區塊存儲那樣在對象存儲中支持對象了。此種數據存儲方法對多個不同的對象存儲系統都奏效,這其中就包括很普及的Ceph開源存儲。隨著大數據和面向對象的存儲模式成為主導,就是這樣的非主流存儲方法將會成為日后IT組織的通用標準。
如果上述的一切對于IT專業人士來說還不夠刺激,那么軟件定義存儲(SDS),正處在概念宣貫和技術轉移階段的一種技術,是運行在虛擬機上旨在重新設計數據服務在多數電器上運行方式的技術,其數據則是存儲在第三方更加廉價的硬件上。
盡管在成為主流之前尚需時日,SDS未來的意義將遠不止存儲資源管理。即使如此,其在當下也極具沖擊性,促使EMC將存儲業務賣給戴爾。
購買什么
看樣子以太網將成為連接存儲的贏家,因此僅在iSCSI和對象存儲盒(object store boxes)領域投資是明智的選擇。盡管部分工業部門人士并不同意,但光纖通道的概念已然過時了。
少買些10,000RPM的存儲媒體吧,因為SSD可以輕易取代它。數據中心的管理人員應該考慮一種混合的數據存儲方法。在SSD/Flash前端存儲方面投資,將全閃存存儲或相關設備的數據壓縮后轉移到你的HDD設備轉換為散裝的次要存儲。這樣可從存儲預算中節省相當一部分成本。
相比于傳統存儲供應商,為谷歌和AWS數據中心提供大容量存儲的供應商,將依靠低成本的陣列和對象存儲產品進入企業端市場和渠道。我們已經看到聯想授權IBM存儲以及Supermicro提供(對象存儲)盒子的服務,Quanta和其他廠商也不會甘落人后。企業用戶可以為谷歌的散裝價格驅動器多支付一點費用,就可以和EMC那些單價超過1000美元的驅動器說再見。
當下對于數據中心管理者是采買的好時機,數據中心能夠以更低的價格得到更好的產品。未來工業將奔向何方需要花點心思和知識來考慮,但由此帶來的結余和收益卻是值得的。