如果你有管理數據存儲的經驗,那么你一定知道存儲系統是花錢最快的,任何其他的IT設施都比不了。一方面,雖然每天都要跟存儲設備打交道,可我們卻很少關注存儲的真實開銷。另一方面,存儲廠商總是避實就虛的宣傳那些所謂專業的指標,比如更高的“單位美元存儲容量(GB/$)”,或者更高的“單位美元IO性能(IO/$)”,但我們知道真實的存儲成本遠遠不止這些。
要掌握數據存儲的真實成本,那么就得考慮這個數據對象在完整生命周期內的存儲需求,這是最好的方法之一,通常也叫做“數據存儲的生命周期成本”。它包括了貫穿于所有存儲介質之上的技術、過程和工作流的開銷。這種自下而上的分析模式可以洞悉數據對象在一段時間內的存儲活動,不但能夠幫助我們理清數據存儲的真實成本,而且還能夠告訴我們在采購存儲產品過程中應該關注哪些問題。
對于那些在企業中負責存儲策略的管理者來說,最常見的挑戰莫過于來自于主存儲的壓力。因為絕大部分數據產生自數據中心的主存儲,并從此開始生命周期的演進,因此采購者往往把他們的資金集中投向主存儲設備。但實際上,用戶用于存儲的總費用額度遠高于存儲設備最初的實際采購成本。更糟的是,在相似的存儲應用環境下,不同產品所產生的費用也相距甚遠,這也造成用戶估算工作的困難,結果是主存儲的總成本計算經常出現很大的誤差。主存儲比較常見的問題是沒有優化且利用率較低,而當用戶擴容或部署了更多的存儲設備,亦或者使用了更多的高級功能(比如在多個設備之間實現復制或拷貝)之后,問題就會變得更加突出。同時,用戶為了管理存儲而付出的時間和精力也將直線上升,尤其是需要做哪些費時費力的工作時更是如此,比如數據遷移。
當然,數據存儲的成本不僅僅來自于主存儲這么簡單。實際上,我們存儲的每一比特數據都依賴于一整套的信息服務生態系統。最明顯的例子莫過于數據保護系統,它通常由幾個不同的部分組成,包括如跨磁盤和磁帶的多級介質管理,以及數據離線的保存與管理等。構建全面的數據保護系統所需的開銷是很大的,有時候用戶花費在主存儲上的費用與之相比或許都會相形見絀。
除了數據保護之外,還有很多其他的費用開銷。法規遵從和保護知識產權的需要使得用戶不得不將數據保存更長的時間。為了在更長的時間周期內維護更多的數據,企業必須構建一整套的基礎設施和流程以便進行數據信息的歸檔、搜索和恢復。容災是另一項不能忽視的數據保護功能,而且費用也非常高。容災不但需要復制引擎、冗余的存儲設備,而且要消耗大量的帶寬資源,這都會給用戶帶來沉重的成本負擔。
當下,有一個熱門概念叫做“虛擬機密度(virtual machine density)”,Taneja Group公司做過大量的針對服務器虛擬化的基準測試,用來衡量虛擬機的承載密度。他們的理念認為不同的虛擬化平臺效率是差不多的,因此只要硬件的資源足夠,相應的也就可以運行更多的虛擬機或者實現更好的性能。所以,當我們把硬件、軟件許可、管理員工作以及數據中心資源消耗等因素做通盤考慮之后,也就能核算出最終的費用開銷。在存儲行業,我們看到一個類似的概念叫做“存儲密度(storage density)”。通過全面的分析容量、系統、帶寬開銷以及人員工作量,“存儲密度”能夠幫助我們衡量一個產品或技術幫助用戶消減數據管理成本的效果。
盡管這不是一個全新的理念,但直到最近業內才開始使用這樣的方法,嘗試將許多獨立的存儲產品組合在一起進行統籌分析。從某種程度上說,這也反映了企業IT行為的轉變。隨著虛擬化應用逐漸成為市場的主流,數據保護的技術和方法也必須相應地隨之改變。同樣,數據存儲產品也朝著更優化、性能更高、以及更通用的方向發展。
很多廠商都在大力宣傳自己的產品有多高的存儲效率。但他們也經常誤導用戶,衡量存儲效率通常需要通過軟性的、定性的數據進行分析。簡單的通過一兩個維度和參數并不能全面衡量效率高低,比如單純的強調“容量優化”并不可取。我們評價一個產品是否具有較高的存儲密度或存儲效率,也不是一句話就能說清楚的。
近期我們不斷聽到業內傳出存儲密度紀錄被刷新的消息,我認為這些活動也反應了市場的整體情況。在存儲功能不斷趨向融合、彈性存儲架構大行其道的背景下,各廠商都在努力提高自身產品的價值和競爭力。毫無疑問,借助更先進的存儲功能和更大的存儲密度,用戶完全可以進一步的優化自己的存儲規模和基礎架構。由此可見,在這場比拼中用戶才是最大的贏家。