在本文中,作者斯科特·辛克萊爾將為廣大讀者諸君分析對象存儲存在于當今的數字化市場的必要性,同時,還將為您重點介紹Cleversafe公司的解決方案。斯科特·辛克萊爾撰寫了關于對象存儲的理想使用案例,并介紹了購買這種技術時需要考慮的相關要素。他認為,Cleversafe公司的對象存儲解決了歸檔/內容存儲庫、歸檔合規性、內容分發、數據湖/hub樞紐、備份目標、協同和企業內部部署云的使用案例等一系列問題。最終得出的結論是,對象存儲為“數據的保護和規模化提供了一個相當卓越的方法”,建議客戶保持領先于數據爆炸似增長的曲線,并盡早部署對象存儲,而不要拖延。
什么是對象存儲?
當涉及到在過去的十年里的信息技術時,如果說存在一個普遍性的共識的話,那就是:數據的增長是不可避免,不可阻擋的!無論是由個人或專業動機的驅動,我們每個個體所創造出的數字資產比以往任何時候都要多得多。無論是任何行業,當前企業組織的成功運營均取決于其利用數字化資產的能力。無論是充分利用更高分辨率的視頻數據的媒體和娛樂業界或是對數字化的影響進行更現實的開發,捕獲詳細的3D或4D地震數據的能源勘探企業;又或是安全系統公司捕捉高分辨率的安全性素材;還是在線內容分發、創作行業。對于幾乎每一個行業,有效利用數字資產對于保持其市場競爭力都是至關重要的。
隨著數字化內容的激增,以及我們一貫的盡量避免法律訴訟的企業文化的事實,從而帶來了對于監管法規的遵守、加強企業內部控制和對于流程的審查的日漸增加,并要求現如今的企業組織在存儲和策劃管理內容時,要比以往任何時候都負擔起更多的責任。在某些情況下,企業組織甚至需要為了應對未來可能面臨的法律訴訟,而打造一種需要將數據保存幾十年,乃至更長時間的企業文化。而隨著機器數據、以及物聯網(IoT)的出現,內容創作有望擴展到遠遠超出了以前的僅由人類創造內容的限制。最終的結果是,在未來,幾乎每個人、每件事物都將創建某種形式的數據,而這些數據將必須被存儲和保護一段時間(即使不是無限期的)。而較之任何其他存儲架構,對象存儲就是專為存儲和保護由此所產生的巨大的內容庫而設計的。
正如固態技術的興起出現是為了響應對于性能需求的增加一樣,旋轉介質已經開始專注于高容量和成本最優化的存儲,以更低的成本提供更大的容量。盡管這些成本降低在底層的存儲硬件基礎設施、存儲系統容量已經達到了一個臨界點,傳統存儲和保護技術的一個閾值,如文件系統已經不再是可行的選擇方案了。而對象存儲架構則提供了存儲和保護大容量內容環境中至關重要的必要功能。而鑒于數字化內容在未來幾年的預期增長,對象存儲看起來或將占到企業存儲部署的一個更大的比重。
RAID的局限性和對象存儲的需要
對象技術為應對存儲和保護大量非結構化的數據所帶來的挑戰提供了一個直接的響應。傳統的存儲陣列往往利用RAID技術,在規模化方面具有嚴重的局限性。
2015年,由ESG集團所進行的一項研究調查顯示了一般存儲行業的發展趨勢。作為這項研究的一部分,ESG集團采訪了373名負責其所在企業組織的數據存儲環境的IT決策者。而受訪者們所被要求回答的問題之一便是其所在企業組織當前所面臨的最大的存儲挑戰是什么。答案毫不奇怪:數據的快速增長被認為是當前企業組織所面臨的一個最大的挑戰。有趣的是(當然其實也不算太奇怪),在排名前10的挑戰中,剩下的幾項挑戰均可以被歸納為是由于數據增長所帶來的癥狀。諸如硬件成本、數據保護成本、人員成本的增加等挑戰都是由數據的增長而創建或加劇的。
此外,與大規模的數據保護相關的,還有一些細微的差別。雖然傳統存儲系統的磁盤陣列RAID的設計主要是為了防止單個驅動器故障,更大的硬盤容量已經轉化為多故障事件可能性的增加,這讓面臨丟失數據風險的企業可能會在相當長的與高密度驅動器相關的重建期間面臨第二驅動器故障的發生。
多故障的情況以幾種不同的方式出現:在一個重建期間,額外的驅動器可能會失敗;或一款預先指定的健康驅動器上的壞領域在一個重建期間可能未被覆蓋,進而導致數據不可恢復。在過去,數據不可恢復的可能性是低的。然而,由于有了更大容量的驅動器,不能恢復某些數據的幾率近年來已經顯著增加。其結果是,該行業已經從推薦的RAID 5轉至推薦的RAID 6,其能夠在一個雙驅動故障的情況下保護數據。而盡管一個第二校驗位(parity bit)的增加已經緩解了對于在重建過程中發現不可恢復的數據的一些擔心,但更大的驅動器的引入也同樣導致了更長的重建時間,增加了數據暴露于可能的次級或三級失敗的時間。雖然發生多故障事件的可能性仍然很低,但對于那些具有數百或數千驅動器的企業組織而言,它們可以提高到不被受歡迎的有害水平。
圖1、企業組織在其存儲環境方面所面臨的最大的挑戰。
Q:一般而言,當涉及到存儲環境時,您認為貴公司當前所面臨的最大的挑戰是什么?您認為上述哪一點能夠被列為您所在企業的最首要的存儲挑戰?(受訪者百分比,N = 373,前十大挑戰)
而由于大量的容量環境往往太大而無法使用傳統的備份方法進行備份,使得這些風險進一步惡化,這意味著在許多情況下,這些存儲庫可能存儲著的可用數據的唯一副本。對象存儲提供了一個新的規模化和保護水平
如下,我們將為大家提供一些對于對象存儲技術的技術洞察,并帶來關于對象存儲技術的背景和歷史的一些討論。傳統的文件系統被設計為以分級的方式存儲內容,經常是在文件和文件夾的樹狀結構中。在這些系統中,用戶可以通過遵循一個路徑到達某個特定位置以訪問一個文件。盡管這種方法可以直觀的用于存儲少量的文件,但當內容存儲爆炸似得增長至十億甚至萬億的文件時,這樣的一個層級訪問方法就太復雜了,在某些情況下,淹沒了傳統的文件系統的存儲體系架構。一旦文件和文件夾達到了一定的數量,某些基于文件系統的解決方案的運行會遇到限制。此外,某些文件系統架構不能有效地擴展元數據,一旦系統超過一定的容量或文件的數目,將極大的影響到元數據操作的性能。
對象系統的設計使用一個替代方法,具備一個單一的和大規模可擴展的平面地址空間,其中文件的訪問通過一個唯一的標識符提供。打個比方,這種差異是,在一個文件系統中訪問一個特定的文件就如同遵循一組方向指引以找到一個位置,例如,“先左轉,然后右轉,等”。而另一方面,對象存儲就像是使用全球GPS定位系統。采用這種更有效的方式確定特定的內容,有助于使對象存儲能夠比傳統的文件系統規模化擴展到實現更高的容量。
對象存儲解決方案,旨在解決保護大容量環境下的挑戰,在這種環境下傳統備份往往不是一種選擇。對象存儲架構通過讓預期的多故障情形變得屢見不鮮來提供強大的保護。對象存儲提供了多種創新,以幫助實現一個更強大的系統:
副本或編碼擦除vs. RAID磁盤陣列:對象存儲通常利用對象復制、刪除編碼,或兩者的組合來提供數據保護,而不是采用傳統的RAID。較之傳統的RAID,這些技術提供了幾大優點,包括利用商品化硬件的能力;采用適用于特定對象或對象分組的特定保護方案,而無需采用一個高強度級別保護方案的能力;以及保護方案能夠隨時間而不斷演變的能力,例如,隨時間的推移將副本保護從四個減少到三個。此外,通過使用副本或編碼擦除技術,對象存儲可以通過將數據散布到多個驅動器、節點、甚至地域,跨多個站點自動擴展保護。
· 重建到可用容量空間:大多數傳統的RAID存儲環境都是典型的“熱備用磁盤”,一款等待生產驅動器失敗后進行接管的免驅動。然而,在出現故障的情況下,只有一個驅動器是用于數據重建的寫入目標,而隨著驅動器容量的增加,帶來了一個顯著進一步惡化的瓶頸。絕大多數的對象存儲解決方案提供了在系統中跨多個驅動器和節點從一款故障驅動器重建數據到可用容量的功能,并由于多個(而不是一個)驅動器的大規模并行屬性的使用顯著的加快了恢復進程,因此大大減少了系統處于退化或脆弱狀態的時間。
· 自愈:其為大大加快恢復時間,并幾乎消除在重建過程中遇到數據不可恢復的風險的另一項創新設計是能夠自愈。對象存儲解決方案通常提供讀取健康數據的后臺進程,并驗證內容是否完好無損。當一個不可恢復的數據被確定,該對象將被重建到可用空間,以確保該數據始終是健康的和可讀的。此外,由于驅動器出現故障往往是在少數領域,而不會全部同時出現故障,借助其自愈性,使得當問題驅動器最終被確定為發生故障失敗時,大部分數據都已經被重建到其他驅動器的健康領域成為了可能。
· 自動地理保護:傳統的存儲陣列往往依賴于文件系統或卷/基于LUN的復制以保護多個站點。這些傳統的存儲容器也經常受到一些架構容量限制的約束,例如16 TB。在這些限制下,為大容量內容存儲環境提供多站點保護會導致笨拙的復制管理政策。多對象存儲解決方案支持一個龐大的,近乎無限擴展的平面地址空間,具有自動多站點保護的功能,大大簡化了多站點的保護,并大大降低了相關的管理成本。
可擴展性和彈性的增強并不是對象存儲基礎設施的唯一優勢,但它們是對象技術區別于更傳統的文件和塊級存儲方法的關鍵架構功能。但是,盡管有許多優點,對象存儲并不是能夠解決所有存儲問題的萬應靈藥。
關于對象存儲的其他注意事項
對象存儲系統是圍繞著存儲和檢索整個對象而設計的,而不是旨在讀取和寫入各個數據塊的基于塊或文件系統技術而設計的。該差異最顯著的影響是寫入性能體驗方面,特別是當用戶或應用程序想要修改一個文件時。不是簡單地修改數據塊,對象存儲系統需要在其能夠被修改之前,讀取全部對象。并且,一旦被修改,則該對象的全部整體將被重寫入存儲平臺。這種架構上的差異引導對象存儲系統到原始的工作負載環境中,其常常是寫入一次而讀取多次(write-once-read-many,WORM)的環境,如醫療成像、能源勘探、或其他具有圖像或視頻媒體內容的工作負載。這些典型的由內容創建的環境很少被修改,但需要保持在線,并能夠被檢索。例如,Cleversafe公司就提供了不可變的數據庫,使得數據不能被刪除,并記錄下對于數據所有的變更,以便其可以在一個非常詳細的級別進行跟蹤。
繁重的事務性工作負載通常更適合于文件或塊存儲環境。然而,伴隨著處理和存儲器技術的進步,集成的固態大大提高了對象存儲解決方案的性能。例如,Cleversafe公司已經提供了一種集裝箱模型,提高利用效率和更小的對象的性能。使得Cleversafe公司得以能夠宣稱,其客戶通過采用他們的模型,較之以往的基于文件的存儲機制,每秒性能提升了300%。在一些情況下,對象存儲解決方案可以被設計為服務于交易事務使用案例,雖然其可能不如其他存儲技術一樣有效。
對于對象存儲而言,其另一個需要考慮的因素和潛在的局限性是有限的存儲協議支持。傳統上,訪問對象存儲是通過HTTP協議的編程訪問實現的。雖然HTTP訪問可以提供某些優勢,但缺乏較為流行的存儲協議限制了其對應用程序的支持。在本文的稍候部分還將對這一挑戰進行更詳細討論,但需要注意的是,最近,大多數對象的存儲解決方案均擴展了協議支持,以包括更多的通用型存儲協議,如NFS和CIFS。此外,S3已經成為一個更廣泛支持的對象協議。
盡管對于高事務性工作負載的效率低下或存在協議支持的局限性,但隨著企業組織處理數據增長方面的經驗的增加,對象存儲系統正在成為他們IT存儲策略的一個更重要的部分。因此,市場上出現了越來越多的能夠解決高容量存儲挑戰的對象存儲產品。
對象存儲的使用案例
當在進行對象存儲解決方案的評估時,我們建議您企業務必要將一些重要的考慮因素納入到您的調查中。如下,我們將為您逐一介紹在考察對象存儲核心功能時需要考慮和權衡的特定要素,以及相關的功能特點對于特定用例的影響。本部分章節的目標是為一般用例和特殊用例在使用對象存儲解決方案時提供一個框架。并將包括一些能夠為一個特定的環境提供相關優勢的例子。然而,企業組織必須始終確保在評估任何對象存儲解決方案時,所使用的是最新的信息。
對象存儲:核心功能的注意事項
對象存儲是由其規模化功能及其能夠提供規模化的保護的能力所定義的。然而,并非所有的解決方案都是以同樣的方式來提供數據的保護或規模化的。故而當您企業組織在進行技術評估時,應考慮如下幾個類別的功能:
復制與擦除編碼:絕大多數的對象存儲解決方案均是通過利用一種復制方法、一種擦除編碼的方法,或二者的某種組合來保護數據。當其被寫入存儲對象,并將每個對象跨環境中的多個節點存儲到多個副本(通常三個或更多個)時,復制保護方案復制一個對象。因此,通常的對象存儲系統將需要在存儲池中至少有三個節點,以提供必要的彈性水平。通過證明三個獨立的物理節點,該解決方案可以丟失兩個,而不用擔心數據丟失。該方案的權衡是,該系統的原始容量需要是所存儲內容的三倍。而對象存儲系統往往將這種保護方案與利用成本較低的硬件的能力結合起來,只使用一個基于復制保護方案本質上可帶來相當大的硬件基礎設施部署的能力。而重復數據刪除或數據壓縮技術可以幫助緩解對于原始容量問題的擔憂,當較之類似的擦除編碼方案時,只提供基于復制保護的解決方案需要原始容量的顯著增加。
另一方面,擦除編碼類似于RAID,可以通過使用類似的信息來提供故障保護,而無需直接增加原始容量。擦除編碼和RAID之間的區別在于,擦除編碼是更靈活的,并且可以在多個驅動器、節點、或甚至在多站點故障生存性的站點之間分發。由于海量內容存儲庫和多站點故障生存的自然調整,最早部署的對象存儲中有擦除編碼。Cleversafe公司聲稱,他們是第一家將擦除編碼技術帶入企業存儲系統市場的供應商。而盡管擦除編碼提供了多故障保護比利用基于復制保護方案所需的原始容量要少得多,但擦除編碼需要更多的處理能力來計算編碼方案,這可能會影響性能,或可能需要更多的處理硬件來實現相同的性能水平。此外,讀取一個對象需要從多個節點以及可能的多個站點訪問內容,這可能會影響到讀取性能。然而,擦除編碼方案可提供靈活性以保護防止大量的故障同時發生,如果需要的話,當使用基于復制保護方案時則可能是不可行的。當然,系統被配置構造為能夠承受的故障越多,所需的硬件投資也就越大,因此,了解更高彈性對于解決方案的成本的影響,并相應地進行平衡是很重要的。
對于響應權衡,一些解決方案提供了一個擦除編碼和復制功能的結合,允許管理員提高的性能和改進的容量優化之間進行選擇。例如,Cleversafe公司就提供了數據復制和基于擦除編碼的保護之間的選擇。
地理分散和多站點保護:數據復制,無論是異步或同步,已經成為傳統的存儲系統的一個共同的特點有一段時間了。雖然一些應用程序可能能夠依靠單獨的備份實施保護,但對于大規模的容量環境,備份則可能不是好的選項了,因為備份所花費時間可能甚至會超過是最廣泛的可接受的窗口。正如本文前面所討論的,隨著容量的增加,主要關注的問題是跨環境管理進行復制政策的管理。多對象存儲解決方案提供自動多站點保護,要么通過一個分布式的擦除編碼方案;要么通過復制功能。毫無疑問,如果您的企業組織支持多個站點,或需要多站點保護,您應該確保您所考慮的任何對象存儲解決方案都要支持自動的多站點保護。
然而,對象存儲解決方案可以以不同的方式提供多站點保護。無論是利用基于副本、或基于擦除編碼模式的基本保護方案,一款多站點的配置可以簡單地將基本保護方案擴展到包括了除主站點上的節點之外的其他站點節點,或在基本保護方案之上復制一個單獨的層。例如,如果系統使用擦除編碼來提供數據保護,該體系架構可以跨物理上各自獨立的站點的多個節點擦除編碼對象或者解決方案可以簡單地復制擦除編碼的部分數據到一個第二或第三站點。另外,如果解決方案利用副本作為主保護方法,該系統可以簡單地始終確保額外的副本被放置在物理上分開的位點的節點中。
例如,Cleversafe公司結合使用其智能閱讀技術,其讀取總是從最快響應的節點執行,并同時使用廣域網優化技術,如利用并行連接,以提高性能。此外,自動站點保護在內容分發或協作用例中是非常有用的,因為內容是自動分發到遠程站點上的。雖然有多家供應商均提供地理分散或多站點保護的解決方案,但當企業用戶在選擇一家供應商時,考察該供應商是否能夠提供關于其是否已有成熟的分布式或全球分布式部署驗證是非常重要的。簡單地聲稱支持全球分布式存儲系統和真正能夠在實踐中提供一個全球范圍內的存儲環境有著本質的區別。
多代架構:大規模環境的一個副作用是,它們通常很難進行遷移。大規模的內容存儲和底層對象存儲基礎設施不能存在于傳統的存儲基礎設施的連續3年的升級周期,因此,對象存儲系統的設計具備了支持多個世代的能力。能夠將多代的硬件合并到一個單一的池,使得對象存儲得以能夠充分利用新的硬件技術,同時消除了對大數據遷移的需要。由于節點需要淘汰,遷移只需要對于那些亟待進行升級的個別節點上完成。由于系統的并行屬性,較之傳統的SAN和NAS的遷移,其淘汰的過程是相對快速和容易的。當一個節點被淘汰后,該節點的數據被簡單地復制到整個集群的自由空間,利用多個驅動器的能力,并行寫入數據。
對象存儲解決方案以不同的方式提供多代支持。一種方法是提供多個設備裝置的選擇,隨著硬件技術的發展演化而不斷開發和提供新的設備解決方案。每一代的設備是都能夠在一個單一的池與前幾代合并和匹配。這種選擇可以提供一個簡單的部署模型,但最終在可用的硬件選擇方面是受限制的。在某些情況下,某些設備型號可能達到其支持的壽命終點時,需要至少進行部分的遷移。雖然這種方法提供了多代的支持,但其靈活性不如第二種方法,第二種方法是簡單地提供對象存儲技術作為軟件,并且允許軟件支持幾乎任何硬件選項。
軟件定義與設備:跨存儲行業的多個解決方案利用軟件定義的存儲術語,每個都有不同的定義。但軟件定義的存儲技術通過提供存儲功能提供了部署的靈活性。在這種情況下,對象存儲功能作為一個軟件包。這一解決方案可以部署在商品化的服務器硬件中,在硬件選擇方面提供了靈活性,進而為IT企業組織提供了一些好處。 通過提供選擇硬件的能力,IT企業組織可以直接降低他們的資本或運營費用。在某些情況下,一家企業組織可以選擇選擇成本較低的商品硬件,而在其他情況下,企業組織則可能會選擇利用一家熟悉的制造商的服務器硬件,以減少管理的復雜性和相關的成本。
此外,雖然傳統的存儲系統最近一直在利用更多的商品化組件,但服務器系統往往比存儲系統提供了一個更快的硬件更新周期。在某些情況下,每12個或18個月就有新技術誕生,而不像存儲系統需要等待三至四年的時間。最終的結果是能夠利用更快的組件,如更迅速的內存和處理,進而帶來了能力的增加或價格的降低。
最后,通過將軟件許可授權從硬件升級周期中分離出來,可以更容易的管理購買周期。但是,傳統的存儲或設備產品也可以提供這些好處。借助硬件和軟件產品的集成,整個解決方案進行了驗證,確保硬件將在軟件中得到性能的優化。此外,有時,傳統的存儲或設備產品部署的復雜性較小。因此,軟件定義的對象存儲解決方案通常還提供一個設備部署選項。 例如,Cleversafe公司就同時提供軟件和設備的選擇。
專有與開源技術:隨著當前企業客戶對于云部署和多租戶IT資源流程解決方案興趣的增加,推動了各種企業內部部署的云計算解決方案的出現,其中的一些,如OpenStack,是作為一款開源解決方案提供的。與任何IT環境一樣,云解決方案需要一個存儲組件。企業客戶希望能夠獲得與其云計算的核心原則相一致的存儲解決方案,如硬件獨立性、無限的可擴展性和可負擔性,使得許多云計算解決方案已經轉向對象存儲,提供了開源版本的存儲技術。這些解決方案,如OpenStack Swift或Ceph,有純開源的形式或由存儲合作伙伴提供支持的捆綁產品的形式可供選擇。開源解決方案的最顯著的優點是其軟件的資本支出,或者換句話說,價格優勢。開源技術免費分發。如果一家企業組織想要從一家供應商處購買企業許可證,是有成本的,但該許可證的定價仍普遍較低。
當評估開源技術與專有產品之間各自的優勢時,注意到更多的存儲成本而不僅僅只是看到單純的軟件許可費用是非常重要的。支持和存儲管理的成本也是相當顯著的一筆費用。開源技術可能缺乏某些更先進的功能及其專用版本的管理功能。
對象存儲:關于使用案例的注意事項
對象存儲的存儲和保護海量內容的能力適用于各種用例。如下,我們將試圖為廣大讀者介紹一些當前較流行的使用案例和這些使用案例所使用到的一些重要功能。這并不是一個詳盡的功能列表清單,而僅僅只是試圖介紹更受歡迎的用例,并強調企業用戶在評估解決方案時需要考察的關鍵功能。
主動歸檔/內容存儲庫:一個歸檔并不是一個備份,雖然這經常被混淆為一體。備份是為了作為生產數據的輔助副本,以便在災難發生和數據需要恢復時,提供一定程度的保護。相反,歸檔則是為了作為長期保存的數據的主副本。在許多情況下,歸檔在一定程度上是為了減少備份基礎設施的壓力。盡管事實上,在許多企業組織中,歸檔與備份往往都是不同的,但磁帶一直是深度歸檔的媒介選擇,一種長時間保留數據,并將數據從主基礎設施中刪除的方式。但是,在過去的十年中,由于政府監管機構的合規性要求和行業內部法律要求施加給企業IT部門的必須能夠以更及時的方式來存檔數據的壓力,推動了按需歸檔內容,并保持內容在線的需求。對內容的需求的增加也帶來了主動歸檔需求的上升,其中數據經常通過磁盤技術而非磁帶,以保持活躍狀態。然而,朝著以磁盤為基礎的基礎設施的轉變,為主動歸檔的存儲基礎設施帶來了一個新的需求清單。環境通常是需要進行少次寫入而大量多次重復的讀取操作,往往是在特定垂直行業的解決方案,再加上垂直行業的軟件應用程序,如醫療歸檔,媒體和娛樂業,或能源勘探行業。而由于物聯網所帶來的由機器產生的數據的增加,這種使用情況在這一領域也開始看到激增。大容量的主動歸檔也使得備份變得很難,即使不是不可能的話。其結果是,環境必須作為歸檔內容的存儲和保護的第一和最后一道防御。因此,積極的檔案必須有足夠的彈性,以承受多種故障,并在多故障事件更常見和預期的環境中運行。對象存儲技術的核心原則,如無限的可擴展性,提供規模化的高水平的彈性的能力,以及承受能力,使對象存儲成為主動歸檔部署的理想平臺。因此,一個主動歸檔可以被認為是在本文稍候所列出的眾多使用案例中的對象存儲的基本用例,許多附加的用例只是一個主動歸檔的變體。
此外,歸檔是為了將數據存儲五年、七年,在某些情況下,甚至幾十年或更長的時間。而企業組織希望存儲數據的時間段會看到無數的硬件版本和升級周期。多代的支持與前面討論的軟件定義的存儲的好處在這種用例情況下尤其有用。企業用戶所需考查的另一個重要特性是能夠與主要解決方案的集成,以便將數據內容從主存儲遷移到一個歸檔對象存儲平臺,而不會影響應用程序。 Cleversafe公司積極配合CommVault和Qstar公司等合作伙伴,并為主動歸檔提供綜合解決方案。其他需要考慮的功能是在對象存儲系統內或云,以及集成的搜索和檢索中的策略驅動的活動或分層功能。
歸檔合規性:類似于傳統的主動歸檔的用例,合規性歸檔需要對象存儲的規模化和保護的功能,以及額外的旨在滿足政府監管機構或行業要求的內容記錄和保存。對于受到多重規定的企業組織而言,包括遵守如商品期貨交易委員會(CFTC)、美國健康保險攜帶和責任法案(HIPAA)、證券交易委員會(SEC)17a-4(f)規定、薩班斯-奧克斯利法案(SOX)和電子記錄管理模型要求規范(MoREQ),等等。
內容存儲解決方案不僅應該保存關鍵和敏感的信息,同時也提供審計報告,以在內部或外部的審計、調查、或訴訟事件中,保護企業組織。一些供應商,如Cleversafe公司在用戶界面維護審計日志和REST API。當部署一個合規性歸檔時,有幾項功能是非常重要的。合規的工作負載往往需要具備確定特定內容的能力,并提供必要的跟蹤和報告,以驗證特定的內容在一定的時間內是否保持不變。通常,使某一特定內容不可變的能力被稱為一次寫入多次讀取( write- once-read-many,WORM)或鎖定。
此功能指定在一個特定的時間段或直到管理員改變內容的狀態之前,某特定類型的內容為只讀。差異往往是通過更大的粒度控制而交付的,其中一些解決方案在卷或文件夾級別適用只讀標簽,而其他解決方案具備基于獨特的元數據信息適用于指定的具體對象的能力。例如,Cleversafe公司提供指定不可變的,消除了刪除任何內容的需求,并記錄所有文件修改的能力的功能。雖然已經有多款解決方案提供了WORM功能,但每款解決方案適用指定只讀功能的方式各有不同。因此企業用戶務必要確保該解決方案符合您行業相應的法規或行業標準。
基于不同的保護級別,解決方案也各不相同。故而企業客戶需要基于預定的時間跨度,如五年或七年,來尋求不可改變的解決方案,而不再需要人工干預。對于許多這類環境,最終的目標是要證明一個特定的對象沒有被修改。如果一個訴訟事件發生,證明一個文件沒有被篡改越是容易,企業組織的運行也就越容易。企業組織同時也需要尋找可以提供版本不變性的解決方案,一個文件可能被修改,但存儲解決方案可以按照指定的時間間隔將不可變的快照或版本存儲起來。一些供應商,如Cleversafe公司就要么通過副本,要么通過不變的時間點快照提供內容的不變性以及版本支持。
對于主動歸檔解決方案,強大的搜索能力對歸檔合規性而言是至關重要的。當一個訴訟行為發生時,適當的材料越容易被隔離,企業操作運行受影響的程度就越小。而解決方案如若沒有搜索功能,在實際法律訴訟期間,如果該企業不能孤立和驗證所有的適當的內容已被提供,則可能需要交出比實際需要更多的信息。最后,企業客戶需要尋找當對象到期的時候可以提供審計和核查的內容是否被破壞,刪除內容以及數據粉碎功能的解決方案。
內容分發:第三個用例需要性能的改進和多站點分布的一個組合。無論是在線數字內容分發、內容聚合(如視頻監控),這種使用案例需要對象存儲的主動歸檔功能,如能夠規模化和保護數據的功能,同時控制存儲成本,而且需要大量的內容在多個物理站點被移動或更新。該解決方案往往需要能夠通過添加更多的存儲節點提供高水平的吞吐量,以及規模化吞吐量性能的能力。此外,還需要具備控制性能的規模化與服務質量(QoS)的能力,以確保其他業務不干擾可用的帶寬。
內容分發網絡(CDN)解決方案旨在支持大量地理上分散的用戶,如用于數字媒體流的向外擴展的Web應用程序。除了必要的性能,這些解決方案還需要具備如果一款存儲解決方案、數據中心,或甚至因特網服務提供商(ISP)出現故障失敗,服務來自多個節點和多個站點的內容,以保護內容交付的能力。例如,Cleversafe公司的智能讀取技術,預測最優的網絡路由和存儲節點來最有效地返回數字內容。然后,數字內容重新組合,同時Cleversafe不斷優化路徑,以實時的以數據流返回內容。如果發生連接故障或服務器放緩,這在互聯網上是屢見不鮮的,內容的再創建圍繞失敗路由和內容交付無縫地發生。對于內容分發體系,也要查看對象存儲解決方案,借助自動的內容地理分發,以及從多個節點和地點提供任何部分內容的能力以提供多站點保護。一些對象存儲供應商,如Cleversafe公司,與多家CDN合作伙伴達成合作伙伴關系并驗證解決方案。
企業內部部署的云計算解決方案:正如前文所提到的,對象存儲解決方案旨在為海量內容的存儲提供經濟實惠的方式,而專有軟件和開源對象存儲解決方案具備云計算的經濟水平和規模化,使企業內部部署的私有云成為可能。隨著云架構層的崛起,無論是以VMware、OpenStack、還是CloudStack的形式,對象存儲的功能均具備匹配一款云基礎設施或超大規模模型的能力。企業用戶需要考察的一個明顯的特征是其是否支持S3和Swift API協議,以及是否是認證的云解決方案,如OpenStack認證。例如, Cleversafe公司支持S3和Swift API協議以實現更好的云集成。除了對協議的支持,軟件定義的存儲架構,實現了硬件的靈活性,可以使存儲部署模型能夠按照硬件的云部署模型進行調整,有助于保持存儲成本的經濟實惠。
具備提供計量和計費報表功能的能力,可以讓企業客戶享受到在多家客戶或租戶之間分離和分配云存儲資源的益處。 Cleversafe公司便是能夠提供多租戶對象存儲提供商的一個例子。企業客戶應該尋找那些可以指定哪些租戶可以訪問基礎架構的組件的解決方案。此外,如果您的組織正在計劃,甚至正在考慮擴大到公共云存儲,混合云的支持也是有益的。
數據湖泊/hub:大數據分析的崛起和源自業務洞察力的改善所帶來的潛在的競爭優勢,使得企業組織近來開始把重點放在采用適當的方法進行數據存儲和數據保護解決方案。正如前面提到的,需要數據湖泊或hub進行規模化,以便跟上內容創建的步伐,進而保護內容,從多個不同協議存儲各種數據類型。
當在評估一款對象存儲解決方案時,除了規模化和對于規模化的保護之外, 還有幾個關鍵性的功能需要考察,其在數據湖泊或hub環境中會有所幫助。尋找能支持多種協議的解決方案,以確保其具備充當多款應用程序工作負載的存儲庫的能力。數據湖環境還可以通過強大的元數據標記得到更好的服務,以保證更好更快的搜索功能。一些解決方案,如Cleversafe公司的解決方案,支持HDFS,并提供與Hadoop環境的集成。直接在既定的存儲環境中運行分析的能力可以減少或消除將數據從存儲系統物理移動以運行分析的需要。
協作:隨著多站點或全球內容協作的普及,對象存儲解決方案可以提供一個可擴展的,企業負擔得起的,和多站點架構,以支持協作應用程序,如文件同步和共享;或視頻編輯。而在線文件同步和共享解決方案,如Dropbox,已經變得越來越流行,許多企業組織希望擁有公共云解決方案的可訪問性但同時又要求將內容保管在企業現場。在ESG集團針對下一代的存儲架構進行調研的過程中,幾家為該項調研做出貢獻的相關機構回應說:他們希望充分享有云服務的可訪問性,但出于對安全問題的擔憂,又將他們排除在采用場外異地內容存儲之外。作為這一發現的一個驗證,該報告發現部署了文件同步和共享應用程序軟件的多家企業組織利用了企業內部部署的內容存儲,如Citrix ShareFile。當企業用戶在尋找一款對象存儲解決方案作為后端的文件同步和共享解決方案時,務必要考察如下幾個關鍵特征: 除了具備對象存儲的可擴展性和規模化保護的主要能力,協作解決方案往往能夠提供更好的自動地理分布的服務能力,使內容可以跨全球環境自動分布。作為這方面的一個例子,Cleversafe公司為其協作解決方案設計了基于地理分布提供消息的能力。此外,通過文件系統協議支持,Cleversafe可以增加其所支持的協作應用程序的數量。因此,Cleversafe提供認證的應用程序同步和與合作伙伴的共享。
備份目標和文件服務器整合:對象存儲也成為了備份目標。隨著備份軟件應用程序支持NAS協議,并于最近加入了云協議的支持,如S3。使得企業的IT部門發現,對象存儲解決方案提供的可擴展性和可負擔性恰好能夠作為備份目標。而企業用戶需要考察的功能特點則包括高帶寬和吞吐量的支持,容量和性能的擴展能力,價格的可承受性,以及重復數據刪除和壓縮功能。包括Cleversafe公司在內的多家存儲供應商,也被證實能夠與各種備份軟件供應商的產品兼容,如賽門鐵克、Veeam公司、CommVault公司和Unitrends公司。
雖然文件服務器整合是典型的NAS使用案例,將NAS協議納入多個對象存儲解決方案,結合一些文件系統供應商利用擦除編碼技術進行數據保護的事實,使得在最近幾年間,NAS與對象之間的界線已經變得模糊了。一些供應商提供了特定的功能以服務于傳統NAS工作負載,例如部署家庭和文件共享。
對象存儲具備跨多個IT環境服務大量不斷增加的使用案例的可能性。雖然該技術在占據存儲市場的主導地位之前,仍然尚有很長的一段路要走,但目前多個行業的趨勢是有利于對象存儲的發展的。而在不太遙遠的未來,存儲將不再被諸如光纖通道或NAS等協議來定義,甚至被定義為塊和文件是可能的。隨著對象存儲和固態的組合創新,未來的存儲可能會轉移到劃分為低延遲的事務存儲和海量內容庫。如果這樣的轉變發生,對象存儲可能會以能力平臺的選擇方式出現,提供了一個具備高度可擴展性和企業負擔得起的存儲基礎,以支持各種各樣的工作負載。
更全面的真相
無論是我們個人或企業組織的專業用途,現如今的我們已經對數據變得“貪得無厭”了。而隨著硬盤驅動容量能力的不斷增加,現有的存儲架構已經突破了其過去的極限。對象存儲提供了一種優越的方法在高容量點來保護和規模化數據存儲。而隨著諸如企業內部部署云存儲、物聯網和大數據分析等新的趨勢的興起,對于對象存儲能力的需求將有可能繼續增加。考察該問題的最簡單的方法是:以目前的增長率,一家典型的企業組織內所存儲的內容終將達到其以傳統的手段所無法再被保護的地步。傳統的外部存儲解決方案,旨在整合數據存儲以實現更容易管理,將無法跟上數據增長的步伐,并將使自己成為孤島。由此產生的孤立的數據池將不僅是更難以管理和保護,但也更難以利用和分析。即使企業組織在今天能夠使用,但一個引爆點很可能在地平線上的某處。當到達臨界點時,一個潛在的痛苦的遷移事件會發生。在早期,您企業可以過渡到一個架構,可以更好的規模化。有了恰當的架構,以前的單純地保持發展速度的負擔被釋放,IT資源可以更多地被用于專注于商業價值的增加。在這個不斷變化的世界中,企業組織一直在尋找利用數據,以找到競爭優勢。 消除基礎設施規模化縮放的負擔,進而轉移企業IT的工作重點,以最大限度地提高數據的價值將是領先和落后企業之間最大的差異。