擁有大量的數據對于組織來說是一種法律要求,也是一種責任。
許多組織仍然依賴磁帶進行數據備份,但在日益數字化的世界中,他們是否應該這樣做?
當一家組織詢問是否應該將所有備份數據從磁帶傳輸到云存儲時,這成為了一個令人關注的問題。該組織涉及的數據總計2PB,存儲在幾百個磁帶上,涵蓋了過去五年的數據備份。該組織正在探索將其轉移到云端的想法,并采用了磁帶數據恢復服務。乍一看,外包解決方案的成本似乎很高,因此需要其他的建議。
該組織了解自己想要實現的目標,關鍵問題是為什么他們認為這對其業務是必要的措施。這不僅僅是磁帶和云存儲各有自己優勢的問題。他們需要解決的問題是:如何使用每周和每月精心備份的數據。換句話說,為什么要存儲這么多數據,真的需要這些數據嗎?如果需要的話,如何更快地訪問所需的數據?
磁帶仍存在于云中
磁帶如今已經存在和使用了很長一段時間,并且存儲容量很容易擴展。但是也有一些難以克服的問題。例如并不可靠,在緊急情況下可能不容易恢復數據。大多數內部IT團隊都不喜歡使用磁帶備份,因為磁帶備份有失敗的可能。盡管如此,對于長期數據保留和非現場歸檔,仍然是一種有效且廉價的選擇,而且許多公司仍然對它有一定的依賴性。
事實上,云存儲也使用磁帶長期存儲數據。例如, 如果查看Microsoft Azure中的blob存儲,就會發現存儲在磁帶上的數據。AWS Glacier也是如此,其磁帶只是隱藏在云存儲技術的背后,因此,用戶可能并沒有意識到這些,除非他們詢問云計算提供商。換句話說,通過將數據從磁帶移動到云端,組織不一定要選擇技術上更可靠的存儲介質,但可恢復性的問題就交給了云計算提供商。是否更改存儲介質的決定與存儲策略有關,而不是技術。
磁帶索引可能不足
為了評估磁帶到云存儲的建議,組織必須決定他們想要什么,以及認為有必要這樣做的原因。如果希望能夠按日期恢復(因此在某個日期驗證文件的狀態),則需要保留所有數據。如果他們希望按文件夾、文件名或塊進行恢復,這將使他們能夠使用重復數據消除來刪除保存的同一文件的多個副本,因此需要的存儲空間將會顯著減少。通常,重復數據消除2PB的數據會將其減少到原始大小的15%~20%,這將使該公司需要大約300~400TB的存儲空間。
他們還需要考慮如何搜索想要檢索的數據。即使要查找諸如姓名之類的特定數據,也需要計算機取證技術,例如磁帶索引上沒有足夠的細節來說明某人在某日發送了帶有附件的電子郵件(盡管最近的存儲系統包括這種類型的搜索功能)。而恢復文件或文件夾要容易得多。
如果可以恢復的內容對業務沒有用處,那么在這兩種解決方案上都不值得投資。如果不檢查數據的完整性并對所有的磁帶進行編目和索引,那么要做到這一點絕非易事。
外包磁帶解決方案提供商曾提出對數據進行分類,并對每一盤磁帶進行審查,這也是成本高昂的原因之一。然后,客戶可以一次性檢索所有數據,或者購買保險單來選擇要恢復的磁帶。它們可以通過TFTP或客戶提供的NAS進行訪問以進行恢復。
更多數據是法律要求還是法律責任?
在這一點上,每個組織都必須考慮到它實際需要存儲數據的目的,以便制定其備份策略。由于監管或法律原因,可能需要承擔數據恢復的費用。例如,在受監管的環境中,需要遵循薩班斯-奧克斯利法案(Sarbanes-Oxley),因此組織擁有正確的備份策略至關重要。
但是在其他情況下可能會有大量數據。搜索文件和檢索數據可能帶來不必要的成本,并且會干擾日常業務。例如,在GDPR法規要求下,組織保存更多的數據將增加響應的時間和成本。
每個組織都必須問自己以下這些問題:
•檢索特定數據需要多長時間?
•檢索到這些數據后,這些數據對組織有什么價值?
•保留特定類型的備份對業務有何好處?保留這些備份的成本是多少?
在定義其策略時,組織應同時考慮合規性。無論它決定保留多少數據,它都應能夠證明已盡其所能響應所收到的任何數據請求。
這應該包括一個清晰的獲取和處理備份的過程,對存儲時間有一個時間限制,以及一個銷毀舊數據的過程。組織需要計算出所需的最少數據是多少,最終只保留需要的數據。例如,對于五年以上的數據,可能應該決定只保留某些特定的數據。同樣,更新的備份產品使這一點更加容易。
在某些行業領域(如建筑業),組織在項目關閉時對所有重要的內容進行最終備份,然后應刪除所有其他來源的物理文件或副本。這些備份必須是永久性的(或者至少是很長的時間)。隨著每五年推出一次新的備份解決方案,必須確保這些現有的歸檔文件仍然可以訪問,并在必要時將其存儲到新介質。云存儲至少能解決存儲媒介變化的問題。
云原生組織實施云備份更加容易
對于沒有采用磁帶存儲的組織來說實施云備份要容易得多。在基于云計算的系統中,啟用重復數據刪除和壓縮后,數據存儲就不再是一個難題。Veeam等產品可永久提供增量備份。這意味著從理論上講,它們只保存每個文件的一個副本,并只記錄更改。然后,可以每周或每月編寫一次合成的完整備份,并且可以恢復所有數據。保留期限的設置是標準的,搜索功能顯著提高。Office 365和Druva還提供了復雜的索引編制和搜索功能,從而可以在核心文件中定位和查找數據。
但是,使用磁帶備份的組織面臨著同樣的困境。他們可能想知道需要做出什么決定。例如決定將輔助備份移至Microsoft Azure,因此他們不再采用大量的磁帶進行存儲。有些組織仍在評估是選擇將原有數據傳輸到云平臺還是將其保留在NAS上并自行編目。但是,他們現在需要了解其決策背后的戰略,并制定可靠的備份策略。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。