即便看似繁瑣,但在數據存儲過程中備份著實是不可或缺的。我們每天,甚至更為頻繁地備份數據——以便在威脅來臨之際進行恢復。但究竟多久才會恢復一次呢?在談及到數據備份與恢復的話題時,備份卷與還原卷的比例又是如何?
數據丟失已是一種極為常見的難題,因此企業或組織會考慮將數以百倍的數據量進行備份,而在恢復時卻遠沒有這么多。換而言之,這種備份定會產生些許商業價值;又或者是我們是否可以在保證商業價值的同時,減少些許工作量。
備份層
常見的數據備份和恢復方式是備份整臺計算機。但這或許并非保護應用程序及其數據的最有效方式。
數據中心中的許多應用都有自身的恢復策略。假如使用這些內置的功能,我們或將可以節省下許多備份操作。
Microsoft Windows文件共享延續了先前版本的一項功能,可以對被刪除的文件提供用戶自助式的服務。數據庫應用程序使用日志來從最近的備份啟用時間點恢復。假如我們知曉這些保護層,便可以調整備份策略,減少備份頻率,提升效率。
多久備份一次?一次備份多少?
備份的頻率越高,恢復至故障點的間隔越小;不過你需要傳輸更多數據,以及更多的空間用于備份存儲。
當前多數備份應用程序并不會每次都創建一份完整的備份;這些應用在首次會進行一次完整的數據拷貝,而后便以增量備份方式遞增,從而讓傳輸的數據量最少。從完整拷貝到增量遷移所帶來的效率改善,使得我們可以進行更加頻繁的備份,但這樣做時,我們并不考慮備份是否產生業務價值。而假如了解應用程序的業務價值,我們可能會根據數據丟失的業務風險來降低備份的頻率。
備份與歸檔
這里我們要強調備份與歸檔之間的差別。備份是將數據返回到過去的最近的一個時間點,備份所還原的數據仍具有當前的業務價值。所以說,我們需要備份是由丟失數據所引起的業務風險驅動的。數據備份和恢復是一個相對頻繁的活動,需要盡快完成,以免因此而延遲了業務運營。
而歸檔則用于從某個遙遠的時間點來審視當時的業務狀況。歸檔所恢復的數據不再與當前業務息息相關。歸檔需求是由法規遵從所驅動的。將歸檔用于恢復非常少見,并且只能恢復到較長時間之前,實時性較高的業務運營難以依靠這種方式的恢復。
由于目的性的不同,備份通常存儲在磁盤;而歸檔在俄更多存儲于磁帶或基于云計算的對象存儲上。歸檔中的數據較為靜態,而備份數據則可用于提供即時的業務價值。
瀏覽你的備份
這里還要指出哪些存儲特性有利于數據備份與恢復。備份通常是順序和寫入密集型的操作;而恢復則是連續和讀取密集型的。
備份存儲通常被優化,用于存儲大量數據和順序訪問。生產系統中的主存儲往往存儲量較小,優化用于隨機訪問。假如備份存儲需要定期瀏覽和順序訪問任務,我們可以將其從主存儲上移除,從而使主存儲發揮更好的性能。
這里舉一個瀏覽的例子——根據合規要求查找特定的個人身份信息,同時檢查出那些不符合支付卡行業數據安全標準的信用卡號,將其從系統中移除。
移除操作仍需要在主存儲上進行,但是我們可以將掃錨操作放到二級存儲上完成。
由備份而生的DevOps
過去幾年中,出現了新一代的數據備份與恢復產品,使用固態磁盤和硬盤驅動器的組合。這種混合備份存儲為隨機訪問固態存儲的數據提供了出色的性能。
其結果是這些備份存儲可以用于測試和開發活動。在將新應用部署到生產環境之前,可以簡單地在生產環境副本中測試。其可以集成到持續進行的整合部署通道中,從而使得內部開發的新軟件版本在部署前便已經通過了最新和最準確的生產環境數據副本的測試。完整的生產數據是DevOps環境中測試功能的最佳場所。