相比居于第二線的備份設備,網絡存儲設備有許多不同的特性,連帶De-Dupe技術也面臨不同的要求。
對能效更敏感
將數據以重復刪除運算分解為基本元素與索引存儲,以及反向運作將經過重復刪除運算后的數據回復為原始狀態,以便供前端主機存取,都需要消耗運算資源。
網絡存儲設備必須應用前端主機即時寫入與讀取數據的要求,對能效十分敏感,不能允許因執行De-Dupe與還原運算,而導致前端主機的存取出現延遲。
重復刪減率先天較低
許多備份型De-Dupe技術宣稱的20~30倍,甚至是50倍以上的空間節省比率,都是以“每天執行全備份”為基準。
一般情況下,企業數據的變動量通常有限,每天新增或變動部份,占總數據量的比率并不大,因此若每天都執行全備份,則兩次全備份之間,絕大部分的數據顯然都是重復的。在這個基礎上運用De-Dupe,得到幾十倍的空間節省效果是理所當然的。
但換成網絡存儲環境,就沒有前述那種數據先天就帶有很高重復性的現象,能縮減的比率十分有限。
網絡存儲直接處理原始數據
備份裝置存放的數據是原始數據的復本,只有需要還原時才派得上用場;網絡存儲裝置存放的,則是必須隨時應用前端主機存取的原始數據。因此整合在網絡存儲設備中的De-Dupe技術,對重復刪減運算法的可靠性與可用性,將有更高要求。
需與其他存儲功能整合
許多增益存儲功能,都是基于網絡存儲設備的原始磁盤進行,如快照Clone遠端復制等,因而在網絡磁盤運作的De-Dupe,也必須整合這些應用功能,不能因啟用De-Dupe而妨礙其他功能執行。