數據,不僅是企業的生命線,而且掌控著我們日常生活的脈搏。因此,數據資產對于企業的重要性不言而喻,存儲、管理和保護好這些數據是非常重要的。大數據時代的來臨已經毋庸置疑,Gartner曾總結了大數據的“3V”特點,即大量(Volume)、多樣性(Variety)和速度(Velocity),這也是早期階段企業處理大數據所面臨的三大挑戰。
大數據很復雜,因為它的來源很復雜,從結構化數據到非結構化數據;大數據很復雜,因為它交付和使用的速度,例如實時;大數據很復雜,因為我們生成的信息量是驚人的。以前,我們的家用存儲容量用MB和GB為單位,現在已經是TB,企業級更是用到了PB。
大數據的復雜性也帶來了一系列風險和挑戰。首先,如何理解和利用非結構化形式的大數據;其次,如何獲取最重要的數據,并將其實時地交付給合適的人群;第三,如何保存這些數據,這其中就涉及到隱私性和安全性等諸多難題。
大數據所帶來的潛在機遇不言而喻,但同時諸如數據隱私、監管和法律挑戰等風險也需要企業提高警惕。在這個情況下,企業必須提升效率、優化性能和簡化管理,才能更好地應對大數據所帶來的風險和挑戰。
然而,很多企業并沒有做到這一點,例如很多企業沒有制定一個合理的備份策略,導致數據量日積月累變得越來越龐大,冗余數據充斥著整個環境,既沒有達到保護數據的初衷,反而帶來更沉重的負擔和潛在的存儲風險。這時候,傳統方法已經不再奏效甚至是詬病叢生,用戶利用能夠提高存儲效率的同時、更好地完善備份和災難恢復策略才能雙管齊下地降低存儲風險。
企業在IT預算有限的情況下,人力資源也是難以調配的,如果通過管理員手動進行優化和管理,不僅效率極低,如果沒有周密的規劃會耗費大量時間反而做無用功。因此,利用自動化的方式優化存儲,通過軟件的自動處理來取代可能耗費大量人工的工作是十分有必要的。
如果企業有很多應用,老舊的系統通常會給應用過量分配存儲空間,而事實上很多容量是處于閑置狀態的,因此應該根據實際需求分配容量才是高效率的做法。但是,讓管理員時刻關注容量使用情況并且手動為應用分配存儲空間顯然是非常耗費時間和精力的,如果有自動精簡配置這樣技術就可以自動地分配存儲空間,并且會在容量用盡之前自動提醒用戶,避免影響業務的正常運轉。
很多用戶有需要頻繁訪問的“熱點”數據和高IO的需求,一方面,人工識別熱點數據即加重管理員的負擔,又是需要相當周密的規劃,另一方面,以前可能我們只是通過增加硬盤數量來提供高IO,但實際數據量并沒有那么大,導致容量利用率甚至不足10%。自動分層技術通過軟件自動處理和追蹤數據訪問頻率,讓我們可以將重要數據或者訪問頻繁的數據保存在高速存儲介質中,訪問頻率較低的數據放在性能和成本也相對較低的介質中,提高了資產利用的同時降低管理成本。
對于磁盤備份用戶來說,每完成一次備份,都會備份大量與之前相同的文件和數據,產生相同數據的多個副本,隨著時間推移,冗余數據將充斥著寶貴的磁盤空間,這時候管理員手動定位和刪除冗余數據顯然是不切實際的,需要一種自動化的數據精簡工具來減少需要備份的數據量。而且,不管是數據中心內部的備份,還是以容災為目的的遠程備份,都是需要占用大量帶寬的,重復數據刪除技術可以將新的備份數據與之前的備份數據進行對比,消除冗余數據,減少對以上兩種傳輸的帶寬需求,從而加快備份速度。
另一方面,不同價值的數據需要用不同價值的存儲資源來保存,同時也應該有不同的數據保護等級。用戶不能只顧著提高效率而忽略數據保護,實際上,在運用高效存儲技術的同時也可以降低數據保護成本,反過來數據保護對于系統效率也是有促進作用的。因此,提高存儲效率和降低數據風險這兩者是需要緊密結合,可以同時實現并且相互作用的。