我們知道互聯網存在暗網,其實企業數據也存在暗數據。近日,天極網記者專訪了CommVault中國區技術總監蔡報永,就企業數據中的暗數據問題進行了交流。
CommVault中國區技術總監蔡報永
據IDC估測,到2020年,美國所生成、復制、消費的數據將達到6.6ZB,大約每隔三年將翻一番。ZDNet報告指出2013年,中國產生的數據總量超過0.8ZB(相當于8億TB),是2012年的兩倍。預計到2020年,中國產生的數據總量將超過8.5ZB 。這是一個龐大的數據量,而其中的很多數據仍然處于黑暗之中。
蔡報永繼續介紹到,什么是暗數據?Gartner將其定義為企業在開展正常業務活動期間采集、處理和存儲,但通常無法用于其它目的(如分析、商業關系和直接獲利)的信息 。換句話說,這些數據需要資金來存儲、保護和管理,卻沒有得到高效的利用,不能提升商業價值,甚至可能包含給企業帶來風險的內容。如何挖掘暗數據,釋放更大商業價值?CommVault提供的CommVault Simpana10解決方案可以幫助企業應對暗數據問題。企業可利用CommVault Simpana10更好地搜索、了解和管理企業存儲的海量非結構化數據(如電子郵件等),智能地利用已存儲內容,在數據的生命周期內對其進行管理。
蔡報永表示,合規管理監督委員會的研究顯示,在企業存儲的數據中,69%的數據對企業毫無價值 。為什么還要保留它們?所以,第一步是控制暗數據的龐大數據量。
使用傳統的數據保護方法,只能保留所有的數據,沒有其它的選擇。Simpana軟件基于內容的保留策略能夠僅保留那些對于企業有重要價值的數據,并使企業從中受益。通過使用文件名、類型、用戶或者群、關鍵字、Exchange分類、標簽等用戶自定義策略,Simpana可實現歸檔解決方案的智能化,提取具有商業價值的內容,將數據保留成本最高減少70%。
另外,挖掘暗數據的下一個關鍵步驟是確保擁有一個全面的歸檔策略。邊緣數據和移動設備上生成的數據包含著高價值的內容,可與存儲在虛擬服務器、企業云端或兩者之間的信息媲美。為了確保智能數據策略的成功,必須從所有生成數據的地方采集數據。
Simpana軟件將數據存儲在Simpana ContentStore中。ContentStore是一個后端存儲庫,可根據策略來協調,并進一步降低成本、占用空間、風險和管理開銷。通過將所有企業數據存儲在ContentStore中,企業能夠使用一個單一、不可復制的索引去管理所有數據,從而有助于更好地管理應用、流程和數據流,同時方便地獲取信息,提高生產力、促進協作并提高決策水平。
蔡報永強調,不同員工關注不同類型的數據。銷售團隊需要每個季度的價格趨勢信息,運營團隊需要設施使用方面的數據,人力資源部門則需要詳細的職場滿意度數據。所有這些數據都保存在歸檔信息中,如不用于搜索,它們毫無用處。與其在IT部門中設立一個高成本的數據挖掘和分析團隊,不如讓各個部門能夠自助搜索和訪問所需數據。畢竟,他們才最了解自己需要什么數據。
Simpana軟件能夠讓您的用戶方便地獲取所需信息,無需向IT部門尋求幫助。用戶能夠快速地發現、訪問和分析所需信息,并將它們從Simpana ContentStore中提取出來。憑借對已存儲數據的充分了解,顯著提升企業員工的生產力。
對企業毫無價值的存儲數據正在快速增長,這促使我們對數據從生成到處理的整個生命周期進行評估。事實上,制定內容刪除的治理策略是減少暗數據的一個關鍵。Simpana軟件使用自動化策略對信息進行分類、整理、保留和刪除,從而優化整個信息管理生命周期。Simpana不僅能夠幫自動保留記錄,還能幫助企業更有策略地管理數據,更好地應對合規審計和訴訟。
蔡報永表示,合規審計和訴訟是任何企業都不愿面對的兩件事,但從現實的角度,每個企業都知道他們應該為此做好準備。監管法規涉及所有行業,而且企業也了解法律訴訟對自身構成的風險。而降低此類成本的最佳方法就是主動使用全面的搜索和在線查詢功能。
Simpana軟件的設計初衷就在于通過有效搜索企業所有的電子化存儲信息(ESI),降低成本和風險。軟件通過單一控制臺和ContentStore虛擬存儲庫完成上述任務,確保所發現的信息不僅簡單直接,并且是受保護的,并將發現時間從數小時縮短至數秒。此外,Simpana軟件還能給法務和合規團隊帶來更多便利,它的Case Manager(案例管理)功能可按照具體情況集中運行并管理設備、筆記本電腦、電子郵件和文件的依法保留、分組依法保留和查看功能。
蔡報永最后表示,為了真正挖掘暗數據企業需要一個智能的歸檔解決方案:智能地控制數據存儲量的增長,全面捕獲數據,并為用戶提供簡單的自助訪問功能,同時在它們的生命周期內對它們進行管理,降低合規和訴訟風險及成本。