6月8日消息,數據中心不斷地被大量數據們淹沒,那么作為數據中心的管理員們,能不能就舍棄一部分不需要的數據呢?
最重要的擔心就是怕錯過任何可能的有用信息。你公司的營銷副總裁很有可能會有朝一日讓你提供一份公司過去20年的銷售數據。而上面的領導一換,說不定新的數據要求在等著你。
還有一個非常現實的原因,那就是有些公司會申明永久保留數據,盡管這些數據幾年、幾十年都沒人用過。顧能咨詢將其稱之為“暗數據”,并將其定義為“在正常經營活動中的信息資產組織收集、處理和存儲,但一般不能用于其他用途(例如,分析,業務關系和直接貨幣化)的數據。這類似于物理研究中的暗物質,暗數據是信息資產“宇宙”中的大部分組成結構。因此,組織或公司經常保持暗數據用作參考資料。”
那么,到底你是否可以“減倉“暗數據的同時,并確保保留必要的數據? 這里有三個建議。
1:篩選數據
如果你使用的是機器或者是互聯網產生的大數據,你在得到有用信息的同時也接受了許多無用的垃圾。數據過濾可以分離出你想要的信息。
2:導出數據
如果你希望為了將來做長期趨勢分析而準備為數據保留個幾十年,將這些數據導出到一個值得信賴并基于云計算的供應商是一個不錯的選擇。這樣,在時機成熟時,你就可以自由地將存儲的數據導回到你的數據中心進行分析。
3:定義數據保留政策
你可以在定義數據保留政策時表現得強勢點。你作為一名數據管理人員,有理由來參與和指定數據保留的政策。這是具有優秀數據中心管理能力的一個標志。
小結
這會不會解決你所有的大數據存儲管理和保管問題?沒有,但它會給你的數據中心指明了正確的道路。它還將使你成為一名優秀的數據管理人員,能夠宏觀地預測數據方向和參與數據保留政策的制定。