在廣播、媒體、零售、地理信息系統等一些面臨最嚴峻的數據存儲挑戰的行業里,很多企業不再將他們的數據稱為“數據”,而是稱其為“內容”、“資產”或“信息”。
在廣播、媒體、零售、地理信息系統等一些面臨最嚴峻的數據存儲挑戰的行業里,很多企業不再將他們的數據稱為“數據”,而是稱其為“內容”、“資產”或“信息”。這些企業認識到,他們的員工或客戶可以利用這些數據信息來為企業創造價值,進而深入地去了解如何幫助企業增加收入、促進產品上市、贏得競爭優勢、并且提高利潤率。它表明存儲不僅僅是支出,更能夠賦能企業。
目前業界對這一認識的支持率有不斷增高的趨勢。 昆騰的許多用戶都屬于此類思想領先的公司,以下是從他們的經驗中吸取的一些重要經驗:
經驗之一:選擇適合數據或信息“工作流”的存儲系統:這是顯而易見的道理,因為任何行業對數據的處理過程都是一個工作流的過程,例如數據的產生(采集)、編輯加工、再加工、分發結果等。在工作流中,數據不能丟失,還要能夠在全球范圍內將其分享,同時根據不同業務的需求還要能夠幫助快速訪問數據。 因此,工作流對存儲有著特殊的需求。然而,許多公司卻試圖用通用型的存儲去滿足本來無法滿足的特殊需求。例如,對于某大型零售公司,存放廣告的視頻和圖像的存儲竟然和存放大數據庫和郵件用的是一樣的存儲。其實,我們應該為工作流選擇適合它們特點的存儲,根據工作流和用戶的需求、針對每個數據類型來考慮并設計存儲系統。
經驗之二:將更多的數據存儲更長的時間,使用戶能夠從數據中獲得更多價值:例如,基因組測序的研究數據就是一個很好的案例,當前的研究完成后,有時候不能立刻知曉結果的價值如何。然而,幾年后的研究可能會產生出更加重要的發現。這正是前期的數據是“具有不可預測價值的數據”的有力證據。 地理空間信息系統也是如此,當前捕獲的衛星圖像可能對10年后的任務或行動提供支持。由此可見,長期保留數據的價值是不可預測的。 分層存儲系統是目前將更多的數據存儲更長的時間的最優方法,也是最節約資金的一種方法。大多數數字內容都是“非結構化”的,是無法縮減或壓縮的大文件,而且大多數此類內容需要保持可用性和可訪問性。不過,它們可能在一段時間內,數天甚至數年都不會被訪問。通常的正確做法是分層存儲系統,即用加工時使用閃存存儲-速度最快,而加工完畢長期保存時使用磁帶這種成本低、功耗低的存儲-速度夠用、但成本最低。其他類型的存儲如NAS、塊存儲、對象存儲和云存儲等也可以在大多數工作流中發揮作用。事實上,我們期望云計算在未來能夠成為大多數分層存儲工作流的一部分。
經驗之三:用戶首先要先能訪問數據,然而才能從數據中發掘出價值