大數據時代,數據呈爆炸式增長。從存儲服務的發展趨勢來看,一方面,對數據的存儲量的需求越來越大;另一方面,對數據的有效管理提出了更高的要求。大數據對存儲設備的容量、讀寫性能、可靠性、擴展性等都提出了更高的要求,需要充分考慮功能集成度、數據安全性、數據穩定性、系統可擴展性、性能及成本各方面因素。
大數據的存儲及處理不僅在于規模之大,更加要求其傳輸及處理的響應速度快。相對于以往較小規模的數據處理,在數據中心處理大規模數據時,需要服務集群有很高的吞吐量才能夠讓巨量的數據在應用開發人員“可接受”的時間內完成任務。這不僅是對于各種應用層面的計算性能要求,更加是對大數據存儲管理系統的讀寫吞吐量的要求。
大數據由于其來源的不同,具有數據多樣性的特點。對于傳統的數據庫,其存儲的數據都是結構化數據,格式規整,相反大數據來源于日志、歷史數據、用戶行為記錄等,有的是結構化數據,而更多的是半結構化或者非結構化數據,這也正是傳統數據庫存儲技術無法適應大數據存儲的重要原因之一。所謂存儲格式,也正是由于其數據來源不同,應用算法繁多,數據結構化程度不同,其格式也多種多樣。因而大數據的存儲或者處理系統必須對多種數據及軟硬件平臺有較好的兼容性來適應各種應用算法或者數據提取轉換與加載。
欲了解《中國數谷2016數博會特別報道》和貴陽的更多資訊,可登錄中國大數據產業觀察網、貴陽網,也可關注“數據觀”“貴陽日報官方微信”“貴陽頭條”。