分析機構Gartner副總裁Donald Feinberg表示,數據存儲的角色之所以會有所轉變,其中一項因素就是數據不僅在數量上變多,而且日益復雜,對于5到10年前所設計出來的數據存儲系統來說,就必須要能處理資源的多樣性、復雜性、巨大的容量而且系統反應速度要即時等特性。而他認為,雖然大數據對不同產業都有不同的意義,但基本上,大數據代表的就是大量、復雜和非結構化的數據。
但是,對于擅長處理結構化數據的關聯式數據庫管理系統來說,是很難去處理大數據的。因此,Donald Feinberg表示,目前大部分的企業會特別打造一個空間或是平臺來存放非結構化數據或是大數據。
應用大數據的來臨,Donald Feinberg表示,未來邏輯數據存儲的概念將會浮現,也就是將不同性質的數據存放在不同的數據庫中,就可以用適當的工具來獲取正確的資源,同時,邏輯數據存儲會利用適當的后設數據連結所有數據存儲系統中不同的數據。
Donald Feinberg也表示,有許多工具都是用來處理巨量而非結構化的數據,但是,將有很多應用程式是使用MapReduce技術開發。
數據存儲廠商面臨必須快速回應查詢的挑戰
大數據影響層面之廣,IDC軟件市場分析師鍾翠玲表示,大數據對于各方廠商都是新的戰場,其中也包含了存儲廠商,像是EMC買下數據存儲軟件業者Greenplum就是一例。原因正是,她認為,數據存儲的確是可應用大數據的主力。
不過,對數據存儲廠商來說,還是有不少挑戰存在,首當其沖的是,他們必須要強化關聯式數據庫的效能,增加數據管理和數據壓縮的功能。
因為過往關聯性數據庫產品處理大量數據時的運算速度都不快,需要引進新技術來加速數據查詢的功能。另外,數據存儲的廠商也開始嘗試不只采用傳統硬盤來存儲數據,像是使用快速閃存的數據庫、閃存數據庫等,都逐漸產生。
另一個挑戰就是傳統關聯性數據庫無法分析非結構化數據,因此,并購具有分析非結構化數據的廠商以及數據管理廠商,是目前數據存儲大廠擴展實力的方向。
數據管理的影響主要是數據安全的考量。IDC軟件市場分析師吳乃沛表示,大數據對于存儲技術與資源安全也都會產生沖擊。首先,快照、重復數據刪除等技術在大數據時代都很重要,就衍生了數據權限的管理。
舉例來說,現在企業后端與前端所看到的數據模式并不一樣,當企業要處理非結構化數據時,就必須制定出是IT部門還是業務單位才是數據管理者。而吳乃沛表示,由于這牽涉的不僅是技術問題,還有公司政策的制定,因此界定出數據管理者是企業目前最頭痛的問題。