雖然中國大數據市場還處在初級階段,但增速非常迅猛,應用也極其廣泛,不管是云計算、物聯網、智慧城市還是移動互聯都要與大數據扯上關系。都說未來是數據為王的時代,大數據應用將會越來越廣泛的落地在各個領域,大數據絕對是企業未來實現業務突破的重點。那么,到底大數據和存儲有什么樣的關系呢?
三大點囊括大數據需求
大數據就是大量的數據,人們用它來描述和定義信息爆炸時代產生的海量數大數據時代來臨。那么,大數據到底有多大?有資料顯示,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多;發出的社區帖子達200萬個;賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬而到了2020年,全世界所產生的數據規模將達到今天的44倍……
事實上,大數據不僅是大,它的復雜性對于各行各業的企業而言都是一個頭疼的問題。因為客戶無法在一定時間內使用傳統數據庫軟件工具對大數據內容進行抓取、管理和處理的數據集。幾乎所有的企業都會關注在處理有意義的大數據之上。談到這一點就一定要結合中國的大數據特點來看,正是因為這些特點促成了今天中國的行業客戶面對大數據應用時的需求在一定程度上存在的共性。簡而言之可以歸結為以下三點:
首先,數據體量大,這些大型的數據集有可能會達到PB規模。 說到這個數據量級,人們首先會聯想到學數字圖書館,高校數字圖書館或是國家數字圖書館可以說是開啟了大數據時代PB級數據管理的一個典型案例。這要求信息基礎架構平臺能夠動態地支持多重數據,滿足人們對數字的不同性能要求、不同的容量要求,并且隨時能夠改變;需要有效地管理共享資源,存儲資源按需分配,同時通過配額管理功能,以提高利用率。
其次,數據類別繁瑣,囊括了半結構化和非結構化數據,從而促使客戶需要借助智能工具,實現對所有類型數據的索引、搜索和發掘。最后,所有的這些大數據應用的需求,都能夠為企業帶來價值。雖然很多企業都擁有可用的、高質量的海量數據,但如何保護這些海量、非結構化的用戶數據,并時時進行信息挖掘,給未來教育帶來更大的可能,則對行業技術研究者的想象力提出了挑戰。另一方面,數據是各個行業經營、管理和決策的重要基礎,數據綜合利用是近年來也是各行各業信息化建設的核心。使企業持續發展的數據業務建設提速,給各行業運營中心對數據進行集中處理提出了更高的要求,這也成為行業客戶發展規劃中的重要內容。
最后,安全性,自2005年,美國銀行加密的磁帶丟失,造成了大量客戶資料泄露,從此以后,數據存儲的安全性就一直受到人們的關注。隨著云計算和大數據技術落地,大數據信息存儲的安全性又一次被重視,各行各業客戶同樣面臨著數據時代的挑戰。
存儲應對大數據多樣需求
綜上所述,各行各業對于大數據應用的需求、性能的關注、可靠性的要求,同時也是企業需要滿足自身對于業務系統的需求,而基于存儲對大數據的可管理性、高性能、容災保護、資源整合和總體成本等方面的性能,幾乎囊括了滿足大數據多樣需求的可能。
今天,隨著“互聯網+”時代的進程加速,信息化建設突飛猛進,數據信息量的快速增長的大數據時代,處理大數據的真諦就是利用存儲在海量數據中淘金的過程。
那么,存儲是如何應對數據需求增長的呢?
存儲適用于各行的數據靈活方案
結合整個行業來看,存儲能夠幫助客戶應對在醫療、生命科學、能源研究、社會基礎設施等各領域的諸多挑戰和需求。
首先,針對大數據的容量需求,利用針對結構化數據的虛擬存儲平臺是大數據處理的一個很好方案。可實現將其全部虛擬化,并將同一類型的硬盤(如SSD、SAS、SATA)重新“捆綁”在一起。針對結構化數據的存取動態分層技術。一定要“快”。可以根據數據被調用的頻率,自動將常用的數據搬到最高層,提高效率。
其次,針對大數據最于難應對的非結構化數據,數據存儲介質,大致經歷幾個階段:較早以前是用光盤刻錄數據,這種方式費時費力。后來,改用磁帶庫,成本低,存取也很快。如果磁帶在磁帶庫中,每分鐘可調取幾百 M 數據,如果不在磁帶庫中,就要先找到磁帶。但是今天,這些方案都不能滿足客戶業務的即時性和連續性需求。
最后,所有的大數據方案都是為了給客戶帶來大價值。雖然擁有龐大的數據,但是躺在那里睡覺的數據是沒有任何價值的,只有盤活這些數據,才能體現出數據資產的價值。只有可利用的解決方案,才能充分發掘數據資產的價值。
目前,雖然中國大數據市場還處在初級階段,但增速非常迅猛,應用也極其廣泛,不管是云計算、物聯網、智慧城市還是移動互聯都要與大數據扯上關系。未來是數據為王的時代,大數據應用將會越來越廣泛的落地在各個領域,而存儲絕對是企業未來應用大數據實現業務突破的重要媒介。