大數據領域正在發生巨變。有更多的數據被創造、存儲和遷移,而企業比以往任何時候都更加渴望從中獲取價值。
對數據增長的預測令人震驚。美國計算機科學公司(CSC)估計,到2020年,超過三分之一的數據都會途經或存放于云端。數據存儲廠商易安信(EMC)表示,數字世界的規模目前每兩年就要翻上一番,待到2020年,每年生成和復制出的數據將達到44ZB。
按照思科(Cisco)的說法,要不了五年,智能手機的網絡流量就會超過電腦的網絡流量。該公司預測,到2020年,電腦在網絡流量中的占比將只有29%,而智能手機將占到30%。而若僅就物聯網而言,麥肯錫全球研究所(McKinsey Global Institute)預計,到2025年,嵌入式傳感器和聯網設備對世界經濟的貢獻將高達6.2萬億美元。
如何對迅猛增長的數據量進行有效管理?這已經成為一大難題。Unisphere Research近日對身為獨立甲骨文用戶聯盟(Independent Oracle Users Group,簡稱IOUG)成員的數據管理者和數據專業人士進行了一項調查,發現數據足跡的實例數量和規模大小都在膨脹,給管理者帶來了不小的挑戰。據甲骨文(Oracle)贊助的《迅速加快的云事業:2015年IOUG數據庫可管理性調查》(The Rapidly AcceleratingCloud-Enabled Enterprise: 2015 IOUG Survey on Database Manageability)報告顯示,大多數受訪者稱他們的數據量每年增長10%以上;至少38%的受訪者稱他們的公司管理著至少100個不同的數據庫,較2013年的調查結果(25%)有所上升。
數據庫規模方面,10%的受訪者稱數據規模每年在以超過50%的速度增長,另外28%的受訪者稱增速超過20%。這項調查發現,為了維護數據環境的通用性和一致性,市場對自動化和主動式管理的需求均有所上升。
隨著企業從墨守成規向創新轉變,易安信贊助的另一項IOUG調查發現,雖然很多企業繼續通過添加更多的存儲陣列和服務器等硬件來應對令人頭疼的數據庫和數據中心挑戰,但提高效率的進階方法也越來越受關注。整合、自動化和虛擬化便是三種直接關系到這些受訪者所在企業未來能力的數據管理方法。
總而言之,隨著數據種類、數據量和處理速度的增長,需要采取新的數據管理方法。如今,數據湖使企業能夠積累大量數據以供將來分析,云技術為企業獲得所需技術和服務大開方便之門,人工智能則有望主動簡化數據管理。開源技術對大規模數據處理的價值也越來越受關注,比如Spark和Hadoop,以及能在通用硬件上運行、支持非結構化和非關系型數據的各種NoSQL數據庫變體。此外,數據發現和數據可視化對普通商業用戶大有好處,不斷發展的物聯網提供了大量的實時數據分析機會,還有各種各樣的方法可以從新的數據源中獲取價值。
為了應對IT行業的迅速變遷,有些公司甚至進行重組,希望以此令自己處于最有利的地位,牢牢抓住新的機遇。在過去的一年里,很多引人注目的并購和拆分已經或即將完成,有些行業專家預測科技企業在證交所掛牌上市的數量將出現增長。
為了幫助企業繼續充分利用他們的數據,美國《大數據季刊》(Big Data Quarterly)發布了第二屆年度“大數據企業50強”榜單。就管理數據和從數據中獲取價值而言,榜單上這些具有前瞻意識的企業正在為我們創造新的可能。