當前,眾多企業都面對從四面八方涌來的數據流的沖擊。涓涓細流匯成大河,而科技企業、專家、分析師和技術顧問們紛紛將這條數據之河定義為大數據。但是,在這些眾說紛紜的大數據定義中,不乏大量的常見誤解。大量的企業都面臨著挑戰,需要辨別具有價值的數據流,挖掘這些價值,協助企業做出最佳決策以形成強大的競爭優勢。
“大數據”這一術語的內涵遠遠超越了“大”或是“數據”的含義。大數據的確體現為數量龐大,但它仍有更多特性有待了解。在Forrester分析師布賴恩•霍普金斯(BrianHopkins)和鮑里斯•埃韋爾松(BorisEvelson)撰寫的《首席信息官,請用大數據擴展數字視野》報告中,他們提出大數據的4項典型特征——海量(Volume)、多樣性(Variety)、高速(Velocity)。下文將簡要介紹這些特性,并重點闡述大數據對前瞻性商界領袖的重大意義。
海量
企業面臨著數據量的大規模增長。例如,IDC最近的報告預測稱,到2020年,全球數據量將擴大50倍。目前,大數據的規模尚是一個不斷變化的指標,單一數據集的規模范圍從幾十TB到數PB不等。簡而言之,存儲1PB數據將需要兩萬臺配備50GB硬盤的個人電腦。
此外,各種意想不到的來源都能產生數據。例如,從巴塞羅那至沙特首府利雅得的單程航行中,一架商用噴氣飛機上收集的傳感器數據量將超過1PB。當用一次飛行的數據量乘以每天所有飛行的航班數,數據總量將非常驚人。
多樣性
一個普遍觀點認為,人們使用互聯網搜索是形成數據多樣性的主要原因,這一看法部分正確。然而,數據多樣性的增加主要是由于新型多結構數據,以及包括網絡日志、社交媒體、互聯網搜索、手機通話記錄及傳感器網絡等數據類型造成。其中,部分傳感器安裝在火車、汽車和飛機上,每個傳感器都增加了數據的多樣性。
高速
高速描述的是數據被創建和移動的速度。在高速網絡時代,通過基于實現軟件性能優化的高速電腦處理器和服務器,創建實時數據流已成為流行趨勢。企業不僅需要了解如何快速創建數據,還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實時需求。
根據IMSResearch研究機構關于數據創建速度的調查,通過跟蹤可聯網設備的激活量,發現聯網設備增長的第二波浪潮正在加速到來。本輪增長后,將涌現更多新型可聯網設備增長的浪潮。據預測,到2020年全球將擁有220億部互聯網連接設備。
新型分析法
“大數據”這一術語也與從數據中獲得價值所采用的分析法類型相關。由于出現從既有及新興數據類型中獲得商業智能的需求,對現有應用系統造成極大壓力,迫使企業尋求新的解決方案。創建新的分析應用進行多結構數據分析,通常需要進行專業資源和工具的戰略性投資。
對于企業,大數據既是機遇也是威脅。那些能夠管理復雜數據并從中獲得精準商業洞察力的企業將擁有超越競爭對手的重要優勢。反之,那些不能精明管理數據的企業將在競爭中處于劣勢。