大數(shù)據(jù)不僅僅意味著數(shù)據(jù)大,最重要的是對大數(shù)據(jù)進行分析,只有通過分析才能獲取很多智能的、深入的、有價值的信息。下面介紹大數(shù)據(jù)分析的五個基本方面——
預測性分析能力:數(shù)據(jù)挖掘可以讓分析員更好地理解數(shù)據(jù),而預測性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結果做出一些預測性的判斷。
數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理:通過標準化的流程和工具對數(shù)據(jù)進行處理,可以保證一個預先定義好的高質(zhì)量的分析結果。
可視化分析:不管是對數(shù)據(jù)分析專家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求,可視化可以直觀的展示數(shù)據(jù),讓數(shù)據(jù)自己說話,讓觀眾聽到結果。
語義引擎:由于非結構化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新的挑戰(zhàn),我們需要一系列的工具去解析、提取、分析數(shù)據(jù),語義引擎需要被設計成能夠從“文檔”中智能提取信息。
數(shù)據(jù)挖掘算法:可視化是給人看的,數(shù)據(jù)挖掘就是給機器看的,集群、分割、孤立點分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部,挖掘價值,這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。