大數據不僅僅意味著數據大,最重要的是對大數據進行分析,只有通過分析才能獲取很多智能的、深入的、有價值的信息。下面介紹大數據分析的五個基本方面——
預測性分析能力:數據挖掘可以讓分析員更好地理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。
數據質量和數據管理:通過標準化的流程和工具對數據進行處理,可以保證一個預先定義好的高質量的分析結果。
可視化分析:不管是對數據分析專家還是普通用戶,數據可視化是數據分析工具最基本的要求,可視化可以直觀的展示數據,讓數據自己說話,讓觀眾聽到結果。
語義引擎:由于非結構化數據的多樣性帶來了數據分析的新的挑戰,我們需要一系列的工具去解析、提取、分析數據,語義引擎需要被設計成能夠從“文檔”中智能提取信息。
數據挖掘算法:可視化是給人看的,數據挖掘就是給機器看的,集群、分割、孤立點分析還有其他的算法讓我們深入數據內部,挖掘價值,這些算法不僅要處理大數據的量,也要處理大數據的速度。