《企業(yè)網(wǎng)D1Net》1月17日訊
說起大數(shù)據(jù),相信很多人都覺得自己對大數(shù)據(jù)的了解已經(jīng)達(dá)到一定深度,然而,大數(shù)據(jù)仍然有一些神秘的面紗沒有被揭開。
業(yè)界正在逐步開始區(qū)分大數(shù)據(jù)和云計算兩個概念,對大數(shù)據(jù)的需求主要集中在分析和應(yīng)用當(dāng)面,關(guān)注數(shù)據(jù)架構(gòu),并面向業(yè)務(wù)問題解決。對云計算的需求主要在資源的服務(wù)模式方面,主要指資源動態(tài)分配和按需付費的商業(yè)模式。
我們在看回大數(shù)據(jù)本身,中國工程院院士倪光南這樣認(rèn)為“大數(shù)據(jù)從數(shù)據(jù)挖掘、商業(yè)智能(BI)發(fā)展而來。”我們從數(shù)據(jù)量、數(shù)據(jù)特性、數(shù)據(jù)來源、應(yīng)用領(lǐng)域四個方面給商業(yè)智能和大數(shù)據(jù)做個比較,兩者還是有著明顯區(qū)別。
據(jù)悉,大數(shù)據(jù)有著“實時”性的特征但并不意味著真正的實時,而往往是近似的實時,并且其還具有新的數(shù)字?jǐn)?shù)據(jù)源特點。
我們現(xiàn)在看到的大數(shù)據(jù)分別包括了個人、公共部門、私人部門三種,這些數(shù)據(jù)共享后,進(jìn)行數(shù)據(jù)挖掘和分析,可以對突發(fā)事件更快的跟蹤和響應(yīng)、對違紀(jì)性質(zhì)和變化的更好了解、對需要服務(wù)地區(qū)的準(zhǔn)確定位、對于供求關(guān)系的預(yù)測能力。這一流程組成了我們大數(shù)據(jù)的生態(tài)系統(tǒng)。
倪光南為我們講述了大數(shù)據(jù)的典型處理流程包括數(shù)據(jù)獲取和記錄、數(shù)據(jù)清潔/抽取/標(biāo)注、數(shù)據(jù)的整合/聚類/表達(dá)、數(shù)據(jù)分析/建模、以及數(shù)據(jù)解釋等5個階段。而在處理過程中,異構(gòu)行、規(guī)模、及時性、復(fù)雜性和隱私權(quán)等問題是大數(shù)據(jù)想要創(chuàng)造價價值所需解決的困難。
而在分析過程中我們要從數(shù)據(jù)中發(fā)現(xiàn)關(guān)聯(lián)性,從而正確提供更快速近似的預(yù)測。但是許多新數(shù)據(jù)源的價值不在于規(guī)模和速度,而在于包含的信息豐富性。
D1Net評論:
要揭開大數(shù)據(jù)的神秘面紗,撇不開與云計算的關(guān)系,大數(shù)據(jù)與云計算相輔相成,沒有大數(shù)據(jù)的需求,云計算的功能也就不能完全發(fā)揮,同樣道理,沒有云計算的推動,大數(shù)據(jù)也就無法保持長遠(yuǎn)發(fā)展。