本文主要講述數(shù)據(jù)挖掘分析領(lǐng)域中,最常用的四種數(shù)據(jù)分析方法:描述型分析、診斷型分析、預(yù)測型分析和指令型分析。
當剛涉足數(shù)據(jù)挖掘分析領(lǐng)域的分析師被問及,數(shù)據(jù)挖掘分析人員最重要的能力是什么時,他們給出了五花八門的答案。
其實我想告訴他們的是,數(shù)據(jù)挖掘分析領(lǐng)域最重要的能力是:能夠?qū)?shù)據(jù)轉(zhuǎn)化為非專業(yè)人士也能夠清楚理解的有意義的見解。
使用一些工具來幫助大家更好的理解數(shù)據(jù)分析在挖掘數(shù)據(jù)價值方面的重要性,是十分有必要的。其中的一個工具,叫做四維分析法。
簡單地來說,分析可被劃分為4種關(guān)鍵方法。
下面會詳細介紹這四種方法。
1. 描述型分析:發(fā)生了什么?
這是最常見的分析方法。在業(yè)務(wù)中,這種方法向數(shù)據(jù)分析師提供了重要指標和業(yè)務(wù)的衡量方法。
例如,每月的營收和損失賬單。數(shù)據(jù)分析師可以通過這些賬單,獲取大量的客戶數(shù)據(jù)。了解客戶的地理信息,就是“描述型分析”方法之一。利用可視化工具,能夠有效的增強描述型分析所提供的信息。
2. 診斷型分析:為什么會發(fā)生?
描述性數(shù)據(jù)分析的下一步就是診斷型數(shù)據(jù)分析。通過評估描述型數(shù)據(jù),診斷分析工具能夠讓數(shù)據(jù)分析師深入地分析數(shù)據(jù),鉆取到數(shù)據(jù)的核心。
良好設(shè)計的BI dashboard能夠整合:按照時間序列進行數(shù)據(jù)讀入、特征過濾和鉆取數(shù)據(jù)等功能,以便更好的分析數(shù)據(jù)。
3. 預(yù)測型分析:可能發(fā)生什么?
預(yù)測型分析主要用于進行預(yù)測。事件未來發(fā)生的可能性、預(yù)測一個可量化的值,或者是預(yù)估事情發(fā)生的時間點,這些都可以通過預(yù)測模型來完成。
預(yù)測模型通常會使用各種可變數(shù)據(jù)來實現(xiàn)預(yù)測。數(shù)據(jù)成員的多樣化與預(yù)測結(jié)果密切相關(guān)。
在充滿不確定性的環(huán)境下,預(yù)測能夠幫助做出更好的決定。預(yù)測模型也是很多領(lǐng)域正在使用的重要方法。
4. 指令型分析:需要做什么?
數(shù)據(jù)價值和復(fù)雜度分析的下一步就是指令型分析。指令模型基于對“發(fā)生了什么”、“為什么會發(fā)生”和“可能發(fā)生什么”的分析,來幫助用戶決定應(yīng)該采取什么措施。通常情況下,指令型分析不是單獨使用的方法,而是前面的所有方法都完成之后,最后需要完成的分析方法。
例如,交通規(guī)劃分析考量了每條路線的距離、每條線路的行駛速度、以及目前的交通管制等方面因素,來幫助選擇最好的回家路線。
結(jié)論
最后需要說明,每一種分析方法都對業(yè)務(wù)分析具有很大的幫助,同時也應(yīng)用在數(shù)據(jù)分析的各個方面。