在當(dāng)今互聯(lián)網(wǎng)發(fā)達(dá)的信息社會,處處充滿商機(jī),有商機(jī)的地方就有大量數(shù)據(jù)。就數(shù)據(jù)本身而言,并不是越多越好,也并不是存在就有價值。只有把數(shù)據(jù)跟它所在的需求背景相關(guān)聯(lián),并轉(zhuǎn)化為價值,這時的數(shù)據(jù)才具有存在的意義。商業(yè)智能(BI)是一種企業(yè)輔助工具,利用BI將數(shù)據(jù)進(jìn)行處理,來支持并產(chǎn)生企業(yè)決策。
企業(yè)經(jīng)營分析的目的是通過分析的結(jié)果資料,提供具體可行的改善方案,給經(jīng)營決策層進(jìn)行參考,已達(dá)到合理化管理和提高經(jīng)營績效的目的。具體來說必須借助企業(yè)內(nèi)生產(chǎn)、物料、成本、財務(wù)、HR等全部資料進(jìn)行分析才能產(chǎn)生分析結(jié)果資料。
任何需求來源于業(yè)務(wù),業(yè)務(wù)決定了需求,需求分析的正確與否關(guān)系到BI項目能否成功。因此數(shù)據(jù)模型在數(shù)據(jù)倉庫中的作用尤為重要。在現(xiàn)實項目中,有很多比較死板的數(shù)據(jù)模型,面對更多報表與業(yè)務(wù)分析時,只能依靠BI工具去努力實現(xiàn)新的業(yè)務(wù)邏輯。比如工具不能支持,或沒人能挖掘出這個功能,那么就會耽誤整個項目的進(jìn)程。
BI項目的經(jīng)典辦法是確定業(yè)務(wù)系統(tǒng)范圍,根據(jù)分析要求構(gòu)建數(shù)據(jù)倉庫,開發(fā)ETL過程獲取數(shù)據(jù),分析建模并根據(jù)分析模型進(jìn)行分析應(yīng)用(展現(xiàn))實施,最后完成交付。這樣的過程有很多成功的案例自激勵著我們,但有更多不如意和無奈的項目在提醒我們。原因有很多究其本源,一方面是經(jīng)營分析范圍或者說是內(nèi)容方面,一方面是經(jīng)營分析方法層面的問題??蛻敉M诰唧w的項目中一次解決兩各方面的問題。
這樣我們的BI團(tuán)隊面臨以下挑戰(zhàn):
第一,要了解面向業(yè)務(wù)級應(yīng)用,針對不同業(yè)務(wù)部門的具體需求,如何在統(tǒng)一業(yè)務(wù)語義模型的基礎(chǔ)上,而又滿足不同部門不同階段的業(yè)務(wù)分析需求;
第二,如何在具體的邏輯建模上去滿足客戶業(yè)務(wù)需求,包括從粒度、周期、字段描述等角度結(jié)合。如何基于成熟行業(yè)模型產(chǎn)品去擴(kuò)展表、視圖、字段,并根據(jù)需求去合并、匯總來滿足客戶業(yè)務(wù)分析、挖掘和查詢需求和需求變化;
第二,對分析維度的重定義。分析維度往往來源與ERP等業(yè)務(wù)系統(tǒng)的檔案數(shù)據(jù),但是進(jìn)行業(yè)務(wù)分析時這些檔案所產(chǎn)生的維度遠(yuǎn)遠(yuǎn)不夠,比如進(jìn)行成本分析時擴(kuò)展維表以滿足客戶個性化的維度描述的需求,包括以擴(kuò)展字段的方式,也包括表、視圖的擴(kuò)展;
第三,對事實表的擴(kuò)展。擴(kuò)展事實表,以及滿足客戶對分析的需求。包括結(jié)合度量和新的維度描述,生成新的字段,也包括維度事實表的建設(shè);
第四,用數(shù)據(jù)模型支撐ETL。在ETL階段,往往會因為數(shù)據(jù)量太大,而導(dǎo)致不能在客戶要求周期內(nèi)完成ETL,造成BI整體失敗。
如果不談BI產(chǎn)品從數(shù)據(jù)模型層面談,我們需要把數(shù)據(jù)模型更靈活更高效的建設(shè)起來。如果在項目中,只是根據(jù)業(yè)務(wù)需求做臨時的數(shù)據(jù)模型,這樣對整體業(yè)務(wù)起不到很好的支持作用,并且一旦業(yè)務(wù)需求發(fā)生變化,原有的數(shù)據(jù)模型需要做重大修改。
這就需要在DW中構(gòu)建兩種不同的數(shù)據(jù)層面,一層是大家都比較熟悉的業(yè)務(wù)主題數(shù)據(jù)模型,根據(jù)系統(tǒng)中抽取的業(yè)務(wù)數(shù)據(jù)創(chuàng)建業(yè)務(wù)主題分析數(shù)據(jù)模型,根據(jù)業(yè)務(wù)主題進(jìn)行數(shù)據(jù)分析這方面在已經(jīng)有很多案例,也有成熟的方法論。但這樣做是工程性的工作,通過業(yè)務(wù)數(shù)據(jù)創(chuàng)建的分析模型對業(yè)務(wù)數(shù)據(jù)本身有極大的依賴性,不同的項目可以進(jìn)行復(fù)用的是方法,而非分析模型本身,而且跨主題的分析對模型而言是極大的挑戰(zhàn)。
如果基于業(yè)務(wù)主題數(shù)據(jù)模型再構(gòu)建一層——分析主題數(shù)據(jù)模型,通過分析數(shù)據(jù)模型用戶可以定義出ERP系統(tǒng)或其他業(yè)務(wù)系統(tǒng)中不存在的分析維度(而這些維度是分析所必要的),如分析利潤用戶需要定義利潤組成項目,典型案例如會計報表中的損益表(雖然損益表的格式是基本固定的但企業(yè)中的分析不僅僅限于這些固定報表)。分析主題數(shù)據(jù)模型需要提供相應(yīng)的構(gòu)建功能,完全可以由用戶自行創(chuàng)建分析項目,并根據(jù)創(chuàng)建的分析項目從業(yè)務(wù)數(shù)據(jù)中填充數(shù)據(jù),完成數(shù)據(jù)獲取。
根據(jù)分析要求定制的分析主題數(shù)據(jù)模型,無需考慮系統(tǒng)中業(yè)務(wù)數(shù)據(jù)是否滿足,基于公式表達(dá)式的數(shù)據(jù)處理,可以為分析數(shù)據(jù)提供更加靈活的數(shù)據(jù)獲取方式。定制的分析主題數(shù)據(jù)模型能夠從業(yè)務(wù)主題數(shù)據(jù)模型中填充數(shù)據(jù),也可以從外部數(shù)據(jù)導(dǎo)入填充數(shù)據(jù)。一方面:實施人員可以基于分析模型進(jìn)行分析展現(xiàn)的實施,通過導(dǎo)入數(shù)據(jù)與最終用戶進(jìn)行溝通確認(rèn)。另一方面:實施人員和最終用戶都可以基于分析模型的要求完成業(yè)務(wù)數(shù)據(jù)處理的設(shè)置,如果業(yè)務(wù)主題模型中的數(shù)據(jù)不滿足根據(jù)實際情況擴(kuò)展業(yè)務(wù)主題模型,或者通過分析數(shù)據(jù)模型提供的導(dǎo)入模板完成數(shù)據(jù)導(dǎo)入。
分析主題數(shù)據(jù)模型由于其在結(jié)構(gòu)方面脫離業(yè)務(wù)語義可以在不同的項目中復(fù)用,維護(hù)分析數(shù)據(jù)模型的經(jīng)驗可以得到有效的復(fù)制和傳播,基于分析主題數(shù)據(jù)模型完成的分析應(yīng)用也可以在不同的項目中進(jìn)行復(fù)用。對實施伙伴和用戶而言,對分析數(shù)據(jù)模型使用時間越長,積累越多,能夠獲得更多的效率提升和專業(yè)提升。對BI團(tuán)隊而言能夠資產(chǎn)化的可能性越高,可以將資產(chǎn)化的分析主題數(shù)據(jù)模型和分析應(yīng)用再作為最佳實踐進(jìn)行傳播,最大化的固化和沉淀每個項目成果提升團(tuán)隊的交付效率和業(yè)務(wù)分析的專業(yè)性。