管理人員往往希望從不同的角度來審視業(yè)務(wù)數(shù)值,比如從時(shí)間、地域、產(chǎn)品來看同一類業(yè)務(wù)的總額。每一個(gè)分析的角度可以叫作一個(gè)維,因此,我們把多角度分析方式稱為多維分析。以前,每一個(gè)分析的角度需要制作一張報(bào)表。云蛙數(shù)據(jù)自主知識(shí)產(chǎn)權(quán)多維數(shù)據(jù)分析系統(tǒng)(GmmCube)由此產(chǎn)生了,它的主要功能,是根據(jù)用戶常用的多種分析角度,事先計(jì)算好一些輔助結(jié)構(gòu),以便在查詢時(shí)能盡快抽取到所要的記錄,并快速地從一維轉(zhuǎn)變到另一維,將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展現(xiàn)在用戶面前。
從2008年開始,云蛙數(shù)據(jù)著手自主版權(quán)的GmmCube解決方案的設(shè)計(jì)和研發(fā)工作。最先設(shè)計(jì)的是OLAP的元數(shù)據(jù)模型實(shí)現(xiàn)整體的Java解決方案。在2009年,我們進(jìn)行了大量的Java代碼測(cè)試和功能測(cè)試。2010年,在元數(shù)據(jù)結(jié)構(gòu)基本確定后,我們采用Java代碼初步實(shí)現(xiàn)了核心算法,但在數(shù)據(jù)傳遞、執(zhí)行效率等各方面還有諸多技術(shù)問題。2011年,我們對(duì)技術(shù)路線作了重新調(diào)整,將系統(tǒng)的高效率和實(shí)用性放在首要位置,更新了元數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì),專門設(shè)計(jì)了多維模型的定義語言和多維查詢語言;并采用Java語言首先實(shí)現(xiàn)整個(gè)系統(tǒng)。
從用戶角度分析GmmCube目前主要成果是:
(1)前臺(tái)分析工具實(shí)現(xiàn)
提供簡(jiǎn)單易用的圖形化界面給管理人員,由他們自由選擇要分析的數(shù)據(jù)、定義分析角度、顯示分析結(jié)果。GmmCube完成的是對(duì)用戶數(shù)據(jù)的整理和觀察,可以說,它的工作是總結(jié)過去。在此基礎(chǔ)結(jié)構(gòu)之上,GmmCube可以發(fā)揮更進(jìn)一步的作用,利用數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)問題、找出規(guī)律,達(dá)到真正的智能效果:預(yù)測(cè)將來。
(2)數(shù)據(jù)挖掘工具實(shí)現(xiàn)
正如在礦井中可以挖掘出珍貴的礦石,在數(shù)據(jù)里也常常可以挖掘出業(yè)務(wù)人員意想不到的信息。它比多維分析更進(jìn)一步。例如,如果管理人員要求比較各個(gè)區(qū)域某類業(yè)務(wù)在過去一年的情況,可以從多維分析中找答案。但是,如果管理人員要問為何一種業(yè)務(wù)在某地區(qū)的情況突然變得特別好或是不好,或者問該業(yè)務(wù)在另一地區(qū)將會(huì)怎么樣,這時(shí)數(shù)據(jù)挖掘工具可以作出回答。
簡(jiǎn)單的說,數(shù)據(jù)挖掘使用統(tǒng)計(jì)、分析等數(shù)學(xué)方法、以及電腦學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等人工智能方式,從大量的數(shù)據(jù)中,找尋數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系。這種關(guān)系,一般顯示數(shù)據(jù)組之間相似或相反的行為或變化。一個(gè)細(xì)心的分析者,往往能從這些發(fā)掘出來的關(guān)系得到啟示。而這種啟示又很可能使得到它的業(yè)者,獲得其他競(jìng)爭(zhēng)者所沒有的先機(jī) 。
因此,在實(shí)施GmmCube時(shí),一般分兩步走:第一步實(shí)現(xiàn)多維分析,構(gòu)造商業(yè)智能的基礎(chǔ),實(shí)現(xiàn)分析應(yīng)用;第二步實(shí)現(xiàn)數(shù)據(jù)挖掘,發(fā)揮商業(yè)智能的特色。