早在20世紀90年代的美國沃爾瑪超市中,就有“啤酒與尿布“的故事表現了大數據分析給企業帶來的利益體現。這些年來大數據分析正在為企業帶來巨大的變化。雖然越來越普遍,但數據分析中有些“YES”和“NO”卻是必須遵循的。
YES!立體式分析
立體式分析即維度分析。產品數據挖掘應該在產品環境下從產品性能、市場需求、用戶體驗等方面切入分析。數據分析是帶有商業性的,因此要立體性對于數據進行深層次整理分析,才能將各方面有價值的信息提煉出來對產品優化帶來幫助。
YES!明確適用性
要注意每種統計分析方法的適用范圍。許多分析方法對數據的要求很高,如果樣本分布不符合要求,樣本量數量不足,或存在大量偽樣本,都將影響最后結果的正確性。譬如,我們經常要使用的因子分析、聚類分析,若樣本量不足通過SPSS獲得分析結果是沒有任何意義的。
YES!正確整理數據庫
在選擇好分析方法分析數據時的同要按照要求整理數據庫。錯誤的數據庫格式對研究的弊處是顯而易見的。在使用研究模型前,要考慮數據的適用性。同時,數據的合理轉換也很重要。如在訪問時經常提問出生年份而非年齡,這樣可以避免誤差。這樣將收集到的數據進行轉換也得到一樣的結果。在計算時,我們還常整合幾個變量成為一個或者另幾個變量。
YES!分析數據可視化
大數據的體現往往是以海量的形式,而數據分析首先要整理,其次要分析。大數據的分析將能將普通的數字變成珍貴的信息,體現未來的趨勢和相應的結果。一號店等企業使用大數據魔鏡,將大數據可視化分析作為基礎,建立起一體性的業務模型和產品,明確了顧客關系,提高了運營效率,運用數據規?;瘞椭髽I規劃。漢堡王通過Tableau系統讓了解每天的業績更便捷,為企業帶來更大利潤。
NO!輕視精準
數據中的每一個小數點都可能帶來巨大的影響。因此數據分析不能有“不準確可以再改”的想法。做數據分析最基礎的是要有嚴謹的態度和科學的方法。
NO!分析方式不當
數據分析是一項專業性技能,需要使用專業工具進行分析。一般分析數據的工具有Excel、報表工具、BI等,還有最新型的可視化數據分析產品魔鏡。應當使用專業工具進行數據分析,可利用圖表表達分析結果。而不能粗略地計算數據,以此保證其有效性。
NO!忽略數據源
足夠多的數據的確是實現技術的前提,但數據越多并不是結果越準確。一旦不能保證數據來源的準確度,大量的數據反而會使數據分析難度加大,從而使最后作出不準確決策。因此不能盲目追求數據量的大,而要同時對數據源的準確性有保證。