強大的計算能力,令人難以置信的數據量,以及獲得驚人進展且能夠讓所有行業各種規模的企業都可以輕易獲取的分析技術匯集在一起,改變了業務決策的面貌。數據科學家和業務分析師擁有一個不同尋常的“沙盒”,可以在里面建立模型,測試想法,確定應對挑戰的解決方案,并利用機遇。
人們對分析能力是否是企業正面資產的問題并沒有真正的疑問。然而,仍然存在的巨大挑戰是如何彌合數據科學家在實驗室中取得成果與能夠實際應用到企業當中的成果之間的鴻溝。如果不采用有效手段將成果轉化為其他人可以理解、使用和執行的東西,數據科學小組得力工作的影響將大打折扣。
將實驗室和企業連接起來,或更重要的是將分析和行動連接起來,是數據驅動型企業的重要一步。為此,我提出以下五個步驟,幫助企業將分析層面的成果轉化為公司層面的成功:
步驟1:記錄數據
當用戶注意到一個業務解決方案時,應該很容易找出是哪些數據構成洞察力的基礎。這種透明度對信任的建立至關重要。決策者不是數據科學家并不意味著他們對業務知之甚少。決策者需要相信使用的數據來源得當,隨后的分析是建立在高質量、可靠的數據之上。簡言之,人們需要信任和理解數據。
步驟2:讓用戶自己運行查詢
授權用戶自己運行查詢至關重要。 許多了解自己數據的用戶就想自己運行查詢。 有些用戶希望深入了解最本質的SQL。這些用戶希望查看查詢過程的詳細信息,并跟蹤被執行的步驟。對于希望深入了解查詢內部工作機制的高管或管理人員來說,記錄下來的查詢,包括一路創建的任何中間數據對象可能都是重要的。
步驟3:記錄并解釋分析
一旦對可信的數據集進行累積,并加以分析,則需要明確所使用的分析方法。 盡管并非分析下游的每個人都將需要這種信息,但是在整個企業倡導使用分析技術,并在這個企業建立信任基石的超級用戶和決策者需要這種信息。有了解釋分析技術如何應用的文檔,希望了解信息獲取方式的高級用戶可以根據需求自行獲取信息,而無需等待與數據科學團隊會晤。
步驟4:應用可視化技術
與解釋分析技術密切相關的是應用業務用戶可以理解的可視化技術。對于了解網絡圖表如何在不同模塊和場景下使用的數據科學家來說,西格瑪(sigma)可視化技術可能能夠提供深入的洞察力;然而,對于有要務在身和有其他關切的業務前線人員來說,同樣圖表更簡單的版本可能也是必要的。另一方面,一般的柱狀圖可能便于理解,但由于過于簡單,可能深度不夠,難以支撐業務決策。這不是關于過度簡化的問題:遠不是。尋找合適的可視化途徑是一種重要的平衡行為,將為業務用戶提供情境,以便他們更全面的理解和應用分析洞察力。
步驟5:改進計劃
數據分析本質上是一個迭代過程。它不是部署一次,獲得百分之百 “正確的”結果,然后就完事的過程。不僅洞察力會隨著時間的推移而變化,數據分析如何與業務完美結合也是一個有機的不斷演變的過程。建立一個反饋機制,花費時間和精力理解哪些行得通,哪些行不通,以及這些行得通或行不通背后的原因,是區分專為一次性成功而設計的流程和專為提供持續成果而設計的數據分析技術的關鍵因素。
數據分析的成功之路并不會因為突然將每個人都變成分析師或數據科學家之后而鑄造。它需要認識到數據團隊和業務團隊各自的優勢,并確保存在一個交流界面,以鼓勵對方團隊變得更為強大。