分析團隊的管理者們必須拿捏好指導數據科學家們完成工作,和給予他們能夠有效完成工作所需要的空間之間的分寸。
Scotiabank,是一家總部位于多倫多的金融服務企業,企業內的數據科學家們不附屬于任何特定的業務部門。相反,他們是一個獨立的團隊的一部分——正式的名稱為決策科學團隊——為銀行內的所有部門提供高級分析。 但獨立并不意味著脫離: Andrew Storey,銀行的決策科學部門的副總裁, 他和其他管理者們都努力確保團隊進行的數據分析項目,對于業務戰略和運作是有實用價值的,而不是單純的抽象練習。
在拉斯維加斯舉行的2015 TDWI Executive Summit會議上,Storey說道,“僅僅因為我們能做某事并不意味著我們就必須這樣做。” “我們真正需要做的是將自己扎根于業務中,支持他們正在進行的項目。在這樣的一個團隊內,你很容易脫離現實,所以我們必須保持務實。”
為了幫助優化市場活動,促銷方案,產品定價,以及識別不同客戶之間的財務關聯,Storey希望他團隊內的30位分析師在進行客戶數據集和定價數據的預測分析,運行數據挖掘應用程序時,能夠有創造性。事實上,促進創新文化是他管理一個成功的分析團隊的核心原則。“我們應該努力尋找更好的做事方式,”他補充道,激勵他的員工這樣做也幫助他留住這些員工。
與此同時,Storey讓Scotiabank的業務經理決定他的團隊應該探索的領域,或者他與他們共同決定。分析結果需要嵌入到操作系統和流程中,預測模型“是完全無用的,如果我們不基于它而做出決定的話,”他說。
數據分析的解讀
團隊成員還必須能夠向業務高管們解釋他們所使用的分析技術和方法, 以獲得他們對于結果的認同并使用這一結果。為了設法簡化分析過程,Storey引導數據科學家擺脫重復建立預測模型。他鼓勵他的團隊使用其他行業的金融服務企業和公司的算法,只需調整使其適應銀行的需求。
隨著大數據分析項目不斷擴大數據科學家的工作范圍,以及他們分析的各類信息。類似Scotiabank這樣的協調方法,在管理分析團隊時,是很常見的,并且也變得越來重要,也更具挑戰性。
調查結果顯示,隨著大數據分析項目變得更加普遍,管理分析團隊也成為一個更大的挑戰。例如, TechTarget的2015年度 IT優先項目的調查結果顯示,全世界范圍內2212名受訪者中的25%,認為他們的企業正計劃在今年開展大數據分析項目,位列計劃軟件項目前5位(參見圖表)。與此同時,2014年6月接受咨詢公司Gartner inc .調查的302名業務和IT專業人士中的40%則表示,他們的企業已經對大數據技術進行了投資,相較去年提高了30%;另外有33%的受訪者計劃在未來的24個月之內進行投資。
Mike Lampa,咨詢公司Archipelago Information Strategies的總經理,認為協作和合議的方法在管理大數據分析工作時,是必須的。 “我認為正確的心態是你如何指導整個過程,而不是控制它。” Lampa警告說,如果優秀的數據科學家認為他們的工作被過度控制,很有可能對此感到反感,轉而在其它地方尋找新的工作。他認為管理者應與他們的團隊合作,將分析工作的重點放在有價值的項目上,在使用數據和審查分析模型時提供明確的指導方針,然后就放手。
分析師掌握主動權
Netflix公司就對自己的數據科學團隊采取了此類管理方法。這家位于加州The Los Gatos的公司使用運行在Amazon Web服務云上的多種系統——包括Hadoop,Teradata公司的數據倉庫,亞馬遜的Redshift,和Simple Storage Service技術,存儲多個PB 數據用于分析客戶與其在線流媒體服務之間的互動。
Kurt Brown,Netflix公司數據平臺的副總裁,在加州San Jose舉行的Strata + Hadoop World 2015 conference上進行演講,他認為,數據分析師們應該負責建立自己的查詢,算法,和模型,他的目標是使他們能夠在數據分析項目時做他們想做的,障礙越少越好。
Brown的平臺經理與分析師互相協商,促進開發最佳方法,但他們對于開發工作不會設置障礙。有時會導致編碼錯誤和數據問題,但是他認為,在Netflix這樣的公司內,試圖在分析系統中避免錯誤代碼是“徒勞的”。事后,他的一位員工會查找需要清理的代碼,然后將這個信息發送給對此錯誤負責的分析師,這樣他們可以自行修復。 “這不應該是管理者的責任,” Brown說。“這必須是一個共同的責任”。