提供洞察和分析的公司都在盡力為自己組建完美的數據科學團隊,這通常有兩條路可以走。
大部分公司都在掙扎中選擇了第一條路:尋找這些工資非常貴又很少見的獨角獸人才,即同時具備這多種技能的獨立個體。
完美的數據科學家完美地掌握了數學、統計學、編程以及溝通技術。這些人不光具備完成復雜工作的專業技術能力,還能夠向非技術人員解釋這些技術工作可能會帶來的影響。
除了這些數據科學家會很昂貴的事實之外,這些天才科學家一周7天,每天24小時連軸工作也是不太可能的。
當然這不是唯一的一條路。
人類史上最早的科學家之一亞里士多德曾經說過:“整體大于它的各部分之和”,這給了我們一些啟發。與其尋找這些很受歡迎的同時具備三方面技能的人,還不如挑選分別具備其中一項技能的人來組成一個團隊。畢竟,沒有一個人能夠永遠解決組織不斷增長的對數據科學研究的需求。它需要一個數學家來負責深入鉆研,還需要一個具備交叉學科知識的人來進行橫向整合,最終組成一個完美的團隊。
數據科學團隊的活力
任何一個數據科學團隊的終極目標就是要成為一個解決問題的機器,一個能在不斷變化的環境中不斷攪動出價值的團隊。越來越豐富的數據給曾經無法回答的業務問題提供了可能,這就給客戶對洞察復雜性的期待提升到了一個新的高度。但隨著這一套連鎖反應而來的卻是沒有成熟方法論和解決方案的問題。隨著輸入越來越多樣化,所需要的匹配的技能同樣需要變得多樣化。“酷呆瓜”團隊的三個特點沒有一個是可以缺失的,因此這個團隊的集體智慧才真正是當今數據世界的驅動力。
顯然,完美數據科學家團隊中的任意兩塊都無法獨立于第三塊運作。而且,挖掘并保持數據科學家團隊的內部平衡才能帶來最大程度的準確性和相關性。
數學家/統計學家
這些受過訓練的學者在理解了相關理論以及結果所需要的條件后,基于這些輸入構建起先進的模型。
程序員
這位親自操刀的架構師負責清洗、管理以及修整數據,以及建造模擬器或其他高科技工具來使數據變得更加方便易用。
溝通者/內容專家
將技術翻譯為業務的專家利用自己的全局觀,基于過去的知識幫助尋找技術與用戶需求的連接點。
這些技能的互相支持才使得團隊變得完整,并具備完美的數據交付能力:
數學家/統計學家的工作嚴重依賴于程序員。“垃圾進入垃圾出去”的概念在這里非常適用,也就是說如果程序員沒有清晰地獲取數據、管理數據,那么科學家很難構建出有用的模型。此外,數學家和程序員又依賴于溝通者的知識。即便數據是完美的,也符合統計學結論,如果其無法直接涉及到要解決的商業問題,那么這些就是沒有意義的。此外,內部不平衡的團隊將會面臨一些無法充實準備的困難,也無法交付出完美的作品。
是購買還是自建?
今天的世界充滿了大量、高速的數據,企業都面臨著一個選擇。傳統那些寫代碼來編輯調查問卷、收集數據的程序員都被整合在了具備洞察的組織中。然而,他們中的很多人都沒有接受過數學或統計學的正統培訓。同樣地,那些面向客戶并具有數值定量頭腦的商務人才在團隊構建中也應當有一席之地。培訓現有數學或統計學人才是可行的,但漫長的過程需要極強的耐心。如果組織認可且相信他們已有的人才并且選擇這條路來組建團隊,這也就指向了需要填補的空白從而打造完美團隊。
組織機構很久之前就知道數據的價值了,但如果沒有人的參與,無論數據量有多大,細節有多深,到2019年實現數據科學300億美金的估值都是很難的。一個互相平衡的團隊對各類數據作出的解讀、過濾以及修正都會加速這種成長并提升數據科學的重要性。
許多人覺得Hilary的“酷呆瓜”概念只適用于個人。但實際上,我們必須認識到團隊的集體“酷”也是充滿潛力的。
當組織在組建和招聘數據科學團隊時,或許團隊宗旨可以簡單的稱為“如果你能找到呆瓜,那就留住他們。但如果缺少聚集了各類獨角獸人才的團隊,那就創造一個。”