今天近乎所有的互聯網公司都希望組建(大)數據分析團隊,但由于大數據技術應用是一個高速發展的全新領域,與建設常規的軟件開發團隊相比,企業在數據科學團隊的招聘、建設和成長方面面臨各種全新的挑戰。
對于人力資源經理來說,大數據分析人才的招聘說明中有太多的生詞,包括各種大數據新鮮名詞、算法和技能,而且整個技術人才市場對大數據經驗、最佳實踐的定義和標準尚無定論。
近日Experteer的Rodrigo Rivera為VB撰文指出,企業組建大數據分析團隊首先需要搞清楚以下三個問題:數據分析團隊在企業組織架構中的智能定位、所需資源以及數據分析團隊的架構。
職能定位
企業上下需要在一開始就明確數據分析團隊在企業組織架構中的定位,以及主要的利益相關者。
不同企業的做法不同,有的企業讓CTO領導數據科學團隊,有的則選擇讓CFO甚至CMO領導,有的選擇由一個項目經理統領分散于不同業務部門的數據專家,還有一些企業將數據科學團隊定位于研發團隊,沒有具體的日程表或利益相關者。
以上取決于企業的組織模式、企業文化、資源和數據科學團隊的具體任務。由于數據科學如此性感,企業的高官們都想將其納入自己的管轄范圍,因此如果不能事先明確數據科學團隊的職能定位,在日后的運營中勢必引起各部門之間的困惑和摩擦。
資源需求
了解技術人才市場的人都知道,數據科學人才的身價不菲,而企業往往在組建數據科學團隊前對資源需求估計不足。
對于一個超過300人的互聯網公司來說,如果想組建一個有明確任務(例如推薦引擎、用戶激活等)的數據科學團隊,第一階段可以考慮組建一個5-8人的團隊,包括一名技術項目經理、1-2名負責建模的數據科學家,以及3-5名數據工程師負責部署生產代碼。
團隊構成
當明確了資源需求和團隊規模后,下一步面臨的問題是如何找到合適的數據科學人才。正如文章開頭提到的,這對于企業的人力資源部門來說幾乎是個不可能完成的任務,人力資源經理的郵箱會迅速被充斥各種新鮮技術名詞的簡歷填滿。
人力資源部門還非常容易受到媒體或數據分析廠商的影響,企業需要根據需求自行定義招聘說明中的技能要求,例如教育背景與實操經驗的孰重孰輕等。當然,這些都是說起來容易做起來難。
以8人數據科學團隊為例,團隊初創成員大致分為以下三類:
1.技術項目經理。擁有3到5年的相關團隊管理和項目經驗;最好擁有扎實的技術背景,最好能夠編程(雖然并不需要真的去編程)。數據分析團隊的技術項目經理不僅僅需要豐富的項目管理經驗,還必須了解數據分析相關的算法和技能,最好能夠進行代碼審核。
2.數據科學家。數據科學家要求有廣泛而扎實的專業背景,最好擁有物理學、數學、計算機科學、生物學或相關學科領域的博士學位。判斷數據科學家水平最簡單的依據是她曾經發表過的研究論文質量。
有一點需要注意的是,一位機器學習領域的資深專家很可能軟件開發技能很差,因此在考察數據科學家技能時不要想當然,務必要明確其編程技能。對于以應用為主的互聯網企業來說,編程技能對于一個初創的數據科學團隊來說非常重要,除非你要組建的是一個學術性的數據科學團隊。
3.數據工程師。不需要太多學術背景,只要是對數據分析感興趣的靠譜的軟件開發人員都可勝任。數據工程師需要對算法、數據架構和軟件工程有深入了解,尤其是算法層面,因為很多軟件工程師這方面的知識很薄弱,而對于數據科學團隊來說算法至關重要。可以嘗試從開源項目的積極貢獻者中去尋找未來的數據工程師。通常對數據工程師的技能要求與數據科學家類似(例如Python、Scala等)
以上每類數據科學人才的招聘要求視企業和預算的不同而異,團隊組建初期沒必要招聘太過資深的人士,因為在團隊職能和領域范圍在初期會經歷比較大的變動。而且數據科學團隊初期由于需要搭建數據平臺,清洗數據,需要干大量“臟活”。