如今,企業(yè)對數(shù)據(jù)科學家的需求量很大。數(shù)據(jù)科學家在Glassdoor公司發(fā)布的美國最佳工作排行榜連續(xù)4年名列榜首,并且表示擁有適當技能的數(shù)據(jù)科學家薪酬很高。2012年,《哈佛商業(yè)評論》表示數(shù)據(jù)科學家是“21世紀最好的工作”之一。
Glassdoor公司社區(qū)專家表示:“對數(shù)據(jù)科學家的需求旺盛的一個重要原因是,很多企業(yè)都致力成為一家科技公司。在必須處理數(shù)字化數(shù)據(jù)、擁有應用程序或在線狀態(tài)的行業(yè)中,都需要能夠幫助支持所有這些數(shù)據(jù)并從數(shù)據(jù)中找到見解的專業(yè)人員。”
然而,現(xiàn)在面臨數(shù)據(jù)科學專業(yè)人才短缺的情況:據(jù)IBM公司預測,到2020年,美國所有精通數(shù)據(jù)的專業(yè)人士的每年職位空缺數(shù)量將增加到270萬個。人才招募機構(gòu)LinkedIn公司的數(shù)據(jù)顯示,截至2019年1月,具有數(shù)據(jù)科學技能的人在美國的平均年薪為130,000美元,比上一年增加56%。
為了幫助那些對數(shù)據(jù)科學領(lǐng)域感興趣的專業(yè)人員更好地了解如何進入數(shù)據(jù)科學的職業(yè)生涯,在此創(chuàng)建了一個包含最重要細節(jié)和資源的指南。
執(zhí)行摘要
•為什么對數(shù)據(jù)科學家的需求日益增加?很多公司現(xiàn)在都有能力收集數(shù)據(jù),并且數(shù)據(jù)量越來越大。這導致對具有特定技能的員工的更高需求,他們可以有效地組織和分析這些數(shù)據(jù),以收集業(yè)務見解。
•數(shù)據(jù)科學家的工作角色有哪些?核心數(shù)據(jù)科學家、研究人員和大數(shù)據(jù)專家是數(shù)據(jù)科學領(lǐng)域的頂級職位。
•成為數(shù)據(jù)科學家需要哪些技能?Glassdoor公司表示,掌握Python、R、SQL語言是數(shù)據(jù)科學工作列表中的三大技能。Glassdoor公司指出,每10個數(shù)據(jù)科學職位發(fā)布中就有9個需要掌握至少一種語言。
•哪些行業(yè)擁有數(shù)據(jù)科學家最熱門的市場?預計數(shù)據(jù)科學家的需求將在未來幾年增長。據(jù)IBM公司稱,目前約有59%的數(shù)據(jù)科學和分析工作需求來自金融和保險、專業(yè)服務和IT行業(yè)。
•數(shù)據(jù)科學家的平均薪酬是多少?據(jù)LinkedIn公司稱,截至2019年1月,美國的數(shù)據(jù)科學家平均年薪為130,000美元。Glassdoor公司的調(diào)查表明,其平均年薪為108,000美元。其薪酬因地而異,舊金山、圣何塞、西雅圖和紐約市的數(shù)據(jù)科學家薪酬最高。
•數(shù)據(jù)科學工作的典型面試問題是什么?其問題可能包括讓面試人員了解應聘者曾經(jīng)做過的項目,描述其與團隊合作的經(jīng)歷,以及與領(lǐng)導溝通的情況,并完成面試人員進行的測試。
•在哪里可以找到數(shù)據(jù)科學職業(yè)的資源?美國數(shù)據(jù)科學協(xié)會、運籌學和管理科學研究所以及國際分析研究所是這樣的國家組織和國際組織,行業(yè)人士可以在那里查找有關(guān)該專業(yè)的信息以及認證和培訓選項。許多提供商都提供許多編程語言的在線課程,如Python、R和SQL。
為什么對數(shù)據(jù)科學家的需求增加?
隨著很多公司在某種程度上成為一家科技公司,對能夠分析數(shù)據(jù)和收集業(yè)務洞察力的熟練專業(yè)人員的需求也在增加。
“隨著企業(yè)數(shù)據(jù)規(guī)模越來越大,對具有特定技能的員工的需求也越來越高,他們可以有效地組織和分析這些數(shù)據(jù)。”Glassdoor公司經(jīng)濟研究員Pablo Ruiz Junco表示,“與此同時,擁有這些技能的人數(shù)與需求相比仍然相對較低,從而導致更高的薪酬。”
塔夫茨大學研究生工程學院的IEEE研究員、院長Karen Panetta表示,技術(shù)進步和大量可用的在線數(shù)據(jù)影響著每個行業(yè)和部門,并對經(jīng)濟產(chǎn)生了巨大的影響。這種所謂的“數(shù)據(jù)雪崩”不僅涉及龐大的數(shù)據(jù)量,還涉及其變化和增長的速度,以及可用的各種數(shù)據(jù)類型。
Panetta 表示,“在新興的大數(shù)據(jù)革命中,了解如何使用電子表格和傳統(tǒng)數(shù)據(jù)庫還不夠。分析需要實時完成,決策可能至關(guān)重要。了解如何使用軟件工具只是這一挑戰(zhàn)的一部分。了解跨學科的數(shù)據(jù),能夠傳達其意義,以及使用統(tǒng)計數(shù)據(jù)將是傳統(tǒng)數(shù)字處理器的差異化因素。”
數(shù)據(jù)科學家的工作角色是什么?
一般來說,數(shù)據(jù)科學家挖掘采購數(shù)據(jù),并根據(jù)特定的公司利益對其進行分析,然后與市場部門合作以利用這些知識。這些工作人員必須熟悉數(shù)據(jù)收集軟件、編程和倉儲技術(shù)。
根據(jù)Glassdoor公司的研究,數(shù)據(jù)科學工作分為三個主要角色:核心數(shù)據(jù)科學家、研究人員、大數(shù)據(jù)專家。
核心數(shù)據(jù)科學家占到這些工作職位的71%,并且具有Python、R和SQL等方面的技能。這些專業(yè)人士在美國的平均年薪估計為116203美元。研究人員聲稱有15%的空缺職位,并且可能具備SAS、Matlab、Java、Hadoop、Python和R的技能。研究人員的平均年薪是112346美元。Glassdoor公司的調(diào)查發(fā)現(xiàn),大數(shù)據(jù)專家占據(jù)了剩下14%的數(shù)據(jù)科學工作崗位,并掌握SARK、HIVE、Hadoop、Java、Python等技能,他們的平均年薪估計為121246美元。
據(jù)IBM公司介紹,在這些職位中,包括數(shù)據(jù)工程師之類的專業(yè)人員,他們需要諸如Apache Hadoop、Java和Python之類的技能,以及財務和風險分析經(jīng)理,他們使用諸如風險管理、財務分析、規(guī)劃和SQL等技能。
成為一名數(shù)據(jù)科學家需要哪些技能?
根據(jù)2019年4月的一份主要報告,以下是數(shù)據(jù)科學職位招聘中最常提到的五項技能:
(1)機器學習
(2)Python
(3)R
(4)SQL
(5)Hadoop
Glassdoor公司2017年發(fā)布的調(diào)查報告發(fā)現(xiàn),職位招聘中的前10項技能是Python、R、SQL、Hadoop、Java、SAS、Spice、Matlab、HiVe和TabLeAU。Glassdoor公司的調(diào)查發(fā)現(xiàn),樣本中每10個職位發(fā)布中就有9個至少需要Python、R和/或SQL技能。根據(jù)該報告,這些技能密切相關(guān),這使得它們成為每個數(shù)據(jù)科學求職者應該學習的必需技能。
“如果想進入數(shù)據(jù)科學領(lǐng)域,并建立一個堅實的經(jīng)驗基礎(chǔ),在未來的雇主眼中,應聘者需要三種核心技能:Python,R和SQL。”Glassdoor公司經(jīng)濟研究員Pablo Ruiz Junco表示。有了這些技能,應聘者將有資格申請超過70%的數(shù)據(jù)科學家職位。另外,將這些技能擴展到這些基礎(chǔ)語言之外,可以使應聘者獲得更高的薪水,并允許其投入更廣泛的網(wǎng)絡申請。
根據(jù)Kaggle公司的一份報告,大約32%的全職數(shù)據(jù)科學家通過大規(guī)模開放在線課程(MOOC)開始學習機器學習或數(shù)據(jù)科學,而27%的人表示他們開始自己學習所需的技能。 30%的受訪者表示,他們在大學開始從事數(shù)據(jù)科學的學習和研究。
哪些行業(yè)擁有數(shù)據(jù)科學家最熱門的市場?
IBM公司在2017年5月預測,到2020年,美國所有精通數(shù)據(jù)的專業(yè)人士的每年職位空缺數(shù)量將增加到270萬個。大約59%的數(shù)據(jù)科學和分析工作需求來自金融和保險、專業(yè)服務和IT行業(yè)。到2020年,對快速增長的數(shù)據(jù)科學家、數(shù)據(jù)開發(fā)人員和數(shù)據(jù)工程師新角色的需求將達到近70萬個。
據(jù)Prime公司主管Shu Wu表示,對具有數(shù)據(jù)科學技能的開發(fā)人員的需求目前在企業(yè)中非常強勁, 在過去四年中,數(shù)據(jù)科學家的職位空缺出現(xiàn)大幅增長。
Shu Wu表示,“雖然未來幾年數(shù)據(jù)科學家的工作前景依然強勁,而且這些專業(yè)人員可以獲得高薪,競爭也很激烈。可以使整個組織都能理解數(shù)據(jù)專家是偉大的。”
數(shù)據(jù)科學家的平均年薪是多少?
美國數(shù)據(jù)科學家的平均年薪略有不同,具體取決于其工作地點。LinkedIn公司調(diào)查的平均年薪為130,000美元,Glassdoor公司調(diào)查的平均年薪為108,000美元。
根據(jù)Indeed公司的數(shù)據(jù),舊金山的數(shù)據(jù)科學家年薪最高,平均年薪為166,519美元,其次是圣何塞(153,535美元)、西雅圖(146,088美元)和紐約市(146,067美元)。
如上所述,由于核心數(shù)據(jù)科學家、研究人員和大數(shù)據(jù)專家之間的薪酬差異,個別數(shù)據(jù)科學家提出的技能可能會對薪酬產(chǎn)生很大影響。求職者應該考慮他們最感興趣的角色,并對哪些技能值得花時間學習進行成本效益分析。
數(shù)據(jù)科學職業(yè)的典型面試問題是什么?
“為了評估應聘者是否能夠成為一名數(shù)據(jù)科學家,可以通過這些進行衡量:基礎(chǔ)知識、創(chuàng)造性和科學地思考現(xiàn)實世界問題的能力,關(guān)于高技術(shù)主題的特殊溝通,以及不斷的好奇心。”Umbel公司高級工程總監(jiān)Kevin Safford說。
根據(jù)Forrester公司分析師Kjell Carlsson的說法,一名初級數(shù)據(jù)科學家可以在求職面試中遇到以下問題:
•介紹一下所完成的最為自豪的項目,在哪里使用數(shù)據(jù)/數(shù)據(jù)科學/機器學習/高級分析。應聘者在這個項目中的角色是什么?在每個步驟中都做了什么?
•應聘者參加的項目(在此處采用的語言或技能,例如Python、R)。
•應聘者與數(shù)據(jù)科學項目不精通數(shù)據(jù)的人合作的時間。
•應聘者解釋數(shù)據(jù)科學,例如數(shù)據(jù)科學主題、交叉驗證、無監(jiān)督學習等。
•應聘者處理非常混亂的數(shù)據(jù)的時間。
•應聘者在原有團隊中工作的經(jīng)歷。
•應聘者快速成為新技術(shù)專家的時間。
應聘者可能會根據(jù)團隊開展的數(shù)據(jù)科學項目進行小型案例研究,其問題包括:需要哪些數(shù)據(jù)?想測試哪些假設(shè)?將使用什么技術(shù)來評估它們?
Carlsson說,面試還可能包括一個練習,在這個練習中,應聘者會得到一組數(shù)據(jù)和一個廣泛的問題,并被要求陳述他們的調(diào)查結(jié)果。
根據(jù)Empowered Staffing公司招聘副總裁Daniel Miller的說法,對于更高級的職位,這些問題可能會出現(xiàn):
•應聘者是否從頭開始構(gòu)建數(shù)據(jù)倉庫?如果是這樣,為成功實施數(shù)據(jù)倉庫而創(chuàng)建的流程(如果從頭開始沒有參與其中,可以詢問應聘者是否是處理公司合并或數(shù)據(jù)采集的部門的一員,以及是如何處理的)。
•應聘者構(gòu)建了哪些類型的定制儀表盤,以及通過儀表盤提供了哪些信息/分析?
•應聘者完成的最復雜的數(shù)據(jù)項目,以及其為實現(xiàn)成功所能做的事情。
•應聘者如何向執(zhí)行和高級領(lǐng)導解釋和呈現(xiàn)數(shù)據(jù)?
在哪里可以找到數(shù)據(jù)科學職業(yè)的資源?
美國數(shù)據(jù)科學協(xié)會、運籌學和管理科學研究所,以及國際分析研究所是國家組織和國際組織,人們可以在那里尋求有關(guān)該專業(yè)的信息以及認證和培訓選項。
一些教育機構(gòu)創(chuàng)建了數(shù)據(jù)科學學位課程,其中包括加州大學伯克利分校、西北大學、卡內(nèi)基梅隆大學和肯尼索州立大學。其中一些學校提供在線課程。
專業(yè)人員可以從許多提供商處找到許多在線編程課程,例如Python、R和SQL中的課程。IEEE計算機學會也提供課程和研討會。
此外,還提供了一些數(shù)據(jù)科學方面的認證。其中包括供應商中立的認證分析專家(CAP)、Dell EMC認證專家認證計劃、Microsoft認證解決方案專家(MCSE)和SAS數(shù)據(jù)科學認證。