如今的數據科學家具有的技能不僅需要精通人工智能和Python,還需要擅長與企業高管進行溝通。
美國勞工統計局將數據科學家列為未來增長最快的15個職業之一,預計在未來10年的工作崗位增長率將達到31%。隨著數據日益成為所有企業的命脈,數據科學家不僅需要具備過硬的知識和技能,還需要具備強大的商業頭腦。
1.機器學習/神經網絡技能
2021年,機器學習方法(如遷移學習和Transformer)將引起很多關注,因為它們正在迅速推動許多不同領域的創新。對于構建和訓練神經網絡,PyTorch背后有很大的推動力,Keras和TensorFlow也是常用的。還有豐富的軟件庫生態系統,其中許多是開源的,可以幫助加速機器學習和數據科學應用程序。
人工智能威脅檢測和響應服務提供商Vectra公司數據科學高級主管Matthew Silver說:“數據科學家可以通過對機器學習算法的工作原理和工作方式來展示自己的魅力,這對于克服培訓和測試過程中不可避免的挑戰非常重要。ONNX是一種神經網絡標準,促進了平臺、庫和語言獨立的模型部署,幫助我們簡化了生產中人工智能的使用,并加快了建模工作。”
2.編程技能
對于數據科學家來說,為探索性分析、數據預處理和算法訓練以及在某些情況下在生產中部署模型編寫高質量且可維護的代碼非常重要。Python、JavaScript、R和Scala是最適合開發的語言。另一個有用的技能是了解如何從其他人可以部署的模型構建WebAPI。
Silver說,“能夠在工作中開始使用通用軟件庫來構建模型的數據科學家是最具競爭力的,并且在幾乎所有情況下,具有強大的軟件開發技能都是加分項。”
3.了解云計算
了解云計算工程原理和云計算基礎設施的數據科學家對于雇主來說更具吸引力。這意味著需要三大公有云提供商(微軟、AWS、谷歌)提供的云計算服務。每個云計算供應商都為數據科學家提供了一套全面的工具,用于數據提取、數據清理、可視化和機器學習目的。
網絡資產管理和治理解決方案提供商Jupiter One公司首席架構師Phillip Gates-Idem說,“我們正在尋求熟悉云計算基礎設施、持續集成(CI)/持續交付(CD)管道和自動化的數據科學家。數據科學家需要對如何使用云計算基礎設施構建和使用工具有著深刻的了解。”
4.統計數據
統計學是一個數學領域,旨在使用給定數據集的模型和表示來收集和解釋定量數據,是數據科學的核心,其中包括概率、可變性、回歸和集中趨勢等概念。
IT咨詢機構Netrix公司的首席架構師Lars Kemmann說,“如果沒有深入了解統計學(數據科學的核心)以及如何將合理的數學推理應用于正在處理的問題,那么我們不在乎采用多少平臺或語言。我認為招聘這樣的人才是目前行業面臨的一個挑戰。”
5.項目管理
由于數據科學項目可能涉及漫長的探索階段,甚至在后期也存在多個未知因素,因此項目管理是數據科學家需要具備的另一項關鍵技能。例如采用敏捷方法,可以讓數據科學家根據需求和目標確定優先級并創建路線圖。
Silver解釋說,““通常很難預測開發和訓練機器學習模型需要多長時間,,等待更新模型或結果的企業往往會有時間表和計劃,因為這種不可預測性而受到影響。數據科學家能夠通過從一開始就了解局限性、隨著工作的進展傳達項目狀態,并預測他們何時能夠提供下一個有意義的讀數,從而掌控主要建模工作,他們將在我們的團隊中發揮著重要作用。”
6.數據講故事/可視化
盡管企業的數據可能具有巨大的潛在價值,但除非能夠發現這些見解并將其轉化為行動或業務成果,否則無法創造任何價值。Plotly、Tableau和D3是當今需求量最大的數據科學可視化和講故事的工具。
Kemmann說,“當客戶不了解企業在做什么時,他們很容易低估企業所做的工作,尤其是在數據準備階段。數據科學家以企業的客戶可以理解的語言清楚地解釋每個步驟的過程和好處,并在可能的情況下通過適當的數據可視化提供支持,這是其工作角色的關鍵部分。”
7.溝通能力
數據科學家現在比以往任何時候都有更多的機會“親自動手”處理數據,但這需要對業務目標有很強的理解,并有能力清楚地傳達和解釋技術術語。能夠將數據轉化為有用術語的數據科學家能夠增加額外價值。
IT人力資源提供商RobertHalf Technology公司區域經理Joshua Drew說,“能夠將這些數據轉化為清晰、易于理解的業務信息將是一項巨大的技能,而數據科學家并不總是具備這些軟技能,或者具備能夠向企業高管澄清其決策過程的經驗。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。