根據行業不同,成為數據科學家的要求也不同,但有一些常見的技能、經驗、教育背景和培訓,將對您從事數據科學家職業有所幫助。
什么是數據科學家?
數據科學家負責從大量結構化和非結構化數據中挖掘出真知灼見,以滿足具體的商業需求和達成商業目標。因為企業更多地依賴大數據和數據分析來推動決策,而且更多的企業將云技術、自動化和機器學習作為IT戰略的核心組成部分,因此數據科學家在數據分析中的作用變得越來越重要。
數據科學家的主要目標是組織和分析大量數據,通常使用專門為此項工作而設計的軟件。數據科學家的最終數據分析結果應便于所有投資利益相關者理解,特別是便于那些非IT人員理解。
數據科學家的數據分析方法不僅取決于其行業,還取決于他們所從事的業務或所在部門的具體需求。在數據科學家能夠從結構化或非結構化數據中找到其意義之前,企業領導、部門和管理者需要告訴數據科學家他們要尋找的東西。因此,數據科學家必須具有足夠的業務領域專長,將公司或部門目標轉化為基于數據的可交付成果,如預測引擎、模式檢測分析、優化算法等。
數據科學家的薪水
2016年,美國勞工統計局報道,數據科學家的平均工資每年約為111,800美元。這是一個快速增長和收入豐厚的領域,美國勞工統計局預測這一領域的工作將在2024年前增長11%。數據科學家也正在成為一個令人滿意的長期職業發展道路。在Glassdoor招聘網站上的“美國50大最佳工作”報告中,依據工作機會、工資和總體工作滿意度評級,數據科學家職位在各個行業中排名最高。
數據科學家的工作內容是什么?
數據科學家的主要職責是數據分析。這個工作過程從數據采集開始,并以數據科學家的最終數據分析結果為基礎做出業務決策而結束。
數據科學家所分析的數據(通常稱為大數據)有多個來源。有兩種類型的數據屬于大數據的范疇:結構化數據和非結構化數據。結構化數據通常按照類別進行組織,使計算機易于自動對數據進行排序、讀取和組織。這些結構化數據包括由服務、產品和電子設備收集的數據,但很少是由人工輸入所收集到的數據。您的智能手機收集的網站流量數據、銷售數據、銀行帳戶或GPS坐標,這些都是結構化的數據。
非結構化數據是增長最快的大數據形式,更有可能來自人工的輸入,例如客戶評論、電子郵件、視頻、社交媒體帖子等。這些數據通常更難分類,而且通過技術進行管理其效率也較低。由于這些數據沒有組織化,所以它可能需要大量投入來進行管理。企業通常依靠關鍵字來理解這些非結構化數據,使用搜索詞提取相關數據。
通常,企業雇傭數據科學家來處理這種非結構化數據,而其他IT人員將負責管理和維護結構化數據。是的,數據科學家可能會在自己的職業生涯中處理大量的結構化數據,但企業越來越想要利用非結構化數據來幫助他們完成營收目標,這使處理非結構化數據成為數據科學家的關鍵工作。
數據科學家需要具備什么素質
每個行業都有自己的數據資料,供數據科學家分析。根據美國勞工統計局的說法,以下是每個行業中一些更常見的大數據形式,以及數據科學家可能需要進行的各類分析。
• 商業類型數據:當今,數據決定了幾乎所有公司的商業戰略,但企業需要數據科學家來解讀這些信息。商業數據的數據分析可以對企業效率、庫存、產品故障、客戶忠誠度等方面的決策有所幫助。
• 電子商務類型數據:現在網站收集的不僅僅是采購數據,數據科學家幫助電子商務企業改善客戶服務,尋找行業趨勢并開發服務或產品。
• 財務類型數據:在金融行業,賬戶、信貸和借記交易數據和類似財務數據對于一個正常運營的企業至關重要。但是對于這一領域的數據科學家來說,安全和合規性,包括欺詐檢測,也是主要關切的問題。
• 政府類型數據:大數據可幫助政府制定決策,支持選民并監測整體滿意度。像在金融業一樣,安全與合規性也是數據科學家的首要關注問題。
• 科學類型數據:科學家始終在處理數據,但現在借助科技,他們可以更好地收集、分享和分析實驗數據。數據科學家可以對這一過程有所幫助。
• 社交網絡類型數據:社交網絡數據可幫助進行定向廣告,提高客戶滿意度,建立位置數據趨勢,增強功能和服務。對帖子、推文、博客和其他社交媒體的持續數據分析可以幫助企業不斷改進服務。
• 醫療保健類型數據:現在電子醫療記錄已成為醫療保健機構的標準,這需要對大數據、安全性和合規性進行投入。在這方面,數據科學家可以幫助改善衛生服務,發現那些可能被忽視的趨勢。
• 電信類型數據:所有電子產品都收集數據,所有這些數據都需要存儲、管理、維護和分析。數據科學家通過開發出企業想要的功能來減少產品故障,改善產品并保持客戶滿意度。
• 其他類型數據:沒有任何一個行業可以免受大數據沖擊,美國勞工統計局指出,您將在其他職業領域找到工作,如政治、公用事業、智能家電等。
數據科學家具備的技能
據Quora(美國問答網站)數據科學家William Chen表示,數據科學家的五大技能包括軟硬技能的組合技能:
編程技能:陳先生將此稱為“數據科學家的最根本技能”,指出這會增加數據科學技能的價值。編程可以提高您的統計技能,幫助您“分析大數據集”,并使您能夠開發出自己的工具。
定量分析技能:陳先生說,這是分析大數據集的重要技能,定量分析將提高您進行實驗分析的能力,擴展數據策略并幫助您實現機器學習。
產品直覺技能:陳先生說,了解產品將有助于您進行定量分析。這還將幫助您預測系統行為,建立衡量指標并提高調試技能。
溝通技能:這可能是每個行業中最重要的軟技能,良好的溝通能力將有助于您“利用所有上述技能”,陳先生說。
團隊合作技能:類似于溝通,團隊合作對于數據科學工作的成功至關重要。陳先生說,這需要無私,接受反饋意見,并與您的團隊分享知識。
數據科學家的教育背景及培訓
有很多途徑可讓您成為數據科學家,但最傳統的途徑是獲取一個學士學位。根據美國勞工統計局的數據顯示,大多數數據科學家擁有碩士學位或更高學歷,但并不是說每位數據科學家都具備這一學歷,還有其他途徑讓您獲得從事數據科學的技能。在您進入高等教育學習之前,您會想知道將來要從事哪些行業,以清楚該行業應具備何種最重要的技能,并會使用何種工具和軟件。
由于數據科學需要一些商業領域的專業知識,因此數據科學家的作用將因行業不同而其工作內容也不同,如果您在高科技產業工作,您可能需要進一步的培訓。例如,如果您在醫療衛生、政府或科學部門工作,則您需要具備與營銷、商業或教育領域工作所不同的技能。
如果你想學習某些技能來滿足特定的行業需求,那么有一些在線課程、培訓班和專業發展課程,可以幫助你提高這些技能。除了培訓班外,還有大量很有價值的大數據認證,可以提高您的簡歷含金量和薪水。
成為數據科學家
一旦你完成了必要的教育和培訓,你可以開始申請與你的技能水平相當的工作職位。如果您已經是IT技術人員,您可以在您的人際網絡中尋找空缺職位或潛在的工作機會。
你想知道你所期望的行業和領域的就業機會是否需要更高的學歷,或者您的證書和培訓班課程是否足以滿足招聘經理的要求?;ㄒ恍r間研究這些工作機會,找到這些職位與您期望的職位存在的共同點。從這些共同點,你可以制定一個戰略,讓自己成為具備一定教育背景、技能和經驗的數據科學家,以獲得這份工作。