如果你想開始一個數據科學方面的職業,你可以通過避免這9個會使你付出高代價的初學者錯誤來免去幾天,幾個星期甚至幾個月的挫折。
如果你不仔細,這些錯誤將會消耗你最寶貴的資源:你的時間、精力和動力。
我們將它們分為三類:
學習數據科學時的錯誤
求職時的錯誤
求職面試中的錯誤
學習數據科學時
第一組錯誤是“隱蔽的”,很難發現。沒有絲毫的預兆,它們如同溫水煮青蛙般耗盡你的時間和精力,并且它們產生的誤解圍繞這個領域。
1.花費太多時間在理論上
許多初學者陷入了花費太多時間在理論上的陷阱,無論是數學相關(線性代數,統計學等)還是機器學習相關的(算法,派生等)。
這種方法效率低下有三個主要原因:
首先,這是緩慢而艱巨的。如果你曾經被所有要學的東西壓垮,那么你很有可能陷入了這個陷阱。
第二,你也不會保留這些概念。數據科學是一個應用領域,而鞏固技能的最好方法是實踐。
最后,還有一個更大的風險就是如果你不明白你所學的東西與現實內容有什么聯系,那么你會變得消極然后放棄。
傳統上這種重理論的方法在學術界中傳授,但大多數從業者可以從更注重結果的觀念中受益。
為了避免這個錯誤:
平衡你的研究和你實踐的項目。
學會適應局部知識。當你進步的時候,你自然會填補空白。
了解每一部分如何適應大局(包括在我們免費7天速成課程)。
2.從頭開始編寫太多的算法
下一個錯誤也會導致學生片面重視局部而忽略了整體。一開始你真的不需要從頭開始編寫每個算法。
雖然為了學習而實現一些這么做很好,但現實是算法正在成為商品。由于成熟的機器學習庫和基于云的解決方案,大多數從業者實際上從不從頭編寫代碼。
今天,了解如何在正確的設置(以正確的方式)中應用正確的算法更為重要。
為了避免這個錯誤:
使用通用的機器學習庫,如Scikit-Learn(Python)或Caret(R)(需翻墻)。
如果你從頭開始編寫一個算法,那么這樣做是為了學習而不是完善你的實現。
理解現代機器學習算法的環境及其優缺點。
3.急于深入更高的層次
有些人進入這個領域是因為他們想要構建未來的技術:自駕車,高級機器人,計算機視覺等。 這些技術由深度學習和自然語言處理等技術所驅動。
但是,掌握基本原理很重要。 一口吃不成胖子。每個奧運潛水員都需要先學習如何游泳,那么你也應該如此。
為了避免這個錯誤:
首先掌握“經典”機器學習的技術和算法,以此作為高級課題的基石。
要知道經典機器學習仍然具有驚人的潛力。雖然算法已經成熟,但我們仍然處于發現使用富有成效的方法的早期階段。
學習一個系統的方法來解決任何形式的機器學習問題(包括在我們免費7天速成課程)。
不要在家里嘗試這個(除非你有足夠的練習)
求職時
下一組錯誤可能會導致你在求職過程中錯過一些很好的機會。 即使你能夠勝任,但你可以通過避免這些問題來發揮到最好的效果。
4.簡歷中有太多的專業術語
許多應聘者在寫簡歷時犯的最大錯誤就是用專業術語填滿了簡歷。
相反,你的簡歷應該簡潔明了并且你的要點要闡述清晰。你的簡歷應該主張你能給公司帶來的影響,尤其是當你申請初級職位的時候。
為了避免這個錯誤:
不要簡單列出你所使用的編程語言或庫。描述你如何使用它們并解釋結果。
少即是多。考慮強調最重要的技能,并突出它們。
制作一個簡歷主模板,這樣你就可以根據不同的職位定制不同的版本。這樣可以使每個版本保持整潔。
5.高估學位的價值
有時,畢業生會高估他們的教育價值。雖然在相關領域有高等學位肯定會增加你的機會,但這是不夠的,也不是最重要的因素。
當然了,我們并不是說畢業生傲慢自大…
在大多數情況下,在學校學習的東西與在企業中應用的機器學習完全不同。處理期限、客戶和技術障礙需要在學術界不那么迫切的實際權衡。
為了避免這個錯誤:
用真實的數據集補充大量項目的課程。
學會用機器學習解決問題的系統方法(我們免費7天速成課程)。
參加相關實習,即使是兼職。
在LinkedIn上接觸當地的數據科學家面對面聊一聊。
6.搜索內容太狹隘
數據科學是一個相對較新的領域,機構還在不斷發展,以適應數據日益增長的影響。如果你只搜索“數據科學家”的空缺,你就會限制自己。
許多職位沒有被稱為“數據科學”,但它們可以讓你以類似的角色發展類似的技能和功能。
為了避免這個錯誤:
搜索所需技能(機器學習,數據可視化,SQL等)。
按工作職責進行搜索(預測建模、A/B測試、數據分析等)。
用職位所需的技術搜索(Python,R,Scikit Learn,Keras,等)。
通過職位名稱(數據分析師、定量分析師、機器學習工程師等)擴展搜索范圍。
來源: Cyanide and Happiness
面試過程中
最后一組錯誤是面試時的絆腳石。你已經為達到這一步做了艱苦的工作,所以現在是結束的時候了。
7.沒有事先做討論項目的準備
在你的產品組合中有項目用于回答“你會如何”這類的面試問題,以此作為一個主要的安全保障。而不是說假設,你可以指出你如何處理某些情況的具體例子。
此外,許多面試官都會特別關注你獨立自主的能力,因為數據科學的職位自然包含項目管理的要素。這意味著你應該理解整個數據科學工作流程,并了解如何將所有內容整理在一起。
為了避免這個錯誤:
完整的端到端的項目,能使你實踐每一個主要步驟(即數據清理、模型培訓等)。
組織你的一套方法。數據科學應該是深思熟慮的,而不是偶然的。
回顧和實踐從過去的實習、工作或課程中所做的項目。
8.低估領域知識的價值
技術技能和機器學習知識是獲得數據科學職位的基本前提。然而,要真正脫穎而出,你應該更多地了解你將運用技能的具體行業。
記住,數據科學永遠不會存在于真空中。
為了避免這個錯誤:
如果你在銀行面試一個職位,就要了解一些基本的財務概念。
如果你正在為財富500強的戰略職位面試,那就去面試幾次,了解一下盈利能力的驅動因素。
如果你正要去一家初創公司面試,要了解它的市場,并試著辨別它將如何獲得競爭優勢。
簡而言之,在這方面采取一些額外的舉措可以帶來很大的好處!
9.忽視溝通技巧
目前,在大多數機構中,與開發團隊或分析師團隊相比,數據科學團隊仍然非常小。因此,當一個入門級的軟件工程師經常被一個高級工程師管理時,數據科學家傾向于在更多跨功能的環境中工作。
面試官會注重你和不同技術背景和數學背景的同事交流的能力。
為了避免這個錯誤:
向非技術受眾講解技術概念。例如,試著向朋友解釋你喜歡的算法。
為常見的面試問題準備要點,并練習回答問題。
實踐分析各種數據集,提取關鍵的見解,并展示你的發現。
總結
在本指南中,你學習了數據科學初學者應該避免的9種代價高的錯誤的實用技巧:
1.花費太多時間在理論上。
2.從頭編寫太多的算法。
3.跳入高深的主題,例如深度學習、太快了。
4.在簡歷中有太多的技術術語。
5.高估學位的價值。
6.找工作搜索太狹窄。
7.在面試中沒有準備好討論項目。
8.低估領域知識的價值。
9.忽視溝通技巧。
本文由北郵@愛可可-愛生活推薦,阿里云云棲社區翻譯。
文章原標題《9 Mistakes to Avoid When Starting Your Career in Data Science》
作者:elitedatascience網站,譯者:TIAMO_ZN,審閱:海棠