什么是數據科學家?如果你有分析數學的天賦,為什么不考慮成為一名數據科學家呢?成為一名數據科學家需要做些什么?在這里會以令人驚訝的方式為你回答這些問題。
讓我們退后一步來思考大數據。你是否佩戴了智能手表?你是否擁有一些可以告訴進行了多少運動的技術和產品?你是否使用Siri,Cortana,Amazon Echo或Google Home?你住在一個智慧城市嗎?你在網上購物嗎?你用IC卡乘車嗎?所有這些行為都會頻繁地、大規模地獲取數據。你使用技術的方式,以及在日常生活中的活動創造了一種模式。這種模式可以被采取和匹配到其他用戶的模式,并進行分析。那么是誰在分析數據以識別模式?那就是數據科學家。
數據科學領域是由數據的存在和對數據科學家的渴求而產生的,他們可以有效地利用這些數據來創建算法。這些需要識別和饋送模式的算法仍在開發中,而且非常急需。而且在數據不斷涌入的情況下,它們永遠不會停止發展。
數據分析的工作量龐大復雜,這對企業、公司和政府的影響也很大,因此對數據科學家的需求日益增長。數據科學家有著一份很好的工作前景,具有吸引人的薪酬。數據科學家被稱之為2017年最好的工作之一。
但是數據科學家面臨的現實是否與大數據的發展前景匹配?
要想成為數據科學家到底有多難?
根據最近由365 Data Science公司發表的一項研究表明,成為數據科學家需要以下的基本條件:至少精通一門外語,并且擁有兩個或以上的學位,從事數據分析工作4年以上,可以采用R或Python語言編程。
以下進行一下分析:首先,這些數據來自目前從事數據科學家職業的1001名工作人員的LinkedIn簡介。365 Data Science公司的研究小組希望了解他們是如何成為數據科學家,需要具有哪些技能和能力。
那么,企業更需要男性數據科學家嗎?
數據告訴我們,70%的數據科學家是男性。也許人們可能對此表示認同,在早先的童年時期學習和內化的定型觀念中,很多年輕女孩就完全脫離了STEM(科學、技術、工程、數學)科目,這并不是什么性別歧視,調查數字表明這就是現實。
對此,女性也不要絕望。研究表明,企業顯然更需要女性數據科學家。很多領域曾經是以男性為主,但在性別平衡方面已有很大的進步。
根據IBM公司進行的一項研究,到2020年,僅在美國將會有2,720,000個數據科學職位。
除了性別之外,讓我們來看看還有什么是成為數據科學家面臨的問題。
數據科學家需要掌握多少種語言?
其實兩種語言就可以。作為一名數據科學家,則需要至少通曉一種外語。這是有道理的:雖然編程和數學都是和語言無關的,但是,薪酬豐厚的就業機會仍然主要集中在美國、英國、西歐,以及印度,主要專業語言是英語。也就是說,如果你的第一或第二(或第三)語言是英語,那么在語言方面就會合格。
但是,如果仔細研究大數據科學名列前茅的國家和地區分別是美國,英國和西歐的話,那么大數據科學在世界其他國家和地區還有什么機會?那就是全球各地的最好的高等教育機構。
你是否獲得全球50強大學的學位,如果具有這樣的條件,是否有機會從事數據科學家?
并不是。數據科學并不是一個適合知名大學和畢業生的學科。盡管樣本中有28%的人畢業于全球前50名的大學,但是在1001名數據科學家中,有四分之一的人就讀的大學甚至沒有出現在全球大學50強的名單上,而兩者之間的數字有些均勻分布。
現在,鑒于收集到的數據是為了確定就職于財富500強巨頭的數據科學家需要做的事情,可以根據大學排名查看就職財富500強的數據。
人們會注意到在這個樣本中,財富500強公司中半數以上的人員是全球50強大學的畢業生(28%)。但沒有名列其中的大學的畢業生仍占23%。
而根據“財富”500強員工進行調查的兩個統計小組反映了上述統計數據。另外,如果只看從一所頂級大學畢業的數據科學家,那么這個鴻溝實際上是平等的:一半的人入職“財富”500強公司,而另一半人則在規模較小的公司和初創企業中獲得職位。
這一切都不是巧合。當然,從一個排名良好的教育機構獲得的文憑可以作為技能和資格的保證,并向未來的雇主表明具有被其選中的資格。但是,通過聲望較低的大學畢業生的高就業率表明,還有其他方式來展示畢業生的信譽和工作能力。這些人仍然可以通過自我準備來展示自己所具有的豐富知識和熟練技能。
如果自學的話,是否更有可能得到這份工作?
這個問題并沒有一個明確的答案,但調查數據提出了一些建議。在這個調查樣本中,至少有40%的數據科學家在他們的LinkedIn檔案中顯示出他們已經學完了至少一個與他們領域有關的在線課程。而這只是展示的一些,但實際上開展自學的人可能比這要高得多。
但是查看那些與知名大學相關的大學學位,數據表明所有人都進行過某種自學。但是那些早就做好自學準備的人則來自那些不太出名的大學的人。
需要指出的是,全球50強的大學畢業生并沒有落后。其中大約35%的人報告已學過在線課程,而排名靠后的大學似乎鼓勵學生需要加倍努力。當有資格成為一名數據科學家時,其自我學習和準備是一個有利的競爭因素。而企業需要對數據科學家的畢業學校進行更多的了解。
人們可以通過學習數據科學來獲得數據科學家的職位嗎?
不能。首先,數據科學是一門全新的學科。這個職位的產生只有10多年的時間,總的來說,高等教育機構還沒有在他們的課程中納入一個完整的數據科學軌道。
目前的數據科學家的學術背景有很大的差異。例如,數據科學家的專業主要來自計算機科學(20%),統計與數學(19%),經濟學與社會科學(19%)的畢業生。這些專業的畢業生占據很大比重,但在其他方面也是多樣化的,如果擁有一個數學學位,那么也有可能成為一名數據科學家。但從物理學,化學,生物學或工程學等領域進入數據科學領域是聞所未聞的,因為專業是一種技術資格。
獲得數據科學家的職位,只有學士學位是否足夠?
只具有學士學位是不夠的,在這個調查樣本中的大多數專業人員至少擁有一個(48%)碩士學位,而27%的人擁有博士學位。如果沒有這兩種學位,進入這個領域并不是沒有先例的,因為樣本中15%的數據科學家已經做到了這一點。但這并不具備代表性。
需要精通Java,C / C ++,Matlab,SQL,SAS,R,Scala,LaTeX和gang這些編程語言嗎?
情況并非如此。但人們具有這些技能肯定令人印象深刻,在當前的數據科學世界當然并不是必備的條件。當然,根據就業和工業國家的情況會有所不同,但是人們需要具有以下共識:
如果精通R和(或者)Python語言,就將會有一定的機會。精通SQL當然也是值得考慮的事情,盡管它暫時(根據樣本)落后于流行的編程語言(其使用率為40%,而R和Python則為53%)。而編程語言和行業用法人們可以通過各種方法進行了解。
成為未來的數據科學家有哪些關鍵要點?
從目前統計數據中得出的一個結論是,成為數據科學家,并不需要獲得博士學位,也不需要來自一所高校的博士學位,或者是精通多種編程語言(或者說外語)。而具有定量分析的能力,聰明的頭腦,以及強烈的好奇心,這就足夠了。畢竟到了2020年,僅在美國就會提供大約2,720,000個數據科學家職位,只要為此進行努力,還是大有機會的。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。