在數(shù)據(jù)科學(xué)快速發(fā)展的今天,在世界大范圍的組織內(nèi)數(shù)據(jù)已經(jīng)變得至關(guān)重要,無疑這與過去十年熱議的“大數(shù)據(jù)”經(jīng)濟(jì)緊密相連,與數(shù)據(jù)相關(guān)的崗位當(dāng)今已經(jīng)成為經(jīng)濟(jì)社會(huì)中最熱門的技術(shù)崗位。
目錄
什么是Skill Up?
受訪者組成
數(shù)據(jù)工作最適合哪些行業(yè)——其中哪些工作是最具價(jià)值的?
行業(yè)分布
職業(yè)發(fā)展和面向數(shù)據(jù)的工作
技術(shù)使用分析
人們究竟在用什么工具?
Python高手們?nèi)粘_€使用什么工具?
技術(shù)棧
1.數(shù)據(jù)可視化工具
2.可編程數(shù)據(jù)管理員
3.大數(shù)據(jù)專家
4.數(shù)據(jù)架構(gòu)師
下一步是什么?
新興的趨勢是什么?
熱門話題
你覺得在未來12個(gè)月內(nèi),Julia作為數(shù)據(jù)科學(xué)語言會(huì)取代R語言和Python嗎?
你認(rèn)為在未來12個(gè)月內(nèi)Apache Spark可能會(huì)取代Hadoop嗎?
數(shù)據(jù)分析和數(shù)據(jù)檢索之間的邊界是模糊的嗎?
你的公司在未來12個(gè)月內(nèi)有實(shí)施大數(shù)據(jù)項(xiàng)目的計(jì)劃嗎?
最后...
Excel在你心中還占有一席之地嗎?
總結(jié)
正文
在數(shù)據(jù)科學(xué)快速發(fā)展的今天,在世界大范圍的組織內(nèi)數(shù)據(jù)已經(jīng)變得至關(guān)重要,無疑這與過去十年熱議的“大數(shù)據(jù)”經(jīng)濟(jì)緊密相連,與數(shù)據(jù)相關(guān)的崗位當(dāng)今已經(jīng)成為經(jīng)濟(jì)社會(huì)中最熱門的技術(shù)崗位。
Packt的Skill Up報(bào)告通過對數(shù)據(jù)科學(xué)從業(yè)者的技能調(diào)查,探討了數(shù)據(jù)科學(xué)在哪些領(lǐng)域最具價(jià)值,使用的工具是什么,以及未來的趨勢和挑戰(zhàn)是什么。
數(shù)據(jù)科學(xué)對中小企業(yè)重要性,充分表現(xiàn)在對于年輕人才的投資上。
在數(shù)據(jù)科學(xué)里,金融仍然是一個(gè)利潤豐厚的領(lǐng)域。
作為數(shù)據(jù)科學(xué)的主流開發(fā)語言,R語言和Python并駕齊驅(qū)。
分布式計(jì)算和機(jī)器學(xué)習(xí)繼續(xù)崛起。
物聯(lián)網(wǎng)是數(shù)據(jù)科學(xué)發(fā)展的最熱門趨勢之一,必將帶來新的挑戰(zhàn)和機(jī)遇。
永遠(yuǎn)都需要Excel!
在展示整個(gè)社區(qū)和推廣Skill Up活動(dòng)之前,先來回答一些問題。
什么是Skill Up?
Skill Up是一份調(diào)查報(bào)告,了解整個(gè)科技社區(qū)如何看待未來幾年內(nèi)的科技發(fā)展趨勢,分享從事什么工作才能最大限度地使用你的職業(yè)和技能優(yōu)勢。調(diào)查報(bào)告分為4個(gè)部分: Web開發(fā)和設(shè)計(jì)、應(yīng)用程序開發(fā)、安全與系統(tǒng)管理以及數(shù)據(jù)科學(xué)與商業(yè)智能,可謂是近年來史上最全面的調(diào)查之一了。
重要問題:
· 掌握什么技能才能獲得高薪?
· 在各行業(yè)里什么技能/技術(shù)最具價(jià)值?
· 真正值得你花時(shí)間學(xué)習(xí)的前沿技術(shù)是什么?
為了更好地了解科技社區(qū)的想法,我們要求所有受訪者填寫我們的調(diào)查問卷, 當(dāng)調(diào)查問卷完成后,一份有事實(shí)、有真相的調(diào)查結(jié)果就展現(xiàn)在我們面前了。其中最為重要的內(nèi)容就是你需要掌握哪些知識和技能,幫助你作出最好的職業(yè)決定。
讓我們一起來看看調(diào)查結(jié)果的具體內(nèi)容吧。
受訪者組成
本調(diào)查報(bào)告的數(shù)據(jù)來自超過3800名數(shù)據(jù)科學(xué)從業(yè)人員的問卷,這些受訪者分布范圍廣泛,分別來自多個(gè)不同行業(yè)并擁有不同級別的經(jīng)驗(yàn)水平。
圖例翻譯:Experience Level 經(jīng)驗(yàn)水平
圖例翻譯:
Job Sector 工作部門
Software Products 軟件產(chǎn)品
Web Services/Internet 網(wǎng)絡(luò)服務(wù)/互聯(lián)網(wǎng)
Consulting 咨詢
Education/Academia/Research 教育/學(xué)術(shù)/科研
Finance/Banking 金融/銀行
Media/Advertising/Entertainment &Gaming 媒體/廣告/娛樂&游戲
Government 政府
Health/Biotech/Science 健康/生物/科學(xué)
Telecommunications 電信
數(shù)據(jù)工作最適合哪些行業(yè)——其中哪些工作是最具價(jià)值的?
這里有一個(gè)共識, 在面向數(shù)據(jù)的工作里,確實(shí)存在最具價(jià)值的數(shù)據(jù)工作, 尤其是在那些依靠數(shù)據(jù)的行業(yè) (很少有行業(yè)你可以說數(shù)據(jù)不重要)。有趨勢表明,數(shù)據(jù)對哪個(gè)行業(yè)影響最大, 哪個(gè)行業(yè)的數(shù)據(jù)工作的價(jià)值就最大。
· 中小企業(yè)支付給缺乏經(jīng)驗(yàn)的菜鳥的薪酬是最好的。
· 金融仍然是支付給缺乏經(jīng)驗(yàn)的菜鳥的薪酬是最好的行業(yè)。
· 在動(dòng)態(tài)和快節(jié)奏的行業(yè),例如媒體和娛樂行業(yè),數(shù)據(jù)架構(gòu)師是最重要的工作角色之一,這證明了能夠構(gòu)建和實(shí)施關(guān)鍵業(yè)務(wù)解決方案的能力是必備的。
研究表明,對于缺乏經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)家和分析師來說,去中小企業(yè)就職,是開始他們職業(yè)生涯的較好選擇,起薪也往往會(huì)比大企業(yè)高些。即使是去那些初創(chuàng)企業(yè),也僅僅比大企業(yè)收入略低一些。隨著組織的迅速成長, 對于任何雄心勃勃, 渴望證明自己的人來說去一家初創(chuàng)企業(yè)不失為一個(gè)很好的選擇!
不同經(jīng)驗(yàn)水平在不同類型公司的年薪對比
行業(yè)分布
我們還研究了不同行業(yè)對數(shù)據(jù)科學(xué)人才的重視程度。受訪者們提供的指標(biāo)很好地表明了數(shù)據(jù)科學(xué)在哪些行業(yè)是最重要的。
大多數(shù)的受訪者在咨詢領(lǐng)域擁有超過20年的工作經(jīng)驗(yàn)。其共性表明,外部專家受到追捧。
那些經(jīng)驗(yàn)較少的受訪者主要集中在教育/學(xué)術(shù)領(lǐng)域從事研究工作。顯然,圖表顯示不是薪酬最高的行業(yè)之一。
經(jīng)驗(yàn)較少卻能獲較高年薪的人按行業(yè)分布
金融和銀行業(yè)脫穎而出,成為支付最佳薪酬的行業(yè)。隨著算法交易的興起, 大數(shù)據(jù)在金融的方方面面都有應(yīng)用,對于那些擁有數(shù)據(jù)一技之長,即使沒有很豐富的經(jīng)驗(yàn)的人來說,在金融領(lǐng)域也有很多獲得高薪的機(jī)會(huì)。
你想學(xué)習(xí)定量金融學(xué)嗎? 那就趕快撿起這個(gè)大禮包吧!
Mastering R for Quantitative Finance
R語言與定量金融學(xué)
Introduction to R for Quantitative Finance
R語言與定量金融學(xué)介紹
Python for Finance
Python與金融
Mastering Python for Finance
精通Python與金融
Advanced Quantitative Finance with C++
高級定量金融學(xué)與C++
(鏈接見PDF)
媒體/廣告/娛樂和游戲, 雖然不是利潤豐厚的金融領(lǐng)域,但看上去也是能為缺少經(jīng)驗(yàn)的人提供可觀薪水的行業(yè)。從實(shí)際情況出發(fā),一般來說, 一個(gè)缺少經(jīng)驗(yàn)但薪水要求不高的人在這些行業(yè)是很有競爭力的。我們的數(shù)據(jù)清楚的表明,這些行業(yè)愿意投資沒有技術(shù)經(jīng)驗(yàn)和數(shù)字技能的人。
這個(gè)跡象表明,在這些經(jīng)濟(jì)較困難,且需要依靠數(shù)據(jù)驅(qū)動(dòng)戰(zhàn)略來保持競爭力的行業(yè),雖然可能缺乏資金或現(xiàn)金流來投資和培養(yǎng)數(shù)據(jù)專業(yè)人才,但是如果缺乏經(jīng)驗(yàn)的人不要求高薪的話,若有合適的技能也有可能會(huì)填補(bǔ)職位的空缺。
職業(yè)發(fā)展和面向數(shù)據(jù)的工作
我們已經(jīng)了解到缺乏經(jīng)驗(yàn)的數(shù)據(jù)從業(yè)者在工作方面如何做出最佳選擇 ,那么之后未來的職業(yè)發(fā)展又會(huì)是怎樣的呢?
我們還想看到不同工作角色在不同行業(yè)的薪資差異。下面的圖表顯示了一些特定工作角色的最高薪水, 以及這些工作角色在哪些行業(yè)是最具價(jià)值的。
不同行業(yè)不同工作的平均年薪
圖例翻譯:
Data Architect 數(shù)據(jù)架構(gòu)師
Statistician統(tǒng)計(jì)師
Business Intelligence Expert (includes Devs, analysts) 商業(yè)智能專家
Data Scientist/Analyst 數(shù)據(jù)科學(xué)家/分析師
Intermediate IT/Regulation/Business 中級IT/合規(guī)/業(yè)務(wù)
Assistant Director 總監(jiān)助理
CONSULTING 咨詢
Finance/Banking 金融/銀行
Media/Advertising/Entertainment and Gaming 媒體/廣告/娛樂和游戲
· 媒體/廣告/娛樂和游戲行業(yè)的數(shù)據(jù)架構(gòu)師是最重要的工作角色之一,能夠爭取到比其他行業(yè)更高的薪水。
· 數(shù)據(jù)架構(gòu)師與數(shù)據(jù)統(tǒng)計(jì)師,對比兩者在行業(yè)中實(shí)施數(shù)據(jù)科學(xué)與數(shù)據(jù)驅(qū)動(dòng)戰(zhàn)略的關(guān)鍵差異,可以推斷出,在金融行業(yè)做數(shù)據(jù)統(tǒng)計(jì)的人的收入略高于數(shù)據(jù)架構(gòu)師,但是在媒體行業(yè)數(shù)據(jù)架構(gòu)師會(huì)掙得更多一些。
· 媒體和娛樂行業(yè)會(huì)經(jīng)常發(fā)生靈活的、組織級變化,快速響應(yīng)變化對于媒體和娛樂行業(yè)至關(guān)重要,因此開發(fā)解決方案、 搭建數(shù)據(jù)架構(gòu)的架構(gòu)師工作含金量非常高。但是在金融行業(yè),方案架構(gòu)早就有了,架構(gòu)師的工作含金量就不那么高了。
技術(shù)使用分析
有超過25%的受訪者表示日常使用Python, 但也有幾乎相同比例的人使用R語言。
分布式計(jì)算和機(jī)器學(xué)習(xí)正變得越來越重要。
增強(qiáng)現(xiàn)實(shí)技術(shù)和物聯(lián)網(wǎng)正在改變?nèi)藗兛创龜?shù)據(jù)的思路。
從后兩點(diǎn)可以讀出未來5年多種來源的數(shù)據(jù)繼續(xù)以指數(shù)級增長。處理這些數(shù)據(jù)的技術(shù)仍在發(fā)展, 所以不要讓自己落后!
人們究竟在用什么工具?
數(shù)據(jù)從業(yè)者日常需要用哪些工具呢,回答如下:
Python在數(shù)據(jù)領(lǐng)域勝出。其多功能性,擁有易于使用、內(nèi)容豐富、保羅萬象的第三方庫,從機(jī)器學(xué)習(xí)到web抓取無所不能 ,加上使用門檻較低, 使它成為理想的選擇。
Python高手們?nèi)粘_€使用什么工具?
大量的受訪者表示使用Python和R語言、 Python和Java、Python和C++。
同時(shí)掌握Python和R語言,可以提高你的編程熟練度,并成為一個(gè)適應(yīng)性更強(qiáng)的數(shù)據(jù)科學(xué)家:
Practical Data Science Cookbook
實(shí)用數(shù)據(jù)科學(xué)Cookbook
R Data Analysis Cookbook
R語言數(shù)據(jù)分析Cookbook
Python Data Analysis
Python數(shù)據(jù)分析
R for Data Science
R語言數(shù)據(jù)科學(xué)
Python Data Science Essentials
Python數(shù)據(jù)科學(xué)精要
(鏈接見PDF)
技術(shù)棧
為了更好地理解人們通常集中使用什么工具,我們做了一些聚類分析。我們把所有的回答導(dǎo)入一個(gè)圖形數(shù)據(jù)庫里, 并用科技界常用的聚類算法進(jìn)行運(yùn)算,從中我們發(fā)現(xiàn)一些相關(guān)的聚類技術(shù)棧:
1.數(shù)據(jù)可視化工具
這些人工作在設(shè)計(jì)數(shù)據(jù)科學(xué)光譜的最后端。從下面的聚類工具中看到, 與其他組相比,他們與前端web開發(fā)人員有許多共同之處。JavaScript排在第一位——設(shè)想有多少web是由JavaScript開發(fā)的,就一點(diǎn)也不奇怪了——還有其他設(shè)計(jì)工具和插件,例如CSS, HTML5和jQuery,能看出這些工具和插件在web開發(fā)中也起到了主導(dǎo)地位。
這組工具的出現(xiàn)幫助我們強(qiáng)調(diào)了網(wǎng)絡(luò)溝通中的數(shù)據(jù)洞察力,同時(shí)也突顯出當(dāng)你試圖理解和解讀數(shù)據(jù)時(shí),設(shè)計(jì)是多么的重要。
2.可編程數(shù)據(jù)管理員
使用這組工具的人們從事洞察數(shù)據(jù)的工作。他們主要負(fù)責(zé)快速地對數(shù)據(jù)進(jìn)行采集、清洗和操做,其目的是為了能夠回答任意特定問題,例如從客戶行為到財(cái)務(wù)規(guī)劃等。
Python成為最重要的工具——不足為奇,因?yàn)樗哂腥菀资褂玫脑秃蛷?qiáng)大的靈活性。
Pandas的出現(xiàn)強(qiáng)調(diào)了Python的主導(dǎo)地位——事實(shí)上, 恰好是因?yàn)閜andas提高了Python的數(shù)據(jù)分析能力,從而鞏固了自己的地位。
然而這里還有趣地看到了C++ , 雖然Python提供了靈活性和易用性, 但是C++的驚人執(zhí)行速度仍然是Python無可匹敵的。
3.大數(shù)據(jù)專家
使用這組工具的是對系統(tǒng)的可伸縮性和健壯性感興趣的大數(shù)據(jù)專家。
Hadoop在這里主宰了大數(shù)據(jù)世界——然而, Scala和 Spark也出現(xiàn)在這組工具里,并且地位顯著。隨著要求更快的處理速度(通過擴(kuò)展實(shí)時(shí)分析實(shí)現(xiàn))從而需求增加,很有可能期待看到更多的進(jìn)步。
還有一些有趣的web工具也出現(xiàn)在聚類里,比如JavaScript和Spring。它們曾出在第一個(gè)聚類里,其作用是通過基于web的應(yīng)用程序來進(jìn)行有效和快速的溝通。
4. Data Architects數(shù)據(jù)架構(gòu)師
這組工具反映了組織的需求,如何以有效、智能的方式進(jìn)行數(shù)據(jù)洞察力的溝通—這也是數(shù)據(jù)架構(gòu)師的主要挑戰(zhàn)。顯然, 企業(yè)級工具占據(jù)了這個(gè)聚類, 聚類還顯示出企業(yè)在選擇關(guān)鍵業(yè)務(wù)的工具時(shí),微軟和甲骨文仍被視為首要選擇。
這些工具組給了我們一個(gè)有用的啟示,數(shù)據(jù)世界是如何細(xì)分的, 不同的工作角色是如何建立起一個(gè)工具的“生態(tài)系統(tǒng)”的。一個(gè)有趣的問題是, 這個(gè)工具“生態(tài)系統(tǒng)”在未來的幾年內(nèi)會(huì)改變嗎?這些聚類會(huì)不會(huì)變得不穩(wěn)定?
下一步是什么?
我們向受訪者提問在未來得6個(gè)月之內(nèi)計(jì)劃學(xué)習(xí)什么工具。我們想知道哪些是熱門工具, 是什么人在使用這些能夠賺錢的工具, 這些問題的答案可以幫助你決定在哪個(gè)領(lǐng)域提高技能, 或?qū)W習(xí)新的知識。
下面一起來看按薪水加權(quán)的根據(jù)詞頻畫出的詞云吧!
提幾個(gè)經(jīng)過研究的關(guān)鍵建議:
· Spark和Hadoop表現(xiàn)出眾, 表明集群計(jì)算在增長。
· 基于Web的技術(shù)也出現(xiàn)在詞云里,表明人們看到了網(wǎng)絡(luò)共享數(shù)據(jù)分析的價(jià)值。
· NoSQL數(shù)據(jù)庫的熱度在數(shù)據(jù)世界里持續(xù)上升。
新興的趨勢是什么?
我們詢問受訪者,在未來12個(gè)月內(nèi)最重要的新興的趨勢是什么:
從回答中得到一些明確的信息:
· 機(jī)器學(xué)習(xí)將成為大家關(guān)注的焦點(diǎn)之一,因?yàn)樵跀?shù)據(jù)領(lǐng)域工作的所有人,以及相當(dāng)范圍內(nèi)的部門和行業(yè),都將被預(yù)測洞察和統(tǒng)計(jì)分析這兩個(gè)需求所驅(qū)動(dòng)。
· 增強(qiáng)現(xiàn)實(shí)技術(shù)和物聯(lián)網(wǎng)將成為數(shù)據(jù)科學(xué)家在未來幾年內(nèi)主要面臨的挑戰(zhàn)。
· 移動(dòng)在詞云中的突出顯示表明了移動(dòng)性分析越來越被強(qiáng)調(diào),因?yàn)橛脩粲须x開辦公桌越來越遠(yuǎn)的趨勢。
· 分布式計(jì)算(集群式和云平臺)會(huì)改變我們的思考方式,甚至是對數(shù)據(jù)的思考。管理大數(shù)據(jù)項(xiàng)目中的資源所產(chǎn)生的焦慮,是基于前面情況可能出現(xiàn)的癥狀。隨著物聯(lián)網(wǎng)和移動(dòng)應(yīng)用日益占據(jù)主導(dǎo)地位, 管理更大的數(shù)據(jù)集將成為一個(gè)更大的挑戰(zhàn)。
如果你參與了一個(gè)大數(shù)據(jù)項(xiàng)目, 你就需要掌握機(jī)器學(xué)習(xí)的技術(shù)。從現(xiàn)在起,打開這個(gè)禮包,開始探索機(jī)器學(xué)習(xí)和預(yù)測分析之旅吧。
Machine Learning with Spark
Spark與機(jī)器學(xué)習(xí)
Scala for Machine Learning
Scala與機(jī)器學(xué)習(xí)
Machine Learning with R
R語言與機(jī)器學(xué)習(xí)
Machine Learning with R Cookbook
R Cookbook與機(jī)器學(xué)習(xí)
Building Machine Learning Systems with Python - Second Edition
用Python構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)—第二版
(鏈接見PDF)
Hot Topics 熱門話題
我們詢問了受訪者關(guān)于大數(shù)據(jù)發(fā)展和挑戰(zhàn)的一些簡單但熱門的話題。
你覺得在未來12個(gè)月內(nèi),Julia作為數(shù)據(jù)科學(xué)語言會(huì)取代R語言和Python嗎?
由薪水最高的受訪者給出的答案是,Julia正處于上升階段。原因很簡單,因?yàn)樗菍iT為科學(xué)計(jì)算而設(shè)計(jì)的語言,擁有一些有趣的特性,比如多重分派,實(shí)用的圖形庫和完美的JIT編譯性能。Julia值得我們拭目以待!
想要保持領(lǐng)先于趨勢的地位嗎? 選擇一本Julia的書開始學(xué)習(xí)吧!
Getting started with Julia Programming Language
Julia編程入門
Mastering Julia
精通Julia
Getting Started with LLVM Core Libraries
LLVM核心庫入門
Python High Performance Programming
Python高性能編程
R High Performance Programming
R語言高性能編程
(鏈接見PDF)
你認(rèn)為在未來12個(gè)月內(nèi)Apache Spark可能會(huì)取代Hadoop嗎?
調(diào)查結(jié)果說你現(xiàn)在安全啦!
然而,如果你還沒有搭上Hadoop的快車,那么現(xiàn)在搭上還不算晚哦…
Learning Hadoop 2
學(xué)習(xí)Hadoop 2
Mastering Hadoop
精通Hadoop
Big Data Analytics with R and Hadoop
用R語言和Hadoop分析大數(shù)據(jù)
Fast Data Processing with Spark - Second Edition
快速數(shù)據(jù)處理與Spark—第二版
Apache Mesos Essentials
Apache Mesos精要
(鏈接見PDF)
數(shù)據(jù)分析和數(shù)據(jù)檢索之間的邊界是模糊的嗎?
普遍來講 ,這是有爭議的。
· 64%的受訪者同意邊界是模糊的。
像BigQuery這樣的工具本可以表現(xiàn)得更出色。當(dāng)然啦,還需在未來12個(gè)月內(nèi)繼續(xù)觀察這些工具的表現(xiàn)。
隨著大數(shù)據(jù)變得無處不在,大數(shù)據(jù)的原則不再僅僅滿足最簡單有效的策略了,同時(shí)還要滿足最高的效率和最快的速度。
想成為精通數(shù)據(jù)分析和數(shù)據(jù)檢索的大師嗎?趕快學(xué)習(xí)這些熱門書籍吧。
Clean Data
數(shù)據(jù)清洗
Practical Data Analysis
數(shù)據(jù)分析實(shí)踐
Mastering Predictive Analytics with R
精通R語言預(yù)測分析
Learning Data Mining with R
使用R語言進(jìn)行數(shù)據(jù)挖掘
Learning Pandas
學(xué)習(xí)Pandas
(鏈接見PDF)
你的公司在未來12個(gè)月內(nèi)有實(shí)施大數(shù)據(jù)項(xiàng)目的計(jì)劃嗎?
看起來,大多數(shù)受訪者都工作在期待實(shí)施大數(shù)據(jù)項(xiàng)目的組織中,這與他們?nèi)狈?jīng)驗(yàn)的情況存在巨大的反差,雖然原因并不明顯, 但有許多可能的解釋。
可能是那些缺乏經(jīng)驗(yàn)的人并不參與組織戰(zhàn)略的制定和決策。或者可能那些缺乏經(jīng)驗(yàn)的人剛開始工作,恰好了解到已經(jīng)有大數(shù)據(jù)項(xiàng)目實(shí)現(xiàn)。
最后...
Excel在你心中還占有一席之地嗎?
Excel是永恒的, Excel 2013太棒了…它神一樣的存在所有人的內(nèi)心深處!
總結(jié)
可能是老生常談了,很顯然科學(xué)數(shù)據(jù)和大數(shù)據(jù)不是簡單的趨勢 ,而是一場深刻而廣泛的社會(huì)、文化和經(jīng)濟(jì)上的變革。
咱們不討論“大數(shù)據(jù)革命”或說“數(shù)據(jù)科學(xué)家”是“21世紀(jì)最性感的工作”的話題了,讓我們來看看數(shù)據(jù)在不同領(lǐng)域應(yīng)用的不同方法吧。對于中小企業(yè)來說, 應(yīng)用數(shù)據(jù)讓公司更加開放、積極地面對和響應(yīng)性市場的變化是至關(guān)重要的。機(jī)器學(xué)習(xí)的重要性進(jìn)一步凸顯出來,它能快速交付一個(gè)明確而有意義的洞察力!在較大的組織中,往往會(huì)有創(chuàng)建大數(shù)據(jù)解決方案的動(dòng)力。由于數(shù)據(jù)科學(xué)家和分析師尋找引入新的工具方法,比如Hadoop和Spark,使得分布式計(jì)算和集群式計(jì)算明顯上升。
更加有趣的是,由于物聯(lián)網(wǎng)和增強(qiáng)現(xiàn)實(shí)等新興的趨勢出現(xiàn),我們對數(shù)據(jù)的理解似乎正在改變。物聯(lián)網(wǎng)取代大數(shù)據(jù)成為未來的流行詞極有可能。數(shù)據(jù)科學(xué)家,分析師和架構(gòu)師們雖然還不清楚如何解決日常問題,但是幾乎可以肯定的是,遍布每一個(gè)角落的數(shù)據(jù)文化會(huì)給人們帶來許多的挑戰(zhàn)和大量激動(dòng)人心的機(jī)會(huì)。
如果你想成為一個(gè)數(shù)據(jù)科學(xué)家,你需要:
· 擴(kuò)大編程語言范圍是必須的,這將使你更具有靈活性。當(dāng)你為一系列不同的項(xiàng)目工作時(shí),
· 掌握機(jī)器學(xué)習(xí)。如果你想開始或進(jìn)一步深入學(xué)習(xí), 就去抓取機(jī)器學(xué)習(xí)的大禮包吧!
· 如果你剛剛開啟職業(yè)生涯,你也許在金融行業(yè)或者中小企業(yè),也許工作很糟,你也許在一個(gè)成熟的大型企業(yè)獲得了高薪工作,但在這里可能有個(gè)小小的差別,在一個(gè)中小企業(yè)里會(huì)得到更多的機(jī)會(huì)和責(zé)任。
· 如果你在媒體行業(yè)工作,努力成為一個(gè)數(shù)據(jù)架構(gòu)師吧, 學(xué)習(xí)如何開發(fā)和實(shí)施大規(guī)模數(shù)據(jù)的解決方案,可以讓整個(gè)組織受益。
· 掌握Hadoop和Spark大數(shù)據(jù)工具是有用的,掌握在分布式網(wǎng)絡(luò)環(huán)境中學(xué)會(huì)使用這些工具調(diào)配緊張的資源更加有用。
· 關(guān)注物聯(lián)網(wǎng)——我們目前還不太知道物聯(lián)網(wǎng)將把數(shù)據(jù)世界引向何方!