摘要:大數據如此火爆的時代,各種人才倍受青睞。
大數據如此火爆的時代,各種人才倍受青睞。視野決定了境界和能力,而所處的環境又決定了視野。好多人不知道什么是數據分析師,認為會熟練使用Excel就是數據分析師,如果你還會使用Excel中的一些高級功能如透視和函數等等,可能別人就認為你是牛*的數據分析師了,如果你工作中還用到了VBA,(word天啊!),在別人眼中你就是數據分析大神了。真的是這樣嗎?誠然,單用Excel的確可以解決大部分的數據問題,但是作為一個數據分析師,你并不是一個基層的統計分析從業者,那么數據分析師應該是怎樣的職業呢?
(一)數據分析師的職場之路
圖1:數據分析職位分類
數據分析的職位分類按照數據處理的不同階段分為數據采集、數據分析、與數據挖掘三種。其中數據采集的概念是對企業來說的,是jacky企業(航航數據)在做的事,包括原始數據源的采集和地理信息數據的采集,這里受眾面太窄,就不一一說了,想了解的朋友可以私信我。
下面主要說下數據分析和數據挖掘的職位:
大家要記住一句話:數據分析的職位分為業務方向與技術方向兩個方向,這兩個方向決定了兩條不同的職業規劃和晉升途徑,包括下面章節要說的數據分析的學習規劃也跟這兩個方向緊密相關。
1、業務方向
大家在招聘網站中搜索數據分析的職位,大概分為兩類:輔助業務的數據分析職位和數據分析師職位。
1)輔助業務的數據分析:一般在零售業里職位設置較多,該職位一定要對業務爛熟于心,對業務有長時間的積淀和理解,用數據發現業務流程中的問題,并提出合理化的解決方案,分析數據是為整個商業邏輯去做支撐。細分職位包括:市場調查、行業分析和經營分析三類。
2)數據分析師:業務方向的數據分析師,該職位招聘時一定前面有一個限定詞,什么數據分析師,歸結起來分為三類:產品數據分析師,運營數據分析師和銷售數據分析師。
2、技術方向
技術方向主要指數據挖掘方向,分為三類:數據挖掘工程師(機器學習)、數據倉庫工程師(構架師)和數據開發工程師。在互聯網和金融行業崗位設置較多
普遍來說:技術方向的基礎崗的工資薪酬要比業務崗的薪酬高一個等級,但是做到管理崗的話,在中國,業務崗的薪酬比技術崗的薪酬要高。
(二)數據分析從業者需具備的核心能力
我認為,數據分析從業者要具備四種核心能力:1、基礎科學的能力;2、使用分析工具的能力;3、掌握編程語言的能力;4、邏輯思維的能力
圖2:數據分析核心能力體系
1、基礎科學的能力
可以說,在數據決策的時代,數據分析幾乎滲透到企業的每個業務環節中,行業數據分析報告更是淋漓滿目,發布報告的有的是世界500強企業,有的是知名的數據洞察咨詢公司,jacky做為第三方數據評估機構的從業者,在看到可視化效果越來越絢麗的同時,我也憂心忡忡,大多數的數據分析報告:邏輯不見了,故事線沒有了,統計學支撐沒有了,金在其外,敗絮其中。
統計學,數學,邏輯學是數據分析的基礎,是數據分析師的內功,內功不扎實,學再多都是徒勞。
掌握統計學,我們才能知道每一種數據分析的模型,什么樣的輸入,什么樣的輸出,有什么樣的作用,開始我們并不一定要把每個算法都弄懂。
如果我們要做數據挖掘師,數據能力是我們吃飯的飯碗。如果你沒有數學能力,用現成的模型也好,模塊也好,也能做,但一定會影響你的技術提升,當然更影響你的職位晉升。
2、使用分析工具的能力
數據分析工具:SQL、SPSS、SAS、R、EXCEL等等吧,都必須掌握并且會應用,畢竟企業需要的不是學者而是應用型人才。
3、掌握編程語言的能力
不會Python、不會R,說你懂數據分析誰都不信。
4、邏輯思維的能力
邏輯思維對于數據分析來說特別重要,不單單是數理邏輯這塊,還要有邏輯學的知識。反映商業數據里,大家可以理解為去搭建商業框架或者說是故事線,有邏輯的推進,結果才會另人信服。
下面補充下做數據分析的流程邏(參考知乎網友,有改進,非原創):
1)提出假設
2)驗證假設(統計方法)
3)取數(SQL / Hive / Spark)
4)清洗和整理數據(R / Python Pandas / PySpark)
5)可視化(Excel / R ggplot2 / Python matplotlib)
6)展示給非技術人員(PowerPoint / Tableau / iPython Notebook / R Markdown)
(三)2017,數據分析學習規劃
任何一門技術或學科都有其內部規律,需要有計劃,有先后,循序漸進來學,jacky跟大家分享下潤祿數據學院的一些經驗:2017,數據分析的學習規劃(因個體差異,僅供參考)
下圖:橙色區域代表數據采集板塊,藍色區域代表數據分析板塊,綠色區域代表數據挖掘板塊。
圖3:數據分析學習規劃(從入門到中級)
1、統計學(業務方向)與SQL(技術方向):首要必會技能
任何數據分析師從事業務方向的工作都必須會統計學,統計學的學習最好輔助SPSS或其他SAS來學,做到數據分析基本功扎實,兼顧實戰性。
任何數據分析師從事技術方向的工作都必會SQL,不單是數據分析師,每一個運營、產品經理、尤其是互聯網行業,一定要會SQL,基本知名互聯網公司的產品經理都能寫SQL。
學習中,要掌握SQL的基礎語法、中級語法和常用函數,結合關系數據庫系統(Oracle Database、SQL Server、DB2等)來學習SQL語句,找好方法,真的不難。
2、Python與R:不分伯仲,都要掌握
Python主要掌握基礎語法,pandas操作、numpy操作、sklearn建模,學會用python編寫網絡爬蟲爬取數據,等等。
R語言就是為了統計而存在的語言,我們要掌握R語言的基礎語法、數據管理、數據挖掘建模與評估等。
以上是我們第二階段要學的技能。
3、數據可視化
有了Python、和R的基礎,我們可以就可以學習數據可視化了。運營和產品都需要學習可視化,可視化說白了,就是畫圖,但做為數據分析師來說,我們不能用EXCEL 來實現可視化,因為它的局限性太大了。這里也不建議花太多時間學習給非專業人士展示的Tableau,有1個小時學會Tableau足夠。
Python中可視化的工具有matplotlib,seaborn,ploltly;
R中可視化工具有plot基礎庫、ggplot2
隨心所欲,用Python和R,你就知道做數據分析工作是多么爽一個事
4、數據挖掘
這里知道要掌握基本概念,知道數據挖掘時做什么的,知道它與數據分析相比有什么不同
5、監督學習、非監督學習、模型評估
Model建模,知道模型建好后應該怎樣去評估,掌握怎樣用一些定量的指標,數據,數值來衡量模型建好后到底有多準確,或者說到底有多錯誤。模型評估的指標或計算方式選擇正確與否,能夠直接影響到整個項目獲模型是否有效。
6、以上這些只是數據分析的入門,還有... ...
機器學習,文本與自然語言處理,分布式計算工具SPARK.... ...
數據分析的路上,你準備好了嗎?2017,跟我一起,來逆襲吧