數據科學家是21世紀最性感的IT職業之一(另外一個是信息安全專家),也是高速迭代的IT技能中最保值的投資對象,大數據人才市場未來幾年都面臨嚴重“缺貨”,薪情也是一路看漲。。根據麥肯錫報告,僅僅在美國市場,2018年大數據人才和高級分析專家的人才缺口將高達19萬。此外美國企業還需要150萬位能夠提出正確問題、運用大數據分析結果的大數據相關管理人才。
對于渴望轉型的職場人士來說,大數據的魅力在于沒有城墻和護城河,人人都有機會成為數據科學家,無論你是Java程序員還是國企會計師。
以下IT經理網為大家收集整理了目前最好的9個免費大數據入門在線課程,由淺入深順序排列,無論您是有一定經驗的大數據技術人才,還是初來乍到的程序員或業務分析師,都能找到合適的姿勢提高自己的技能值:
一、大數據基礎(Big Data Basics)
課程平臺:Udemy
課程地址:
Big Data Basics: Hadoop, MapReduce, Hive, Pig, & Spark
Hadoop Starter Kit
點評:Udemy推出的這門大數據入門課程包含一小時的視頻介紹,幫助初學者了解大數據生態和主要技術,并且還引用真實的Hadoop案例幫助學習者更好地理解大數據技術原理。Hadoop Starter Kit適合有志于在Hadoop領域深造的學習者作為入門課程學習,但要求學習者掌握基本的Linux和Java知識。該課程提供了一個多節點的Hadoop教學集群,方便學生在分布式環境中進行實操。
二、Spark入門
課程平臺:edX
課程地址:Introduction to Spark
點評:Spark是Hadoop之后最火的大數據技術,加強了大數據系統對實時數據流的分析能力。edX的這門Spark入門課程有Spark發行商Databricks和EdX合作提供,涉及的話題還包括分布式機器學習,大數據分析等。
通向數據科學殿堂之路不可能一帆風順,你必須學習很多新規則、編程語言,更重要的是還要積累實戰經驗。這些都需要時間、精力和投入,但最終你會發現一切都物超所值。
這里有很多你可能會用到的學習參考書籍、培訓和演示文稿。
三、R語言基礎
課程平臺:Udemy
課程地址:R Basics — R Programming Language Introduction
點評:很友好的R語言入門教程,從下載到基礎語法和編程手把手領進門,學習者還能自己控制進度,沒人逼你。
四、Python入門
課程平臺:Udemy
課程地址:https://www.udemy.com/ardit-sulce-python-for-beginners/
點評:和R一樣Python也是大數據崗位不可或缺的工具,如今Python入門教程海了去了,這門課的優點是比較強調實操,有很多實例輔助。
五、機器學習入門
課程平臺:斯坦福大學Stanford Engineering Everwhere在線課程
課程地址:Introduction to Machine Learning
點評:雖然Andrew NG去了百度,但斯坦福大學在機器學習領域依然實力雄厚,這門課程包含了機器學習領域的基本概念,例如監督式和非監督式學習、強化學習和適應性控制等。此外這門課還涵蓋了最新的一些機器學習主題,例如機器人控制、數據挖掘、自動導航、生物信息學、語音識別、文本和web數據處理等。學員要求有基本的計算機科學知識,能夠編寫可用的電腦程序,同時還要對概率論和線性代數有所了解。
六、概率與統計入門
課程平臺:卡內基梅隆大學Open Learning Initiative
課程地址:Introductory-Level Probability and Statistics Guide
點評:在深入學習機器學習課程之前最好先把概率與統計知識儲備一下,卡內基梅隆大學的這門基礎課程對學員要求不高,只需要具備基本的代數知識就可以,課程作業支持各種常見的統計工具,例如Microsoft Excel, Minitab, R, TI calculator 或 StatCrunch。
七、人工智能
課程平臺:麻省理工學院公開課
課程地址:MIT’s Artificial Intelligence course
點評:麻省理工在線公開課基于過往學年的課堂實錄資料,知識點覆蓋全面,涵蓋了算法、數據結構、數據挖掘等,幫助學生理解人工智能的基本概念、知識體系和學習方法,課程最后還會要求學員動手開發智能系統解決實際問題。
八、棒球大數據分析實戰
課程平臺:Udemy
課程地址:Baseball Data Wrangling With Vagrant, R, and Retrosheet
點評:辛辛苦苦學了那么多大數據知識是不是有些技癢難熬?這門課程給你一個操練的機會,幫你變身電影《點球成金》里幫球隊重塑輝煌的名校鍵盤俠。你將學會用Retrosheet分析每一場比賽,學會用Cadwick抽取比賽數據,用R平臺的Dplyr過濾數據,并用ggplot生成分析結果。
九、精益分析
課程平臺:Udemy
課程地址:Lean Analytics Workshop — Alistair Croll and Ben Yoskovitz
點評:有Lean Analytics一書的作者親自授課,面向企業家和創業者,幫助企業使用分析方法獲取競爭優勢。課程涵蓋的一些要點包括如何制定好的評估體系,如何匹配數據與成長階段,如何改變組織的文化等。