大數據科學家有多牛?讓我們從有史以來市值最高的科技公司蘋果看起。為搶大數據科學家,蘋果開出美金16萬到20萬(約合臺幣400萬到600萬)的年薪,以及任何你想得到的好福利:美味員工餐、健身中心、教育津貼甚至凍卵補助,但蘋果不是唯一一個需要數據科學家的公司,打開領英(LinkedIn)。上面至少有5萬3千個數據科學家的職缺,而這還只是美國的統計數字。
美國專業招聘公司羅致恒富(Robert Halt)公布的《2015薪資指南》把大數據工程師列為今年薪資漲幅最大的六大行業之一,預計薪資年成長率9.3%,平均年薪119,250美元至168,250美元,在國內根據經驗平均也有100萬到500萬的薪資行情。
鼎鼎大名的數據科學家你也許聽過不少,諸如美國白宮首席數據科學家帕帝亞(DJ Patil)、被選為全美Top 4技術長的寶立明又或者是阿里巴巴集團大數據的第一把交椅車品覺,但這些如雷貫耳的大數據科學家動輒掌管一個個國家或跨國企業的海量數據,彷彿離一般人很遙遠。其實,現在各行各業都亟需大數據科學家,你也可以加入大數據淘金潮,但到底什么樣的人才適合做大數據的工作呢?想要搶搭大數據人才熱潮,晉身高薪一族,又需要注意哪些事情?
就跟絕大數從事電腦工程的人一樣,大數據科學家每日需與大量數據為伍;同樣是大數據分析,但每個分析師或科學家所專注的領域有所不同。從市場反應決定要做出什么相對應措施,時常與點擊率、轉化率和流失率等數據為伍。然而不管何種類型的大數據科學家,身上都具備以下5種專業特質:
特質一:定義和厘清問題
好的數據科學家具備什么條件,一般可以分成兩種等級:一種是是別人幫你把問題定義好,然后你來解開,但更厲害的是你知道怎么找問題,什么問題才是重要的,自己發現問題。要定義最有前瞻性最重要的問題,結果不只正確還要顯著性,對各領域發展有貢獻,要有商業價值和技術進步的空間,兩者能兼備是最好的。在分析數據時定義問題的能力很重要,因為問題分成很多層面,數據科學家必須要看當下要解決什么問題,再用那個指標去回答。因此數據科學家首要具備的條件就是:定義和厘清問題。
特質二:想像力
不要以為數據科學家整天在電腦前面工作,只要一板一眼地分析數據就好,其實想像力也很重要。有一定的創意才能幫助自己找到不一樣的觀點,學校會訓練你使用習慣的工具,但你應該要嘗試各種可能,如果沒有專業知識判斷,最后得到的結果就會跟大家差不多。
例如一些提供大數據解決方案的公司常會需要幫助客戶找到具有某種特征的族群,這個時候若只靠經驗和專業是不夠的,還需要發揮一些想像力。我們在描述一個人的行為傾向時是很多維度的東西去做整合,除了你對生活經驗的豐富度之外,你還要有創意去描述這種人具有什么樣的行為特征,我們再透過機器學習的輔助,幫助你快速收集這些特征背后隱含的意義是什么,不然一般人就是我想到什么樣的資訊我就勾一勾,這是遠遠不夠的。
特質三:邏輯思考能力
數據科學家的工作時常需要建立假設然后去驗證它,并且建立模型,這個過程依賴優秀的邏輯思考能力,否則追尋答案到一半可能不小心就會走到岔路。心理學的訓練幫助可以更容易了解他人的動機和想法,也因此在分析數據時常有意想不到的收獲。
以大數據科學家最討厭的機器人為例,這類的假數據抓不勝抓,又會影響到統計結果,令人不堪其擾,然而與其去思考機器人在哪里,要怎么抓,不如反向思考什么樣的網頁需要機器人,機器人的數據從哪里來,就像是偵探福爾摩斯一樣,偵探怎么找出犯人,他不是從犯案手法去看的,而是從動機。
特質四:基礎數理與資訊工程能力
大數據科學家不一定非得要是理工學院或電資學院出身的,但還是必須具備基礎數理與資訊工程能力。
你也許可以用Excel去處理數據,但如果想要加快資料處理速度的話,程式能力依然是必須的。不害怕數字很重要,必須要培養對數字的敏銳度;在工具之外,最重要的還是商業嗅覺,現在很多人隨隨便便就說自己會做數據分析會用什么資訊工具,但沒有商業眼光依然白搭。
特質五:跨界合作能力
最后,由于大數據科學家必須膽大心細又要天馬行空,邏輯好之外還得要融合自身生活經驗,這些特質要在一個人身上面面俱到非常困難。跨界合作能力在這里就顯得格外重要,因為不同的產業別需要不同的觀點,如果不懂得傾聽別人的意見,恐怕陷入盲點而不自知,跨界合作有助于發現不同面向切入分析,更有效率地做決策。
“在大數據領域的英雄不是圖靈,也不是克勞德·夏農(發明資訊概論的人),而是福爾摩斯;如果只是因為大數據很紅就去學習大數據,你學這些也許只能賺22W的,但是如果先掌握這些特質,把專業領域做好,你就可以賺220W。因此,與其盲目追隨大數據熱潮,不如看看自己是否具備這些特質以及專業,再來決定要不要加入大數據淘金潮。