因為大數據這個詞過于“忽悠”,乃至于大數據分析專家也讓人十分景仰而不知其真身。
說實話,什么樣的人可以稱為大數據分析專家可能根本沒有一個標準。就像籠統的說這個人是一個好人一樣。這篇文章告訴我們,我們應該先搞清楚我們需要具備什么樣的能力,再自封或尋找專家不遲。
在谷歌上搜索最希望在Linkedin上獲得的人才,其結果是大數據專家。而各個公司在谷歌上搜索具有大數據專家履歷的候選人仍保持了最大的搜索量。在與這些公司討論了他們真正需要什么樣的人才后,得出的結論是: 大數據專家不存在。 下文將告訴你為什么。
公司認為自己所需的人才該具備什么素質? 我想是技能,經驗和態度的結合。具體總結如下:
1)專家。也指行業內的專業人才。意思是他確實知道自己做的是什么并且已經做了好幾年了。雖然大數據并不是新的專業領域,但是存儲,處理,分析和可視化大數據這些方面的工具尚未完全成熟。所以這些工具的使用技能很稀缺。
2)數據庫知識。如果你在尋找數據專家,那么也意味著該數據專家了解數據庫方面的知識。Hadoop憑借優異的存儲和處理數據的大數據架構占據一席之地,同時關系型數據庫也面臨來自其他類型數據庫(如NoSQL)在提高查詢性能方面的競爭。每個公司都會選擇以最優的成本效益實現最大化業務需求的數據庫。其他數據庫則可能需要不同查詢語言的知識。
3)ETL。當完成了數據的收集和存儲,接下來就要提取、轉換和加載數據(即ETL過程)到分析/報告環境中,這個過程需要大量具體而特別的知識。如果不使用對“業務用戶”高度友好性的成熟的ETL工具,你可能還需要了解如何使用SQL來轉移數據。使用“大數據”可能會影響在您假定的非工作時間窗口內提取和加載數據。
4)分析技能。 你在大學期間學到的技能之一就是通過分析法來解決問題。善于分析并不是適合每一個人的技能,就我所了解到的,大多數情況下要求具備該技能時會同時要求具備學士學位。在我看來,好奇心也是一個有助于獲得新見解的技能。
5)業務知識。脫離特定場景的數據是沒有多大用處的。要了解某個部門的業務(例如網絡營銷或人力資源),需要擁有相關經驗以了解他們的需求和挑戰,并且將數據轉換為商業智能。在商業知識領域,人們可以理解為一個候選人需要能夠展示其分析過程和結論并能夠將結果傳達到更廣泛的(更高級)管理領域。在正確的時間使用正確的語言并且讓所有人聽從你的建議是非常特別,有價值和稀缺的技能!
6)可視化數據。即使你已經完成了所有的工作,包括收集所需的數據,分析數據并且找到一些可以分享的有意義的觀點,但還有一個挑戰就是可視化數據,可視化數據可以立即顯示數據價值。有針對這方面的研究顯示,人們傾向于觀看圖像的上部(因此上部位置適合放置報告或儀表板),并且太多的文字可能干擾所呈現的信息。
結論?不要尋找大數據專家這個傳說中的獨角獸!
與其在五個人才中費盡心血終于找到一個具備了所有上述特征的候選人。
不如總結公司現有的技能和專長,然后找出差距。如果你想通過大數據獲得成功,這將必然是團隊合作的成果。
在任何領域,當然包括大數據領域,都要綜合考慮團隊和個人的力量。很多時候,我們需要獨角獸這樣的孤膽英雄,因為他們可以一己之力開疆辟土,帶領團隊前進。但同時我們需要團隊的整體力量,取長補短,鑒定穩步的前進。