IT支出的增長整體上都是很平緩的,但是該領域的“大數據”技術預計將大幅增長,據行業分析機構Gartner所說。大數據是大容量、高速信息,包括結構化和非結構化類型的數據。
Gartner預測全球IT支出將從2012年的3.6萬億美元增長到3.7萬億美元在2013年,這是略微的增加。不過,到2015年,全球會創造出440萬IT工作來支持大數據這個新事業,根據Peter Sondergaard所說,Gartner高級副總裁和全球研究主管。
在主動改變IT行業的力量中,大數據是最強的信息行業組件,在佛羅里達州奧蘭多市的Gartner ITxpo上,Sondergaard對人們所說。他指出將來的組織會因為他們的數據科學家所創建的預測算法的質量而聞名。今天,填充新的大數據相關的工作可能是一個挑戰。
然而,數據分析這項工作不是新的了,像Cassandra,Hadoop和NoSQL這樣的現代大數據工具,相對來說還不是很熟悉。作為一個工作范疇,“數據科學家”是一個相當新的,乳臭未干的,但可以找到它的定義。
在Gartner ITxpo上,Gartner分析師兼研究副總裁,Ray Valdes暗示數據科學家要開發出明確的方法來看待問題。他說,他們的基本過程是:第一,確定人群;第二,獲得具體數據;第三,分類分析數據;第四,重新調整他們所創建的系統。“小塊數據中蘊藏著很大的能量,”他補充說。
但知道哪里找到正確的數據,以及了解正確的算法分析器,與其它事情相比,是一項藝術。它還可能會非常棘手,因為法規中涵蓋了如何可以使用數據。
Valdes警告說,巴爾德斯警告說,現在處理的數據的許多人都不清楚它的價值——和它的陷阱。“數據比你想像的更有價值。它也比你想的更具有風險,”他對ITxpo的參與者說。
數據領域的人才流失
數據科學家技能集合是具有挑戰性的,因為它要求知識領域的數據駐留在其中。這是不可能改變的,根據觀察家所分析。
“數據科學家的概念仍然在進化,”Ken Rabolt說,Nielson有限公司的首席數據架構師。“走入數據中是找到什么是問題的最好方法,”他補充說,“幾年后,將會有足夠的知識,因此會有指導,但現在這仍然是一種發現模式。”
數據科學家的地位會越來越重要,Eric Williams同意地說,他是Catalina Marketing有前執行副總裁和CIO,他還出席了ITxpo。公司不能前進的太快,他修正說。“如果一個公司現在還沒有數據科學家,那么它需要引入一個這樣的角色……”他嘲諷地說。“還沒意識到這一點的公司會發現,他們自己是快速排行榜上將會是最后一名。”
Williams被問及是否有學校培訓的數據科學家已經準備好在一個組織內獲得成功。“我們發布,獲得走出校園,擁有處理信息方面的知識的人才是一個關鍵,”他回答說,“但是如果你沒有關于業務的知道,那么你將會失敗。”
混合型人才是必需的:數據科學家不能只要有統計知識,也不能僅有業務知識,Williams說。