跟蹤大數據的趨勢,研究和統計數據為專業人士提供了一個規劃大數據項目的堅實的基礎,這里有每個IT專業人士都應該知道的15個有關大數據的重要事實。
每個人都在談論大數據,從年度支出的挑戰,到創造就業機會,甚至大數據項目所需的工具。很多人相信大數據能幫助企業做出更好的決策——的確,十個高管中有八個同意或強烈同意這種說法”如果我們能夠利用我們所有的數據,我們將會有一個更強大的業務。”
跟蹤大數據趨勢,研究和統計數據為專業人士提供了一個規劃大數據項目的堅實基礎。Webopedia編制了這些重要的大數據的事實和數據,成為每個專業人士都應該知道的事實。
1、究竟有多少數據?
每一天,我們創造2.5千億字節的數據——現今世界上90%的數據都是在過去的兩年里創建起來的。這個數據來自于任何地方:傳感器用來收集氣候信息,社會媒體網站的職位,數字圖像和視頻,購買交易記錄和手機的全球定位系統的信號。
2、結構化與非結構化數據
對大數據的歸類,塔塔咨詢服務有限公司(TCS) 查看了很多公司結構化和非結構化的數據,以及內部和外部產生了多少數據。
51%的數據是結構化的
27%的數據是非結構化的
21%的數據是半結構化的
非結構化的數據的百分比比預期的要多很多——要么是非結構化的要么是結構化的,并且不到四分之一的數據是外部的。
3、大數據創造的工作
到2015年,全球440萬的就業崗位是被大數據創造出來的,在美國創造了190萬個就業崗位。每一個大數據相關的角色都將雇傭出三個非IT專業的人員。所以未來的四年里,美國將有600萬個就業崗位由信息經濟所產生。挑戰是什么?在這個行業里沒有足夠的人才。
4、大數據人才短缺
組織將會有缺少必要的人才去充分利用大數據。到2018年,美國可能會面臨140,000到190,000個擁有深度分析技能的人才短缺,以及150萬名管理者和知道如何用大數據做有效決策的分析師。
5、重新思考工作角色和頭銜
81%的IT領導人和77%的IT專業人士認為,很明顯他們缺少具有計劃、執行和利用組織的數據資產潛能的技能員工。大數據項目可能意味著反思工作角色和頭銜,以及使用最好的大數據的非技術技能。
6、有區分的系統
66%的IT領導者和53%的IT專業人士聲稱他們的數據儲存在不同的系統中——這些組織必須建立新的平臺,去適應這些增加的數據管理需求。
7、從大數據中獲取商業價值
從大數據中獲取最大商業價值的挑戰與從技術中獲取文化的挑戰一樣多。當公司被要求給出16個挑戰清單,公司把對組織的挑戰放在了最頂部:獲得業務部門共享信息的跨組織筒倉。其實是一個技術問題:處理被叫做three V’s的大數據:數據量,速度和品種。第三個挑戰是決定哪一種數據可以用來做商業決策。
8、數據質量
超過一般的IT領導(57%)和專業人士(52%)報告,他們并不總是知道誰擁有這些數據。如果一個人不知道誰擁有這些數據,就沒有人對它的質量負責。由于不同的數據源和不同的數據融合在一個大數據項目里,確保數據的準確性和質量對成功至關重要。
9、創建一個更強大的業務
CompTIA發現10個高管里有8個都對他們組織中涉及到的數字技術和戰略決定負有責任,并且同意利用好企業所有的數據會導致更強的業務。調查發現,93%的調查參與者說,數據對他們的業務是非常重要的;同樣比例的人認為在2014年會非常重要。對數據源的投資最有力的論據之一來自于以下數據點:10位高管中有8位同意或強烈同意并聲明,”如果我們可以利用我們所有的數據,我們將會有一個更強大的業務。”
10、更好地管理數據
不到1/5的企業報告正是他們所需要管理和使用的數據的地方。當然,這是一個很高的障礙,但是即使當包括那些”非常接近”他們的目標,他們依然留下了一個大多數企業在數據方面做的重要工作。
11、3大數據業務驅動
前三大數據業務驅動因素包括:
加快操作或分析工作負載的時間(39%)
在商業解決方案(34%)中使用數據的靈活性提高競爭優勢
對高水平的高級分析的業務需求(31%)
12、大數據實踐
大數據實踐在生產中從2012年的27%上升到2013年的34.3%。此外,68%的公司正在運行兩個或更多的大數據項目作為他們大數據的一部分。對于公司的分析策略,頂部的業務驅動程序需要把銷售信息和運營分析結合在一起(57%)。
13、大數據工具
80%的受訪者說,他們已經使用或計劃使用專用的大數據工具或框架,以處理在他們的生產環境中制造出來的大量的數據。56%的受訪者表示,他們準備將現有的應用程序從RDBMS轉移到NoSQL數據存儲。
14、大數據支出
在大數據上支出上有一個極端現象,少數公司花費了大量的支出而大量的公司只花費了很少的支出。15%被調查的大數據公司在2012年花費了至少1億美元,7%被調查的公司花費了至少5億美元。相反,近1/4(24%)的花費低于250美元。
15、大數據支出最多的行業
行業支出最多的是,電信、旅游相關、高科技、銀行業;支出最少的是生命科學、零售業、能源/資源公司。