市場研究公司IDC預測,2015年大數據市場規模將從2010年的32億美元增長到170億美元,復合年增長率為40%。大數據是一個龐大的新的領域,其中的數據集可以增長的非常龐大,以至于使用傳統的數據庫管理工具也很難處理。處理這種問題所需要的新工具、框架、硬件、軟件和服務是一個巨大的市場機會。隨著企業用戶越來越多地需要連續不斷地訪問數據,好的大數據工具集將以最低的成本和接近實時的速度提供可伸縮的、高性能的分析。通過分析這種數據,企業可得到更大的智能以及競爭優勢。下面是Hadoop和大數據專業廠商MapR共同創始人和首席執行官約翰?施羅德(John Schroeder)對2014大數據市場的預測。
1. SQL擁有大數據的最大潛力
用于 Hadoop(分布式計算)的SQL的發展能夠讓商業分析師利用自己的技能和選擇的SQL工具執行大數據項目。開發人員可以選擇Hive、Drill和 Impala等Apache項目,以及選擇Hadapt、HAWQ和Splice Machine等公司的專有技術。
2. 盡管如此 SQL還面臨挑戰
SQL需要數據結構。而集中的結構化數據可引起延遲并且需要人工管理。SQL還限制分析類型。過分強調SQL將延遲機構全面利用其數據價值的努力和延遲反應。
3. 身份識別是主要的數據安全問題
隨著Hadoop(分布式計算)中提供的接入控制能力的猛烈攻擊,機構迅速認識到線路級身份識別是必要的基礎。沒有充分的身份識別,任何更高級的控制都很容易被繞過,妨礙預定的安全計劃。
4. 數據錯誤變成學習機會
2014年機構將出現許多數據錯誤。數據錯誤將表明基礎的來源系統的問題嗎?數據錯誤是在下游分析中出現偏差導致的數據提取問題嗎?數據錯誤將表明定義差異或者缺少跨部門和業務部門的一致性嗎?2014年將看到解決數據異常問題。
5. 出現可運行的Hadoop
2014年將看到Hadoop在各個行業中的生產部署顯著增加。這將顯示出Hadoop在運營中的實力。在那里,生產應用與分析結合在一起能夠提供可以衡量的商業優勢,如在客戶化零售建議、詐騙檢測和試驗傳感器數據進行規范的維護等應用中提供這些優勢。
6. 更多的數據倉庫將部署企業數據中心
數據中心把數據提取處理和數據從企業數據倉庫卸載到Hadoop。作為一個核心的中心企業中心,數據中心要便宜10倍,能夠對額外的處理或者新的應用進行更多的分析。
7. 新的以數據為中心的應用將成為強制性的
利用大數據的能力將在2014年成為競爭的武器。更多的公司將使用大數據和Hadoop準確地針對個人消費者的偏愛追逐賺錢的追加銷售和交叉銷售的機會,更好地緩解風險以及減少生產和開銷成本。
8. 數據成為數據中心的核心
機構將從開發者過渡到大數據計劃中。IT部門將越來越多地擔負定義支持多種應用的數據基礎設施的任務,把重點集中在部署、處理和保護一個機構的核心資產所需要的基礎設施方面。
9. 搜索將成為非結構化的查詢語言
2013年有大量的用于Hadoop的SQL計劃。2014年將是這種非結構化查詢語言成為重點的一年。把搜索集成到Hadoop將為查找重要信息的企業用戶提供一種簡單和直觀的方法。搜索引擎還是包括推薦引擎在內的許多發現和分析應用的核心。
10. Hadoop將獲得地位
Hadoop將繼續取代其它IT開支,顛覆企業數據倉庫和企業存儲。例如,甲骨文的主要營收目標在過去的10個季度里有5個季度沒有實現。Teradata在過去的5個季度有4個季度沒有實現營收和利潤目標。
11. Hadoop仍需要幫助才能成為主流應用
更多的機構認識到Apache Hadoop本身還沒有準備好在企業應用。Apache Hadoop不是為系統管理或者災難恢復等統一企業IT流程設計的。企業將繼續推進混合的解決方案,把架構技術創新與Apache Hadoop的開源軟件結合在一起。