近幾年,大數據已經從大公司獨有的流行詞和概念變成了驅動我們數字生活發展的動力。下面是未來大數據的處理和發展的五個趨勢。
1.數據科學越來越大眾化
隨著像Coursera、Udacity和Edx等這些和數據分析相關的網絡教育平臺的流行,越來越多的人不用花一分錢便可以學到所有的知識,從基礎的統計學知識到自然語言處理和機器學習。除了這個,Oxdata化簡和集成了R語言后推出的分析產品,Quid正在做的具有機器學習和人工智能概念的工具也設計了傻瓜式的使用界面和形象具體的用戶展示方法。更有像Kaggle這樣的公司推出了關于預測模型的眾包平臺。所以大數據的處理的趨勢之一便是像Datahero,Infogram和Statwing他們一樣,把數據分析變得易用,大眾。
2.Hadoop對MapReduce的依賴越來越小
Hadoop平臺只為MapReduce服務的時代從Hadoop的2.0版本開始正式結束了。新版本支持的產品和服務將會和Cloudera的Impala一樣用一個SQL 查詢引擎,或者其他的方法來替代MapReduce。HBase NoSQL數據庫就是Hadoop離開MapReduce約束后的一個很好的例子。 大型的網絡公司,像Facebook、eBay等都已經用HBase去處理事務型的應用了。
3.大數據越來越多的被用到了我們身邊的應用中
首先是大數據應用對我們的開發者的要求變低了,有時候開發大數據應用就像在你的應用的代碼中加入幾行,或者像是寫一段兒腳本一樣。其次,大數據的應用范圍也得到了拓展,用戶習慣分析,網絡安全,人工智能,售后服務等等都可以通過將大數據處理做成產品或者應用而實現。現在的大數據技術已經被帶入了許多網絡和手機的應用中,從購物推薦到找到和自己有關聯的人等等。
4.機器學習無處不在
很容易就可以看到機器學習越來越流行,從我們身邊的小應用Prismatic、Summly、Trifacta、CloudFlare、Twitter、Google、Facebook、Bidgely、Healthrageous、Predilytics、BloomReach、DataPop、Gravity……如今很難想象一個沒有機器學習技術的科技公司可以生存。Heck,甚至是微軟都在機器學習上下了很大賭注它將成為一個重要的收入來源。
5.手機將成為人工智能的數據來源
我們的手機和手機中的應用目前可能是最大的私人信息來源。通過機器學習,語音識別和其他一些技術,這些應用可以知道我們去哪兒,我們的朋友都是誰,我們的日歷上都有哪些提醒,我們上網都瀏覽什么。通過新一代的私人助理應用(Siri,Saga和Google Now等)我們的手機更能夠理解我們的言論,知道我們經常出入的地方,我們平時吃什么,我們在家、工作和郊游的時間等等。