企業網D1Net摘錄信息要點:
1.軟件供應商Revolution Analytics改進了其R語言統計功能旗艦產品,使它能夠與Hadoop數據處理平臺運行。
2.R越來越多地用于復雜的數據分析,即那些超出標準商業智能程序包范圍的數據分析。Revolution Analytics公司預計全世界有超過200萬人在使用R。
3.Revolution Analytics希望將R加入到Hadoop和Teradata數據庫可以拓寬該語言的使用范圍。
隨著大家對大數據分析越來越感興趣,軟件供應商Revolution Analytics改進了其R語言統計功能旗艦產品,使它能夠與Hadoop數據處理平臺運行。
這個新的Revolution R Enterprise 7(RRE 7)還能夠使R在Teradata數據庫內運行。
R語言提供了一種方法來對一組數據運行常用統計測試(例如線性和非線性建模、時間序列分析、分類和聚類),通常結果是以圖形的形式出現。
R越來越多地用于復雜的數據分析,即那些超出標準商業智能程序包范圍的數據分析。Revolution Analytics公司預計全世界有超過200萬人在使用R。
RRE7包含R算法庫——可以跨多個節點并行運行,這與Hadoop管理大數據集的方式相同。RRE7可以被添加到Cloudera CDH3和CDH4 Hadoop發行版,以及Hortonworks數據平臺1.3。
這個新的R庫保護最常用的統計和預測分析算法,用于數據處理、數據采樣、描述性統計、統計測試、數據可視化、仿真、機器學習和預測模型等任務。
通過分析節點內的數據,而不是移動數據到其他位置進行分析,基于R的數據分析可以更快地進行。它還允許對一整組數據進行分析,而不是數據的子集或者摘要--企業數據倉庫(EDW)通常是采用這樣的方式。
Revolution Analytics希望將R加入到Hadoop和Teradata數據庫可以拓寬該語言的使用范圍。該公司還設計了一個新的工作流程界面,其中不需要知道如何部署特定的R算法。這緩解了使用Java或者其他語言編程R的麻煩,讓其在Hadoop平臺運行。
除了支持這些新的平臺,RRE7還采用了一些新的算法和流程。其一是建立Decision Forests的模型集,Decision Forests是用于預測未來結果的機器學習技術。新的Stepwise Regression功能還可以幫助我們自動化選擇用于預測模型中最重要的變量。新的Decision Tree可視化可以提供圖形化的方式來描述數據集內復雜的關系和相關性。