全球領先的商業分析軟件與服務供應商SAS公司正在開發一種基于SAS內存分析技術,并適用于開源框架Hadoop的交互式分析編程環境。新軟件通過更快地挖掘大數據獲取更精確商業洞察,幫助企業提升盈利、降低風險、增進對客戶的了解以及創造更多商業成功的機會。
SASIn-MemoryStatisticsforHadoop能夠讓多用戶同時并交互地管理、挖掘和分析數據,建立和比對模型,以及對Hadoop框架內的海量數據進行評分。Hadoop開源框架被廣泛認為是大數據未來發展方向。SAS軟件將在2014年上半年內幫助數據科學家大幅提高工作效率。
“SASIn-MemoryStatisticsforHadoop可單次載入Hadoop數據并將其保存到內存中供多用戶進行一個會話內的多類型分析,相比之下,其他需要將數據寫入磁盤的方式面臨的問題是:所有的數據傳輸對于大數據處理而言都是極其低效的。”SAS分析服務器研發部門高級總監OliverSchabenberger表示,“我們正致力于幫助數據科學家、建模師和統計員減少使用多種分析編程語言,擺脫各種工具混合使用的繁瑣。SASIn-MemoryStatisticsforHadoop支持所有類型的數據分析,為協同分析開辟一條快速、強勁和綜合的途徑。”
SASIn-MemoryStatisticsforHadoop支持的統計和機器學習建模技術包括:聚類、回歸、廣義線性模型、方差分析、決策樹、隨機決策森林、文本分析和推薦系統。SAS可視化分析(SASVisualAnalytics)采用的內存分析技術也被應用到SASIn-MemoryStatisticsforHadoop中。SAS內存架構為數據分析提供前所未有的速度—這對于在海量數據中挖掘價值來說必不可少。
為什么選擇Hadoop?
市場研究機構IDC預測到2016年,Hadoop將實現8.128億美元的銷售額—復合年增長率達到60.2%。SAS期望客戶能夠借助Hadoop繼續將大數據轉化為卓越洞察。
“Hadoop對累積了海量數據資產的企業來說意義非凡。SAS致力于幫助這些部署大數據架構的企業,運用行業最頂尖的分析技術實現大價值,”SAS首席數據科學家WayneThompson表示,“在大數據理念大熱之前,SAS便開始著力于服務大數據用戶。隨著技術的發展,我們也不斷滿足變化的客戶需求,實現客戶所想。”
他還提到SAS與Hadoop生態系統中知名公司Cloudera和Hortonworks進行了戰略合作,使客戶在受歡迎的Hadoop分布中有機會使用行業領先的分析技術。
Hadoop可以在商業服務器集群上分布數據和執行并行處理,還能偵測和處理對于分布式處理至關重要的故障。Hadoop除了具備低成本分布式硬件和數據冗余安全模式之外,還擁有以下一系列顯著優勢:
并行處理—Hadoop分布式計算模型擁有海量數據處理能力。
可擴展性—可通過添加節點輕松擴展Hadoop系統。
存儲靈活性—與傳統的關系型數據庫不同,數據無需為存儲進行預處理。Hadoop能夠輕松存儲非結構化數據。
SAS公司大中華區總裁吳輔世先生表示:“大數據的興起促成了底層開源Hadoop技術的繁榮。我們也看到了Hadoop蘊含的潛在商機,它成本更為低廉、部署更為簡單、能夠存儲文本等非結構化數據,可滿足企業所需。目前,Hadoop在國內的應用愈加廣泛,尤其是在電信業和金融業。SAS希望能夠在Hadoop中引入強大分析技術,幫助企業從Hadoop部署中獲取價值。”