從IBM方面了解,承諾大力推進Apache Spark項目,該項目為以數(shù)據(jù)為主導的,未來十年最為重要的新的開源項目。這一承諾的核心是將Spark嵌入IBM業(yè)內(nèi)領先的分析和商務平臺,并將Spark作為一項服務在IBM Bluemix平臺上提供給客戶。
IBM還將投入超過3500名研究和開發(fā)人員在全球十余個實驗室開展與Spark相關的項目,并將為Spark開源生態(tài)系統(tǒng)無償提供突破性的機器學習技術--IBM SystemML,同時,IBM還將培養(yǎng)超過100萬名Spark數(shù)據(jù)科學家和數(shù)據(jù)工程師。
據(jù)了解,Spark無疑為大規(guī)模數(shù)據(jù)處理帶來了革命性的突破。首先,它極大的提升了數(shù)據(jù)依賴型應用程序的性能;其次,它從根本上簡化了由數(shù)據(jù)驅動的智能應用程序的開發(fā)流程。
為了加速Spark生態(tài)系統(tǒng)的開源創(chuàng)新進程,IBM將采取Spark構建在自有的分析與商務平臺的核心中,同時Spark作為沃森健康云洞察平臺的核心基礎之一,以便醫(yī)療服務人員和研究人員在圍繞新的人口健康數(shù)據(jù)進行分析時,更快地將數(shù)據(jù)轉化為價值。
Bluemix平臺上服務目錄
另外,對IBM突破性的IBM SystemML機器學習技術開源,并與Databricks協(xié)作提高Spark的機器學習能力。作為一項服務在Bluemix平臺上提供給客戶,任何開發(fā)人員都可以快速加載數(shù)據(jù)、建模,并導出預測性工具用于他們的應用程序。
IBM將通過與AMPLab、DataCamp、MetiStream、Galvanize 和MOOC,等多種合作方式,培養(yǎng)至少100萬名Spark數(shù)據(jù)科學家和數(shù)據(jù)工程師。
Spark已受到開發(fā)者與數(shù)據(jù)科學家們的熱烈追捧。作為一個可以幫助企業(yè)便捷整合大數(shù)據(jù)至應用程序中的重要平臺,Spark勢頭強勁,充分為IBM的客戶提供業(yè)務轉型的決策。
IBM是UC Berkeley AMPLab的4家創(chuàng)始成員之一,Spark正是于2009年初創(chuàng)于此,經(jīng)過夜以繼日的研究實驗、提供建議、結合務實的洞察,并與研究人員就共同感興趣的話題密切互動,Spark應運而生。UC Berkeley AMPLab的總監(jiān)Michael Franklin教授表示,“作為AMPLab的贊助者,IBM致力于發(fā)展Spark社區(qū),并為Berkeley Data Analytics Stack的持續(xù)發(fā)展與改進提供指導,對于該開源平臺,Spark是不可或缺的關鍵組成部分。”
Spark具有敏捷快速,便于應用的特征。良好的開源屬性使其可以在全球范圍內(nèi)持續(xù)改進。在接下來的幾個月里,IBM的科學家和工程師將與Apache Spark開放社區(qū)合作,迅速推動先進機器學習技術的普及,并加快智能業(yè)務應用開發(fā)的創(chuàng)新速度。
通過無償提供SystemML,IBM將幫助數(shù)據(jù)科學家提高迭代速度以應對不斷變化的業(yè)務需求,并為不斷發(fā)展壯大的應用程序開發(fā)人員生態(tài)系統(tǒng)提供支持,使智能技術在所有領域得到深度應用。