Apache MADlib是用于擴展數據庫分析的開源大數據機器學習庫,近日該項目已經從Apache孵化器中“畢業”成功晉升為頂級項目。該項目在Apache Software Foundation的流程和原則下得到了很好的管理,并且此次晉升為頂級項目對Apache MADlib來說也是一個里程碑。
Apache MADlib副總裁Aaron Feng表示:“在孵化過程中,MADlib社區嚴格遵照Apache Way的規定,以開放和包容的方式來開發高質量的數據庫分析軟件。
Apache MADlib是一個用于可擴展數據庫分析的綜合庫,為用戶提供了結構化和非結構化數據的機器學習,圖形,數學和統計方法的并行實現。據Apache稱,數據庫引擎開發人員,數據科學家,IT架構師以及學者們都對復雜和可擴展的數據庫分析的開源項目非常感興趣。
聯合創始人加州大學伯克利分校計算機科學教授、Trifacta的首席戰略官,同時也是MADlib原創作者之一的Joe Hellerstein表示:“MADlib從一開始就是軟件開發人員,計算研究人員和數據科學家的構想。我很高興看到作為ASF孵化項目的MADlib社區和代碼庫能夠發展得這么好,同時我也期待著它作為頂級項目能夠再續輝煌。”
目前MADlib已經部署在許多學術和行業項目上。Pivotal的數據研發副總裁Elisabeth Hendrickson表示,“Pivotal已經看到其客戶在大型數據科學項目中成功部署了MADlib。由于MADlib是畢業于ASF的頂級項目,我們認為隨著代碼庫的成熟和社區活躍人群的增加,其在企業中會得到更廣泛的應用。”