近日,據美聯社官網報道,MapD Technologies將MapD Core數據庫發布到了開源社區。MapD是使用圖形處理單元(GPU)以毫秒為單位分析數十億行數據的先驅,比傳統的基于CPU的數據庫快幾個數量級。MapD Core數據庫及其可視化庫開源讓每個人都可以使用這個世界上最快的分析平臺。
Todd是MapD Technologies創始人兼首席執行官,據其博客介紹,他們在5年前開始MapD項目時就一直希望將其開源,當時沒有那么做,是因為他們希望等代碼庫成熟?,F在,他們注意到,整個GPU ML和深度學習技術棧都是開源的,但卻沒有一個開源的數據處理引擎。開源MapD Core數據庫就是為了填補這項空白。開源讓他們可以和生態系統的其他部分整合。同時,他們還宣布,和Continuum Analytics及H2O.ai成立了GPU Open Analytics Initiative(GOAI),并公布了第一個項目GPU Data Frame(GDF)。該項目可以實現數據在GPU進程之間的高效交換,而且避免了復制數據的開銷。
此次開源包含如下內容:
MapD Core開源數據庫——MapD Core數據庫源代碼遵循Apache 2許可協議,提供了SQL查詢多GPU加速所需要的一切; MapD可視化庫——MapD提供了開源的JavaScript庫,讓用戶可以構建基于MapD Core數據庫的定制化Web可視化應用。該庫包含生成圖表、交叉篩選數據及管理MapD Core數據庫連接的功能。其中,圖表和交叉篩選庫基于流行的Dimensional Charting項目(DC.js )。同時,他們還公布了MapD分析平臺企業版,其中包括MapD Core數據庫、MapD Core GPU渲染引擎及MapD Immerse可視化分析客戶端。它還提供了開源版本不具備的分布式擴展、高可用(HA)、LDAP及ODBC特性。他們的路線圖上還有其他后續會增加到企業版的特性,尤其是在安全方面。
此外,MapD還發布了一個社區版本,供非商業開發和學術使用。MapD社區版遵循非商業性的學術許可,包含MapD Core數據庫、GPU渲染引擎及MapD Immerse可視化分析客戶端。
這一消息引起了廣泛的反響。New Enterprise Associates投資合伙人Greg Papadopoulos表示:
一個開源的GPU數據庫將會讓全新的應用程序成為可能,尤其是在機器學習方面,GPU在這方面的影響是如此之大。和MapD合作,我們非常自豪,因為它邁出了關鍵的一步。
加州大學教授John Owens則表示:
我的研究小組主要是針對并行計算設備,尤其是GPU,開發更快的算法。一段時間以來,MapD正在做的工作給我們留下了深刻的印象,只是希望我們可以在研究中把它作為真實世界的測試平臺?,F在,他們開源了自己的數據庫產品,我們的團隊很高興將其作為研究平臺,并向其代碼庫做貢獻。
DGX Systems NVIDIA總經理Jim McHugh認為,MapD開源Core數據庫的決定意義重大,它進一步激勵了本來就已經很活躍的GPU分析社區。
要了解更多信息,請點擊這里。感興趣的讀者也可以加入官方論壇。