如果多個(gè)來(lái)源的大數(shù)據(jù)無(wú)法容易地收集,存儲(chǔ),分析并獲得重要的洞察力,幫助企業(yè)提供更好的業(yè)務(wù)決策,那么這些數(shù)據(jù)對(duì)于企業(yè)來(lái)說(shuō)可能就沒(méi)有太多價(jià)值。數(shù)據(jù)可能來(lái)自許多不同的來(lái)源,可能處于靜止或者運(yùn)動(dòng)狀態(tài),可能是本地、云端或者是網(wǎng)絡(luò)邊緣創(chuàng)建的,并由不同的數(shù)據(jù)治理策略進(jìn)行管理。
過(guò)去幾年來(lái),MapR Technologies一直在從商業(yè)Hadoop經(jīng)銷(xiāo)商向數(shù)據(jù)平臺(tái)公司轉(zhuǎn)變,其提供了一種數(shù)據(jù)結(jié)構(gòu)模型,使用戶能夠從多個(gè)來(lái)源(如表格,數(shù)據(jù)流和文件)獲取大量數(shù)據(jù),然后將其作為單個(gè)數(shù)據(jù)池提供給客戶。隨著Converged Data Platform 6.0的發(fā)布,MapR可以幫助用戶更加輕松地管理靜止和動(dòng)態(tài)數(shù)據(jù),并確保平臺(tái)本身的健康和保障。
這個(gè)更新服務(wù)來(lái)源于MapR的DataOps團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)是的變體,其中不僅包括開(kāi)發(fā)人員,還包括數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師。通過(guò)整合運(yùn)營(yíng)和分析,企業(yè)可以更快地從所有數(shù)據(jù)中獲得收益。而要做到這一點(diǎn),企業(yè)既需要擁有數(shù)據(jù),又需要技能來(lái)管理數(shù)據(jù),其中最關(guān)鍵的是確保將所有數(shù)據(jù)匯總在一起并迅速提供。
MapR行業(yè)解決方案的高級(jí)技術(shù)專(zhuān)家Mitesh Shah表示:企業(yè)都在嘗試將數(shù)據(jù)轉(zhuǎn)化為價(jià)值,并且希望能夠比競(jìng)爭(zhēng)對(duì)手更快、更多的將數(shù)據(jù)轉(zhuǎn)化為價(jià)值。數(shù)據(jù)科學(xué)家就應(yīng)該是第一時(shí)間能夠使用數(shù)據(jù),而不應(yīng)該還要等待數(shù)據(jù)拼接。
"天下武功,唯快不破!"速度對(duì)于企業(yè)來(lái)說(shuō)是非常重要的,以前數(shù)據(jù)科學(xué)家可能需要花費(fèi)數(shù)周才能找到所需的數(shù)據(jù),清理并分析數(shù)據(jù)。Shah表示這個(gè)過(guò)程需要加快,而Converged Data Platform 6.0正是加快了這個(gè)過(guò)程。今年9月份,MapR平臺(tái)的最新版本中推出了MapR-DB數(shù)據(jù)庫(kù)功能,包括增強(qiáng)支持二級(jí)索引和應(yīng)用程序的自動(dòng)化,集成機(jī)器學(xué)習(xí)和實(shí)時(shí)處理。除此之外,還包括開(kāi)放的JSON應(yīng)用程序接口(OJAI)2.0 API。通過(guò)MapR-DB,用戶可以快速獲取數(shù)據(jù)到平臺(tái)進(jìn)行存儲(chǔ),處理和分析。Shah表示對(duì)數(shù)據(jù)所做的更改會(huì)傳播到整個(gè)MapR系統(tǒng)。
通過(guò)最近宣布的Data Science Refinery技術(shù),MapR通過(guò)與MapR-DB,MapR-XD云規(guī)模數(shù)據(jù)存儲(chǔ)和MapR-ES等產(chǎn)品的連接,提供對(duì)同一集群內(nèi)和MapR平臺(tái)內(nèi)所有數(shù)據(jù)的自助訪問(wèn)事件流;支持Apache Spark,Apache Hive,Apache Pig和Python,并且支持通過(guò)進(jìn)行部署。MapR新的變更數(shù)據(jù)捕獲功能與MapR-DB和MapR-ES集成,幫助跟蹤數(shù)據(jù)庫(kù)或數(shù)據(jù)流的變化,然后采取措施應(yīng)對(duì)這些變化。
MapR還提供自動(dòng)平臺(tái)健康和安全功能,MapR控制系統(tǒng)(MCS)管理從列,表和流中收集的數(shù)據(jù),并通過(guò)單一視圖監(jiān)視群集的運(yùn)行狀況。其中包括用于測(cè)量各種指標(biāo)(包括吞吐量,容量,延遲和IOP)的儀表板,并將指標(biāo)推送到MapR-ES以與企業(yè)系統(tǒng)集成。最近還宣布推出了數(shù)據(jù)庫(kù)索引功能。
通過(guò) single-click security功能,Converged Data Platform 6.0可以提供更快的身份驗(yàn)證執(zhí)行和標(biāo)準(zhǔn)加密。Shah表示,這個(gè)功能完全可以確保電路板數(shù)據(jù)環(huán)境中的安全,通過(guò)"簡(jiǎn)單的切換開(kāi)關(guān)"就可以幫助客戶提高安全性。身份驗(yàn)證應(yīng)用于一系列大數(shù)據(jù)工具,包括Hadoop,Spark,Drill,Mahout和Oozie。
Shah表示:平臺(tái)上有很多可移動(dòng)部件。我們正在嘗試對(duì)每個(gè)部分都進(jìn)行安全性的保護(hù),讓這個(gè)功能更安全。
該平臺(tái)的新功能還包括針對(duì)云計(jì)算多租戶的MapR Orbit云套件增強(qiáng)功能,MapR OpenStack Manila插件以支持租戶對(duì)文件進(jìn)行自助配置,以及實(shí)時(shí)自動(dòng)將文件從邊緣移動(dòng)到云。
Converged Data Platform 6.0目前已經(jīng)上市,云提供商如AWS、Azure和Oracle云將在今年年底之前通過(guò)市場(chǎng)提供。