由EMC和VMware共同出資創(chuàng)辦的Pivotal公司已經(jīng)做好了發(fā)布其BI(商業(yè)智能) PaaS(平臺即服務(wù))的準備。與此同時,這家新公司正在致力于創(chuàng)建自己的數(shù)據(jù)挖掘與分析軟件產(chǎn)品組合。目前,Pivotal已經(jīng)公布了兩個可以幫助進行數(shù)據(jù)分析的項目。其中一個是可與Hadoop數(shù)據(jù)處理平臺協(xié)作,用于實時分析的內(nèi)存數(shù)據(jù)存儲;另一個是用于商業(yè)分析的數(shù)據(jù)發(fā)現(xiàn)工具。
作為Hadoop發(fā)行版升級的一部分,Pivotal將在新的Pivotal HD 1.1產(chǎn)品中納入GemFire HD。GemFire HD是一款VMware在2010年收購的內(nèi)存交易存儲。由于將GemFire作為其Hadoop套裝軟件包中的一部分,Pivota希望企業(yè)以該軟件為基礎(chǔ),創(chuàng)建使用Hadoop作為長期存儲的OLTP(聯(lián)機事務(wù)處理)系統(tǒng)。
Pivotal 首席產(chǎn)品經(jīng)理Abhishek Kashyap稱,這一解決方案將使得企業(yè)能夠分析由GemFire所采集到的當(dāng)前數(shù)據(jù),以及被轉(zhuǎn)移至Hadoop的舊有交易數(shù)據(jù)。GemFire實例將被完全存儲在服務(wù)器的工作內(nèi)存當(dāng)中,并且能夠迅速地通過SQL查詢實時操作數(shù)據(jù),這對于態(tài)勢感知和其他類型的實時分析都非常有用。
此外,Pivotal還發(fā)布了Pivotal Data Dispatch。該工具可以幫助數(shù)據(jù)分析工作者找到和準備用于分析的數(shù)據(jù)集。Data Dispatch工具最早由紐約證券交易所開發(fā)。數(shù)據(jù)分析師從2007年開始使用該軟件,以便更好地理解相關(guān)的法規(guī)要求所產(chǎn)生的影響。該軟件允許分析師挑選、過濾和綜合他們需要進行分析的來自不同來源的數(shù)據(jù)集。
Pivotal產(chǎn)品營銷副總裁Todd Paoletti表示,由分析師生成的數(shù)據(jù)集將被存儲在甲骨文、IBM和SAP等公司的BI工具可以使用的“沙盒”中。以往在使用傳統(tǒng)BI工具時,數(shù)據(jù)分析師通常必須要請求IT員工將數(shù)據(jù)集綜合起來,并將它們部署到數(shù)據(jù)倉庫中。Paoletti稱,Pivotal Data Dispatch消除了數(shù)據(jù)分析師在生成每一個新數(shù)據(jù)集時需與IT部門協(xié)商的必要。
作為一款自助式BI工具,Pivotal Data Dispatch能夠提供易于使用的圖形數(shù)據(jù)庫,方便數(shù)據(jù)分析師的使用。數(shù)據(jù)分析師還可以獲得由系統(tǒng)管理員首先定義和標記的數(shù)據(jù)來源。源數(shù)據(jù)文件可以是數(shù)據(jù)庫文件、直接文件、Hadoop文件、微軟項目文件或是其他常用的格式。生成的綜合性數(shù)據(jù)集可以被存儲在Hadoop或是Pivotal的Greenplum之中。