IBM在dashDB軟件上增加了大規模并行處理和R語言支持——這是數據倉庫數據庫支持分布式云計算應用的重要舉措。
IBM繼續更新dashDB關系型數據倉庫系統,努力進一步擴大IBM云數據庫服務產品線。上周在波士頓舉行的自助風格“新兵訓練營”活動中,IBM展示了dashDB及其最新的技術改進——支持跨越集群系統的大規模并行處理(MPP)。
dashDB于去年秋季發布,它基于IBM旗艦產品DB2關系型數據庫的BLU Acceleration內存計算技術,但同時也將IBM的Netezza柱狀風格處理運用到云實施中。,該軟件旨在與Amazon Redshift直接競爭,而后者是Amazon Web Services (AWS)在2012年底推向市場的云數據倉庫服務。
與其他關系型數據庫供應商類似,IBM也一直面臨如何應對新型云產品的壓力——特別來自云計算巨頭AWS的產品。上個月,IBM發布了一個旨在加快查詢處理速度和提高可伸縮性的MPP版dashDB。支持越來越流行的R分析編程語言也是IBM對dashDB的另一個最新改進。
在上周的活動中,一名來自大數據主戰場、數字廣告與營銷行業的dashDB用戶發言表示,R語言與云數據庫的集成水平是一個很好的特性。
RSG Media是紐約一家專門為電視網絡、出版商及其其他媒體開發軟件的公司,它的解決方案架構師Shiv Sehgal說:“在我們看來,dashDB是一個柱狀數據庫,具有DB2特性,并支持R語言。”在訪談中,Sehgal指出,讓精通R語言的內部用戶和客戶能夠輕松使用這種語言,這是讓業務用戶在不需要IT幫助下就能夠提出并解決分析問題的重要一步。
大數據、大魔法
dashDB的推出一直是循序漸進,但是IBM可能在管理云數據方面寄予該技術厚望。現在,有了MPP支持,dashDB可能成為DB2和Netezza數據倉庫設備的用戶通向云的道路。
IBM的dashDB產品經理John J. Park說:“MPP確實是我們的大魔法——有了它,你就可以根據數據倉庫的需要增加節點。從策略而言,這是給我們的Netezza客戶和DB2客戶提供的云產品。”
Park指出,對某些用戶來說,可能會存在這樣一個潛在問題,即dashDB與Netezza的SQL編程語言實現的兼容性仍然在改進中。他估計dashDB目前優化的Netezza SQL功能比例為84%,IBM將在今年末將這個兼容性比例增加到90%以上。
在dashDB不斷改進的同時,IBM上個月收購了位于加州的Compose。該公司前身是MongoHQ,專注于數據庫即服務軟件,自動化云中數據庫的創建、管理和擴展。它已經支持大量的數據庫,首先是MongoDB,后來繼續增加了Elasticsearch、PostgreSQL、Redis等。
IBM收購Compose的目的之一是使開發者能夠在云中快速創建數據庫實例。Compose的技術與dashDB將通過IBM云平臺即服務(PaaS)產品交付給開發者。而且,它們只是IBM不斷擴大的云數據庫服務產品線的一部分。IBM的云數據管理活動證明在去年初收購Cloudant公司之后成為最賺錢的業務,而后者是一家基于Apache CouchDB項目的軟件開發商。Cloudant的NoSQL數據庫專門解決關系型數據庫在云環境中的可伸縮性和部署問題。
用戶很多、數據很多
根據Sehgal的介紹,除了使用dashDB,RSG Media還使用Cloudant軟件作為存儲分析數據的數據池。他說:“它最重要的特性是可伸縮性。它可以應付大規模的用戶。”
Sehgal及其支持的用戶有許多不同類型的數據要處理。RSG的各種系統都會抓取Web日志和社交媒體數據,以及評分、訪問信息及來自于信息服務和廣告平臺提供商(如Nielsen, Rentrak和Operative Media)的廣告數據。
這些數據的其中一個應用是使有線電視網絡能夠預測節點決策的收益——例如,點播Billy Madison或Breaking Bad 的回報。這種節目決策以前一直由直觀猜測得出,但是Sehgal指出,現在情況已經改變,因為決策者知道可以合適分析工具來測量投放一個節目的成本和通過有線電視費用或廣告收益可能獲得的回報。
Sehgal指出,混合使用NoSQL數據庫和SQL數據倉庫的IBM云服務產品將所有東西整合在一起。他說:“在我們的一些應用中,我們會使用線性廣告銷售數據、社交媒體數據及其各種來源的數據。而最終要將它們關聯到一個特定節點的播放上,我們確實需要一種SQL方法,我們現在可以用一個產品來處理所有數據。”
根據預測公司Research and Markets在一月份發布的報告,全球基于云的數據管理服務市場預計年增長率將達到30.5%——從2014年35.1億美元增長到2019年的132.8億美元。
目前,大多數對大數據云的熱捧都聚焦在非關系型模型的創業公司。但是,像IBM及其他成熟的數據庫廠商,也并非坐以待斃。Oracle投入了大量的資源去開發自己的云數據庫服務平臺,其中包括云版本的NoSQL數據庫軟件;此外,最新版的Oracle Database 12c支持文檔存儲和基于SQL的JSON查詢,這是一種廣泛應用于移動、Web和云應用的格式。同時,在開發與Amazon Redshift競爭的柱狀產品時,微軟還開始推廣DocumentDB,這是在其Azure云上運行的支持JSON的NoSQL軟件。