亞馬遜AWS最近將其低成本的大數(shù)據(jù)分析服務Redshift提供給數(shù)量有限的一些用戶。您可以將 Redshift想象為一個基于公共云的大型關系型數(shù)據(jù)庫,為支持數(shù)據(jù)倉庫而設計。您也可以期望看到這樣的云服務將沖擊到數(shù)據(jù)倉儲供應商巨頭們 - 譬如甲骨文、IBM、Teradata以及EMC等。
使用AWS管理控制臺或亞馬遜的Redshift API,企業(yè)可以提供一個單一2TB的數(shù)據(jù)庫,或者,他們可以選擇16個 2TB的超大容量存儲(XL)節(jié)點或16TB的8個超大容量存儲(8XL)節(jié)點的集群。除了2TB或 16TB的存儲空間,他們也有15GB或120GB的RAM。定價是合理的,XL節(jié)點每小時85美分,8XL節(jié)點為每小時6.80美元。
亞馬遜稱,Redshift可直接集成到亞馬遜的其它服務,如S3和DynamoDB,非常適合運行各種相關的數(shù)據(jù)密集型應用程序及應對不斷增長的大數(shù)據(jù)趨勢。
與任何其他技術一樣,你必須要考慮Redshift好的方面和壞的方面。這里是一些明顯的好處:
·能夠提供龐大的數(shù)據(jù)庫,而不必通過昂貴和緩慢的采購過程獲得的硬件和軟件。亞馬遜相關負責人表示,“依賴柱狀數(shù)據(jù)存儲和先進的壓縮技術,Redshift相比傳統(tǒng)的數(shù)據(jù)倉庫具有極高性價比優(yōu)勢。”
·可擴展的處理龐大的資料庫的能力,也許遠遠超出了PB級的范圍;
·使用彈性資源的潛力,經(jīng)營業(yè)務時,有足夠的速度返回實際相關的結果集;
·相對于長期使用自己的硬件和軟件的成本,可能節(jié)省大量的金錢。
而缺點則主要如下:
·停電的可能性,并不是說您的內部數(shù)據(jù)倉庫永遠不會宕機,但任何故障將會成為公眾事件,并且給內部使用云計算帶來失望;
·數(shù)據(jù)遷移和整合的成本,盡管亞馬遜聲明說“Redshift以十分之一的成本帶來相當于目前主流本地數(shù)據(jù)倉儲方案的十倍性能”,但在許多情況下,你仍將需要大量的帶寬來從內部系統(tǒng)傳輸數(shù)據(jù)到云托管的Redshift ,否則你會被USB驅動器通過聯(lián)邦快遞運送到亞馬遜AWS服務所困擾;
·缺乏最佳實踐,在公共云托管的數(shù)據(jù)倉庫,我們才剛剛起步,顯然還有很多的東西需要學習;
·成本上升的可能性,雖然很多企業(yè)會發(fā)現(xiàn)云托管的數(shù)據(jù)庫節(jié)約成本,如Redshift ,但很多人會發(fā)現(xiàn),他們需要為云計算服務支付的費用比預期的要高得多 - 可能超過了內部部署數(shù)據(jù)庫的成本。
據(jù)悉,亞馬遜Redshift服務首先在美國東部地區(qū)提供,未來幾個月將向其它地區(qū)提供服務。預計Redshift 將會獲得成功,因為很多人會喜歡它。
最新的消息顯示,Redshift目前已經(jīng)獲得數(shù)據(jù)集成和數(shù)據(jù)治理專家Informatica的支持,后者日前宣布了“用于Amazon Redshift的Informatica云連接器”,可以快速并可靠地將數(shù)據(jù)移入Amazon Redshift,無論是從企業(yè)內部部署的系統(tǒng),還是其他云應用。
不過,在我們開始遷移之前,有必要打開我們的視野,做一次深呼吸,進行周密的規(guī)劃。