大數據服務對于企業云來說頗具吸引力,亞馬遜AWS,微軟Azure和谷歌公共云為此在市場中激烈競爭,但哪家公司會脫穎而出呢?
云計算的市場正在迅速發展,而大數據業務也在不斷變化。雖然這對于云計算供應商來說比較困難,這是值得嘗試的,而這對于全球領先三大云計算供應商(亞馬遜網絡服務,微軟Azure和谷歌公共云)來說也是不平等的。
在云計算和大數據具有協同效應的市場區域,谷歌公司在搜索方面經驗非常豐富有但亞馬遜網絡服務(AWS)和微軟Azure吸引一些有趣的初創公司增加價值。
而大數據服務這個充滿活力的服務無論從性能和經濟的角度來看越來越有吸引力。云計算用戶將最終從三個云計算巨頭之間的大數據競爭中獲益,不過這看起來將要持續多年。
以下仔細看一下亞馬遜AWS,微軟Azure和谷歌公共云目前提供的大數據服務:
亞馬遜網絡服務
亞馬遜網絡服務(AWS)擁有廣泛的大數據服務。例如亞馬遜彈性MapReduce,運行Hadoop和Spark而KinesisFirehose和KinesisStreams提供了大數據集到AWS。用戶可以通過Redshift存儲數據,Redshift是通過數據壓縮以幫助降低成本PB級規模的數據倉庫,開源軟件Elasticsearch是部署在AWS中的分析工具,提供如點擊率和日志監控等服務。并通過Kinesis補充分析數據流。
值得一提的是,谷歌提供的大數據產品缺乏的就是GPU實例。
與谷歌公司相比,AWS有一個更大的數據集的存儲選擇。除了大量的AWS簡單存儲服務的農場以外,還擁有低延遲的NoSQL數據庫;為Titan圖形數據庫提供存儲服務的DynamoDBTitan;PB級的NoSQL數據庫和關系數據庫ApacheHBase。
AWS還具有一個商務智能(BI)服務,QuickSight可以采用并行的方式,在內存中實現高速處理。這是亞馬遜機器學習和物聯網的AWS聯網(IoT)平臺,該平臺的設備連接到云中,并可以擴展到數十億美元的設備和萬億條消息。
雖然谷歌公司具有邊緣的搜索和分析引擎,而AWS的服務范圍更廣,并有雙圖形處理單元(GPU)的實例。
微軟Azure
對于分析,微軟Azure有數據分析湖,它采用專有的U-SQL與SQL和C++,以及基于Hadoop的服務的HDInsight。此外,還有Azure的分析數據服務DataFactory,使用全局元數據系統識別數據資產和數據工廠,其中連鎖內部部署和云數據源和管理數據管道。
數據存儲湖是Azure在Hadoop文件系統的大數據存儲服務。云服務提供商有廣泛的通用存儲產品,包括StorSimple,SQL和NoSQL數據庫和存儲塊。
Azure也有PowerBI和機器學習,并設有一個物聯網中心。云平臺還包括一個搜索引擎。微軟公司的Cortana套件和認知服務可以提供更先進的智能功能。
大數據的好處
PBS公司在2016年播出了人臉大數據的紀錄片,引發了很多社會媒體關于大數據的討論和對話。這部紀錄片中顯示大數據的好處,人們對大數據有一種普遍的興趣,并表明大數據幾乎對每一個行業采用重大影響,其中包括零售,制造和營銷等行業。
谷歌公司
谷歌公司的BigQuery資料服務使用一個類似SQL的界面,對于大多數用戶來說很直觀,甚至非技術的學習。它支持PB級的數據庫,并可以執行每秒100,000行的數據流,以替代從云存儲數據的運行。BigQuery同時支持地理復制,并且用戶可以選擇他們自己的存儲數據。
BigQuery是一個沒有一個專門的基礎設施的即收即付的服務,允許谷歌使用了大量的處理器來維持快速查詢次數。也支持park,Hadoop,Pig和Hive集成。企業也可以使用谷歌Analytics(分析)和DoubleClick。谷歌云數據流允許用戶進行云數據服務排序。
谷歌提供其他的大數據服務,其中包括非關系型數據的NoSQL數據庫CloudDatastore;可大規模擴展的NoSQL數據庫CloudBigTable;機器學習的云管理平臺CloudMachine;以及一些輔助工具,如翻譯和語音轉換器。
值得一提的是,谷歌提供的大數據缺乏的是GPU實例。數據分析編寫GPU代碼是一個高價值的技能,可以讓GPU獲得令人難以置信的性能提升。谷歌公司缺乏一個GPU實例系列是有點令人費解,尤其是在2011年添加了AWS功能,并在2015年添加Azure。
AWS、Azure、谷歌云:一場勢均力敵的大數據競爭
在許多方面,三大云計算供應商在大數據服務方面步調一致,雖然在性能和使用需要一些實際的測試來辨別之間的差異。雖然谷歌可能具有搜索的優勢,但落后于BI前端,微軟公司有Cortana優勢。谷歌缺乏GPU實例也是一個顯著的差異。
正如任何產品一樣,這些大數據服務仍然處在他們的相對起步階段,將有不同的使用或數據依賴的情況。因此,用戶在AWS與Azure和谷歌之間進行選擇是比較困難的。而確定最佳云服務的一個方法,就是在幾周的時間內嘗試這些云服務,以獲得這些云服務工作的意義。