在本屆Reinvent大會上,Amazon Web Services針對數據在云環境下的每個使用階段分別給出了新的方案選項。
數據上傳、數據提取與數據分析——我們通常會把這三項功能與云工作負載關聯起來。Amazon公司在本周三的Reinvent大會主題演講當中宣稱,未來將有新型服務幫助大家搞定這三項任務——以更具創造力的方式。
舉例來說,我們為什么要通過線纜與Amazon對接才能完成數據同步?為什么不直接作為郵包寄給服務供應商?而且考慮到Amazon承載著海量等待進行分析處理的數據,何不推出一款專門面向商業客戶——而非IT人士——的工具,從而幫助他們從信息當中獲取價值?
AWS導入/導出Snowball
“永遠不要低估數據往來不絕的大規模傳輸場景下的網絡帶寬問題,”計算機科學家Andy Tannenbaum曾經指出。而Amazon針對數據向云端遷移所推出的新設備顯然將這一箴言融入了血液當中。
AWS導入/導出Snowball的設計原型早在2009年就已經確立,但Amazon隨后又對其進行了重新定義,旨在幫助用戶將數據保存在指定的設備當中并直接郵寄給Amazon。有了Snowball,Amazon將能夠以自動化方式完成整個硬件裝載郵寄流程,同時精簡其往來投遞工作。
AWS導入/導出Snowball能夠自動完成數據面向AWS的上傳工作。用戶的負載數據會被保存在一款特定設備當中,通過郵寄交付至AWS并完成上傳,而后再將其寄還給用戶——整個過程只需200美元。
Snowball設備其實是一套堅固耐用、具備防篡改功能且能夠接入網絡的磁盤陣列,同時具備一個10 GB網絡端口。用戶可以一次性向其中導向50 TB數據,而后將其郵寄給Amazon公司,從而快速將這部分數據上傳到指定的S3存儲分卷當中。每臺設備每次服務要價200美元,而每超出限定使用周期10天(即超過10天仍未將設備寄回)則需額外承擔每天15美元的滯納金。
Snowball的主要賣點在于其極為便利,其能夠確??蛻粼诋斚履酥两窈蟛粫粡氐淄虥]在數據海洋當中,而又無力將其及時上傳至AWS中。另外該設備當中的數據會被加密,Amazon公司還會在Snowball的郵寄途中不斷更新其當前位置:“正郵寄給客戶”、“正郵寄至AWS”、“導入中”等等。該設備上的電子墨水掃描裝置甚至能夠作為郵寄標簽使用,而Amazon公司表示“未來可能還會有更多功能增強機制推出,包括持續不斷的GPS位置追蹤。”
Amazon數據庫遷移服務
對于那些樂于將自己的結構化數據逐步交由Amazon數據中心打理的客戶,AWS也推出了類似的方案選項:Amazon數據庫遷移服務。
甲骨文、MySQL或者微軟SQL Server的用戶可以將數據從自己的數據中心內復制到AWS中的同類數據庫處,或者是選擇另一種完全不同的遷移目的地——例如將甲骨文數據庫內容導入到MySQL中。AWS方面提供一款使得的模式轉換工具,能夠確保轉換后的數據不會在遷移過程中受到任何破壞,而Amazon公司還強調稱其建議客戶以并行方式使用該功能,因為其可能在某些目標平臺上無法正常起效。
這項服務的計費機制以每虛擬機實例每小時計算——也就是運行該遷移服務的虛擬機數量(起步價位為每小時1.8美分),不過像Migration Service實例這類在同一可用區內遷移的數據庫無需任何使用成本。
那么這項服務的目標受眾何在?可能主要是那些有意向Amazon遷移,但卻沒有能力或者沒有時間自行實施的客戶。通過這樣一種方式,此類客戶能夠在后端建立起一條數據復制通道,其與現有業務運營體系并行不悖,而且不至于由于全面向AWS遷移而導致正常業務陷入停滯。
Amazon Kinesis Firehose
Amazon的Kinesis服務旨在幫助AWS客戶捕捉并處理實時數據,無論其來自何處。作為全新方案選項,Amazon Kinesis Firehose并沒有在實質上做出任何改變——事實上,它反而對原有功能進行了削減。
顧名思義,Firehose更像是一款連接器,允許客戶在獲取到數據流時將其寫入到S3或者Redshift當中。Firehose對于數據流的惟一額外操作(可選)就是進行壓縮或者加密。而從客戶角度出發,他們可以在數據出現之前為其設定緩存大小以及將要寫入的目標存儲桶。
有趣的是,FIrehose服務還允許大家以獨立方式對數據進行收集與處理。舉例來說,用戶能夠在Firehose數據抵達目標S3存儲桶時觸發AWS Lambda任務。如此一來,我們就能以數據輸入為條件進行任何需要的工作,而且只需要為每種Lambda處理模型完成最基本的代碼編寫。
QuickSight
云環境下的數據本身可能質量不高。Amazon公司從傳統角度講缺乏豐富的選項來以規模化方式收集并存儲數據,但現在其為用戶帶來一種新的方案,能夠對已經儲備到的全部數據進行分析以及可視化處理——這一切皆由一項托管在Amazon上的服務實現,也就是QuickSight。
Amazon的新型商務智能產品QuickSight能夠與Amazon的現有數據庫集合(包括RDS、DynamoDB、ElastiCache以及Redshift)以及分析系統(包括EMR、DataPipeline、Elasticsearch Service、Kinesis以及機器學習等)相對接。一旦接入給定數據源,用戶則可以使用一套界面操作類似于Tableau簡化版的產品,同時從最適合選定數據集的可視化工具推薦中挑選對應方案。
Amazon QuickSight旨在對保存在Amazon各服務當中的數據進行快速分析,并最終可與Tableau等現有商務智能產品相對接。
Amazon公司的云產品對于用戶的技能水平一直有著比較高的要求,但這一次推出的QuickSight似乎非常直觀且簡潔——這也可以理解,畢竟該服務的主要受眾為企業中的業務人員而非IT人員。作為另一項面向業務用戶的方案,Amazon還承諾可以將由QuickSight收集到的數據通過SQL類命令語言進行訪問,這意味著其它合作產品(目前包括Domo、Qlik、Tableau以及Tibco)最終將能夠使用QuickSight提供的內存內處理機制。換言之,我們最終一定會迎來將Excel導入QuickSight的途徑,否則Amazon將錯過Excel這一在企業客戶中普及程度最高的自助式數據處理工具。
而作為吸引企業客戶的另一大賣點,QuickSight每用戶每月只需支付12美元,如果一次訂購整年則每用戶每月只折合9美元。使用者每次最多可以將來自其它系統的10 GB數據導入QuickSight,且存儲容量供大家免費使用。不過企業客戶恐怕還需要一段時間的評估來審視Amazon的這項新服務是否真的優于傳統商務智能方案——畢竟QuickSight預計要到“2016年年初”才會正式推出。