從數(shù)據(jù)挖掘到面部識別,亞馬遜公司最近為開發(fā)者推出了新的服務和產(chǎn)品,以提供更廣泛的云計算能力。
一開始,云計算中的生活很簡單。只要鍵入信用卡帳號和密碼,就可以在一臺機器上有root權限,而不必重新購買一個新服務器并部署在機架上運行。
如今,已經(jīng)發(fā)生了巨大的變化。云計算已經(jīng)變得如此復雜,并具備諸多功能,很難將所有的活動用一個單詞來描述,甚至很難用一個詞來稱呼千變萬化的非結構化的“云”。如今,仍有root登錄機器出租,也有切割和存儲用戶的數(shù)據(jù)。程序員不需要像訂閱和配置那樣編寫和安裝。
云計算行業(yè)中,亞馬遜公司首屈一指,但并不是說沒有競爭。行業(yè)廠商微軟,谷歌,IBM,Rackspace和Joyent都為云計算提供了出色的解決方案和巧妙的軟件包,但沒有一家企業(yè)可以像亞馬遜公司那樣可以創(chuàng)造功能豐富的云計算服務包。現(xiàn)在,亞馬遜網(wǎng)絡服務公司正在推進一系列新產(chǎn)品的開發(fā),這些新產(chǎn)品將云計算作為一個空白的概念。借助AWS的最新一輪工具,云計算的應用將更加簡單可靠。
以下有亞馬遜公司推出的10個新服務,可以顯示出其將如何重新定義云中的計算。
(1)Glue
任何做過大量數(shù)據(jù)科學的人都知道,收集數(shù)據(jù)往往比執(zhí)行分析更具挑戰(zhàn)性。收集數(shù)據(jù)并將其轉換為標準數(shù)據(jù)格式的工作通常超過總工作量的90%。
Glue是一個新的Python腳本集合,它自動爬取用戶的數(shù)據(jù)源以收集數(shù)據(jù),應用任何必要的變換,并將其粘貼在Amazon的云中。它會訪問用戶的數(shù)據(jù)源,使用所有標準縮寫,如JSON,CSV和JDBC阻止數(shù)據(jù)。一旦它抓取數(shù)據(jù),就可以分析模式并提出建議。
Python層很有趣,因為用戶可以使用它,而不用編寫或理解Python,而如果用戶需要自定義什么功能,肯定會有所幫助。Glue將根據(jù)需要運行這些工作,以保持所有數(shù)據(jù)流動。它不會為你思考,但它會拼湊許多細節(jié),讓你思考大局。
(2)FPGA
現(xiàn)場可編程門陣列(FPGA)長期以來一直是硬件設計師的秘密武器。任何需要特殊芯片的人都可以通過軟件構建。沒有必要構建自定義的掩碼或者將所有的晶體管的安裝最小化。FPGA使企業(yè)的軟件描述晶體管如何工作,并作為一個真正的芯片重新布線。
亞馬遜公司的新AWSEC2F1將FGPA的力量帶給了云計算。如果企業(yè)有高度結構化和重復性的計算,EC2F1實例可以為其提供幫助。使用EC2F1,企業(yè)可以創(chuàng)建一個假想芯片的軟件描述,并將其編譯到數(shù)量極小的門陣列,在最短的時間內給出計算答案。唯一更快的是在真正的芯片中蝕刻晶體管。
誰可能需要這個?比特幣采礦者每天上億次計算出相同的加密安全散列函數(shù),這就是為什么許多比特幣采礦者使用FPGA來加速搜索的原因。重復算法可以寫入芯片,F(xiàn)PGA實例讓用戶租憑機器立即實施。例如,當用戶處理位級函數(shù)和其他非標準的非算術計算時。如果只是添加一列數(shù)字,標準實例是更好的。但對于一些人來說,采用EC2與FGPA可能是一個大勝利。
(3)Blox
隨著Docker進入堆棧,亞馬遜公司正試圖讓任何用戶更容易在任何地方,任何時間運行Docker實例。Blox被設計為協(xié)調實例的集群,以便以最佳數(shù)量運行。
Blox是事件驅動的,所以編寫邏輯要簡單一些。用戶不需要不斷地輪詢機器,查看它們在運行什么,它們都報告回來,所以只要數(shù)字正確就可以運行。Blox也是開源的,這使得更容易在Amazon云之外重用Blox,如果用戶需要這樣做的話。
(4)X-Ray
監(jiān)視你的實例的效率和負載僅僅是另一項工作。如果用戶想讓集群工作順利,就必須編寫代碼來跟蹤一切。許多人使用令人印象深刻的工具套件吸引了第三方。如今,亞馬遜的X-Ray可以為用戶做大部分的工作。在用戶的堆棧方面,它可以與許多第三方工具進行競爭。
當網(wǎng)站收到數(shù)據(jù)請求時,X-Ray會跟蹤流向用戶機器和服務的網(wǎng)絡。然后X-Ray將聚合來自多個實例和區(qū)域的數(shù)據(jù),以便用戶可以停留在一個地方以標記有問題的服務器或楔形數(shù)據(jù)庫。
(5)Rekognition
Rekognition是一款用于圖像工作的亞馬遜推出的新工具。如果用戶希望其應用程序可能處理更多的存儲圖像,Rekognition將使用一些最著名和測試的機器視覺和神經(jīng)網(wǎng)絡算法,通過圖像搜索對象和面部。沒有必要花幾年時間學習。用戶只需將算法指向存儲在亞馬遜云中的圖像,即可得到一個對象列表和一個置信分數(shù),這個分數(shù)可以列出答案的可能性。
這些算法被大量調整用于面部識別。算法將標記面部,然后將它們進行彼此比較,并引用圖像以幫助用戶識別它們。用戶的應用程序可以存儲有關這些面的元信息,以供稍后處理。
將元數(shù)據(jù)命名后,用戶的應用就會在他們出現(xiàn)的任何地方找到要找的人。而這種識別只是開始。有人在微笑嗎?他們的眼睛閉上了嗎?這個服務將提供答案,所以用戶不需要親自動手。如果用戶想使用令人印象深刻的機器視覺,Rekognition將會通過瀏覽圖像來搜索。
(6)Athena
使用Amazon的S3一直很簡單。如果用戶你想要一個數(shù)據(jù)結構,可以使用S3尋找想要的部分。亞馬遜公司推出的Athena現(xiàn)在使其更加簡單。它將在S3上運行查詢,因此用戶不需要自己編寫循環(huán)代碼。
Athena使用SQL語法,這應該使數(shù)據(jù)庫管理員感到很方便。亞馬遜公司將通過尋找答案每個字節(jié)收取費用,但不要太擔心其費用失去控制,因為其價格只有5美元/TB。
(7)Lambda@Edge
采用內容傳送網(wǎng)絡的最初想法是通過將副本推送互聯(lián)網(wǎng)邊緣附近的大量內容服務器上,來加速諸如JPG圖像和CSS文件的簡單文件的傳送。亞馬遜公司正在做出進一步努力,推送Node.js代碼到這些邊緣,他們將運行和響應。用戶的代碼不會放在一個中央服務器上,而是等待從世界各地的請求。它將克隆自身,因此能夠以微秒為單位進行響應,而不會受到所有網(wǎng)絡延遲的阻礙。
亞馬遜公司只會用戶在運行時代碼時收費。用戶不需要設置單獨的實例或租借完整的計算機來保持服務。目前Lambda@Edge在一個封閉的測試,用戶必須申請在堆棧中獲取代碼。
(8)SnowballEdge
如果用戶想要某種物理方式控制你的數(shù)據(jù),云計算并不適合。在云計算中,用戶無法通過硬盤驅動器,DVD-ROM或保存數(shù)據(jù)的驅動器而產(chǎn)生的電源和保證。那么,數(shù)據(jù)在哪里?如何得到它?如何制作備份副本?云計算將使任何關心這些事情的人對此擔憂。
SnowballEdge是一個裝滿數(shù)據(jù)的盒子,可以隨時隨地傳送。它甚至有一個運輸標簽,采用的是電子墨水顯示,就像亞馬遜放在Kindle上一樣。當用戶想要一個存儲在亞馬遜云中的大量數(shù)據(jù)的副本時,亞馬遜會將其復制到框中,并將框發(fā)送到任何地方。(文檔沒有說明Prime成員是否可以免費發(fā)送。)
SnowballEdge有其實用的目的。許多開發(fā)人員通過云應用程序收集大塊數(shù)據(jù),而通過開放互聯(lián)網(wǎng)下載這些塊速度太慢。如果亞馬遜公司希望吸引用戶進行大量的數(shù)據(jù)處理工作,則需要更容易地從系統(tǒng)中獲取大量數(shù)據(jù)。
如果用戶已經(jīng)積累了大量的數(shù)據(jù),需要其他的方法進行處理,亞馬遜公司有一個更大的版本稱為Snowmobile,。盒子不是簡單的存儲數(shù)據(jù),他們可以運行任意的Node.js代碼,所以用戶可以搜索,過濾或分析。
(9)Pinpoint
一旦用戶收集了客戶,成員或訂閱者的列表,有時就會向他們推送消息。或許用戶已更新應用程式或想傳達一些優(yōu)惠的消息。用戶可以向列表中的每個人發(fā)送電子郵件,而這是垃圾郵件的一步。更好的解決方案是定位用戶的消息,亞馬遜的新推出的Pinpoint工具使其更簡單。
用戶需要將一些代碼與其應用集成。在完成后,Pinpoint會在用戶準備好接收郵件時發(fā)送郵件。完成所謂的定位廣告系列后,Pinpoint會收集并報告與用戶的廣告系列的互動程度數(shù)據(jù),以便用戶日后調整定位努力。
(10)Polly
如果用戶使用Polly,可以利用最新一代的語音合成功能將人們可以聽到的話轉換成文字。