![](https://hfnxjk.com/statics/images/logo.png)
亞馬遜已經(jīng)成為了云的國王,以其亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的產(chǎn)品提供基于云的存儲(chǔ)和處理,節(jié)約了大量的新產(chǎn)品部署和服務(wù)以及開發(fā)應(yīng)用程序的成本。Netflix,DropBox和Yelp都是亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的客戶,但最重要的用戶可能還是亞馬遜本身。
在今天的Web 2.0峰會(huì)上,亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)存儲(chǔ)服務(wù)的副總裁Alyssa Henry,舉例說明亞馬遜如何利用其云存儲(chǔ)和處理能力來解決一個(gè)很少被想到但對(duì)總盈利能力又至關(guān)重要的問題:打擊倉庫盜竊。
據(jù)Henry稱,亞馬遜的零售目錄超過15億種物品,有超過200個(gè)庫房遍布世界各地。這對(duì)于在線零售商來說有太多的物品和太多的地方要跟蹤。對(duì)最有價(jià)值的物品的保護(hù)并不像只需將最貴的產(chǎn)品鎖起來這么簡單。正如Henry所說,有時(shí),由于實(shí)用性有限或其他因素, 竊賊們更愿意把黑手伸向更便宜的產(chǎn)品。還有一些問題是,殼體要多大?物品有多大?每個(gè)殼體里能放多少物品,等等。
要確定哪種產(chǎn)品最容易被偷,亞馬遜在S3中存儲(chǔ)產(chǎn)品目錄數(shù)據(jù),它每周有5000萬次以上目錄數(shù)據(jù)的更新。該團(tuán)隊(duì)每30分鐘加速一次亞馬遜的計(jì)算集群,處理壓縮數(shù)據(jù)并將數(shù)據(jù)反饋到倉庫和網(wǎng)站。服務(wù)中心有新的靈活映射化簡(Elastic Map Reduce),一種運(yùn)行在亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)上的托管的新的Hadoop框架,讓用戶在處理大數(shù)據(jù)的時(shí)候相當(dāng)于運(yùn)行在一臺(tái)超級(jí)計(jì)算機(jī)上。
亞馬遜不是唯一一家在處理大數(shù)據(jù)上使用EMR的公司:Henry用Yelp做為另一個(gè)例子。在特殊用例中,Yelp已經(jīng)利用AWS和EMR在它的搜索功能方面改進(jìn)了自動(dòng)糾正的選項(xiàng),對(duì)所有用戶所做的搜索進(jìn)行處理,并在哪些是用戶點(diǎn)擊量最多的基礎(chǔ)上決定哪些搜索選項(xiàng)是“正確的”。