如果AWS的開發人員想要理解他們的數據中蘊藏的意義并做出預測,現在就不再需要其他的托管機器學習平臺了。
AWS上周四發布了旗下首款機器學習產品——這款產品就被簡簡單單地命名為Amazon Machine Learning(亞馬遜機器學習)——該產品讓AWS開發人員能夠更容易地從他們托管系統收集到的大量事務性和操作數據中挖掘價值。
IBM最近推出了托管Watson Analytics平臺,微軟推出了Azure Machine Learning,亞馬遜的這次行動緊隨其后,這三家公司現在都在尋找幫助開發人員將機器學習智能內嵌到自己應用程序中的方法。谷歌的機器學習產品——Prediction API是在2012年推出的。
和AWS本身很類似,Amazon Machine Learning來自亞馬遜內部的數據科學家用于創建機器學習模型的技術,機器學習幫助亞馬遜找到有用的數據使用模式,并最終做出更精準的預測。然而,AWS希望Amazon Machine Learning能夠讓那些沒有統計學文憑的人也能有用。
利用AWS Machine Leaning API,開發人員能夠在Amazon RDS中創建新的模型,利用來自Amazon S3、Amazon Redshift或者MySQL數據庫中的數據。
這項服務是在現有服務的基礎上進行收費的,按照兩種不同的預測類型計費:針對應用程序的批量預測需要同時進行大量的預測;而實時預測則允許應用程序按照需求請求預測。
對于批量預測,它的費用為每1000次預測10美分,而實時預測根據所需要的內存,定價為每次預測0.0001美元。
AWS提供的批量預測定價實例包括了計算費用和預測費用。所以按照每一千次預測10美分的價格計算,如果一位開發人員一個月需要進行890000次預測,那么費用將是89美元。他們還要按照所需要的小時數另行支付計算費用。
與之類似,實時預測費用包含了計算費用,月預測費用(每次預測0.0001美元),還包括按照時長計算的存儲容量使用費,價格為每10MB每小時使用費0.001美元。
亞馬遜表示它的平臺支持三種類型的預測,能夠回答某些類型的問題;然而,一切都需要適當的“培訓”模型去利用現有的數據:
用兩分法在兩個可能的結果之間進行預測。這筆交易是否合法,客戶是否會購買此產品,或者收貨地址是公寓地址嗎?
用多類分類在三個或者多個可能的結果預測可能的結果,或者幾個可能的結果以及每種結果可能出現的概率。這款產品是一本書、一部電影或者是一件衣服?這部電影是喜劇、紀錄片還是驚悚片?這位客戶對哪一類產品最感興趣?
用回歸方法預測數字。我們應該保留多少27寸顯示器的庫存?我們應該收取多少費用?有多少比例的產品是作為禮品售出的?