2017年11月27日至12月1日,亞馬遜在拉斯維加斯舉辦年度的“re:INVENT”大會,發布許多新服務、硬件,也帶來許多開發者和AWS的專家們之間交流的機會。在人工智能、機器學習如此火熱的年代,亞馬遜AWS也發布了以 SageMaker 為重點的多個機器學習服務。雷鋒網 AI 科技評論把相關情況簡單介紹如下。
一個新的機器學習云服務
云服務的意義是把傳統來講非常復雜的軟件管理流程以及IT硬件管理流程一股腦丟掉,讓企業只需要關注于自己真正的業務,而且還能方便地隨時擴大規模。如今,機器學習受到了開發者們越來越多的關注,而它也同樣也會遇到軟硬件環境的配置的問題。AWS看到了這種需求,也就打算站出來擺平這其中的種種困難。
在這次“re:INVENT 2017”大會上,亞馬遜就正式宣布了自己的機器學習云服務 SageMaker,它會給開發人員和數據科學家們提供一個新的框架,讓他們方便地管理機器學習模型相關的整個過程,很多以往躲不掉的基礎性工作現在都可以交給AWS完成。
AWS的高級技術人員 Randall Hunt 同步發出一篇博客介紹了一些技術細節。他也介紹道,SageMaker的目的就是建立一個開發框架,在它的幫助下可以讓企業更快地把機器學習集成到自己的新應用中。“Amazon SageMaker 是一個帶有完全的管理能力的端到端機器學習服務,它可以讓數據科學家、開發者、機器學習專家們快速地建立、訓練、運行大規模的機器學習模型”。
在發布會上,AWS CEO Andy Jassy 的介紹是“讓每天都需要和機器學習打交道的開發者們方便地訓練和部署機器學習模型”。
認識一下新工具
AWS的這個新服務可以分成三個主要部分。
第一部分,授權。無需配置就可以把標準的 Jupyter 編輯器作為集成開發環境(IDE),執行數據查看、數據清洗、預處理等等任務。這些任務可以在通用型的服務器上運行,當然也可以用帶有GPU的服務器。
第二部分,模型訓練。在這里,亞馬遜提供了分布式的模型構建、訓練和驗證服務。SegeMaker里會自帶一些常用的監督學習和無監督學習算法以及框架,用戶也可以借助Docker容器創建自己的訓練算法。訓練過程可以在幾十臺服務器上分布式運行,以提供更快的訓練速度。訓練數據會從S3云存儲服務器讀取,模型產生的數據同樣也會存在S3服務器上;這些數據主要是獨立于訓練數據的模型參數,而不是可以執行的、能夠直接用于推理任務的代碼。這種仔細思考之后的設計選擇,使得在 SegeMaker 中訓練的模型可以很方便地部署到其它平臺上去(比如物聯網設備中)
第三部分,模型承載。帶有HTTPs接口的模型承載服務可以調用設定好的模型,得到實時的推理結果。這些承載接口支持拓展,可以擴大規模、支持更密集的訪問,也可以設置為A/B對比,同時測試多個不同模型的結果。和前面一樣,這些接入點可以用內嵌的SDK構建,也可以通過Docker寫入自己的配置。
延續的一站式體驗
在發布會的演講中,Jassy重點強調了 SageMaker 的高靈活性。既可以用現成的工具,也可以構建自己的新工具。不管哪種情況下,SageMaker 都能夠處理熱門的算法,不受來源的限制。
在 Constellation Research的副總裁、高級分析師 Holger Mueller 看來,這種靈活性是一柄雙刃劍。“SageMaker大幅度減少了企業構建機器學習應用所需的工作量、知識水平以及花費的精力。但同時這也意味著AWS是背后的那個搞定一切的人,而且在想方設法把它的云服務用戶留下來、把計算和數據負載留下來。”他覺得AWS要是野心足夠大,可能還會發布一個自己的神經網絡開發平臺(像TensorFlow那樣的)。不過目前還沒有任何跡象。
不管怎么說,亞馬遜已經打算接手運行模型所需的所有基礎設施,以及幫用戶自動處理節點掉線、擴容以及安全補丁等等問題。
Jassy說,一旦模型準備好了,就可以在SageMaker上把它用在任意別的服務中。“對數據科學家和開發者來說這事意義重大”。
另外,發布會上同時還發布了機器學習可編程攝像頭DeepLens、輕量機器學習運行環境Greengrass ML Inference、視頻內容識別Rekognition Video、音頻轉文字Transcribe、語言翻譯Translate、語言識別Comprehend等多個機器學習服務,與已有的圖像識別Rekognition Image、聊天機器人Lex、文字轉語音Polly一同構成了強大完善的可用服務。
今天開始AWS就會開始免費提供SageMaker,作為免費服務策略的一部分。在達到一定程度之后,SageMaker也就會開始根據用量和地區開始收費了。
SageMaker主頁:https://aws.amazon.com/sagemaker/
SageMaker使用介紹:https://aws.amazon.com/cn/blogs/aws/sagemaker/