Amazon.com公司以往似乎并不像谷歌、微軟、Facebook以及IBM那樣在人工智能領域引人注目,但這一情況如今開始出現改觀。
Amazon公司首席執行官Jeff Bezos最近發布了年度股東信,并在信中表示他認為作為AI領域的一大分支,機器學習這種能夠無需編程即可實現計算機學習的技術將成為該公司未來發展的關鍵所在。
具體來講,與目前的其它AI領導廠商一樣,Amazon公司專注于打造深度學習神經網絡,旨在以原始方式模擬大腦工作原理。深度學習在過去幾年中立足語音與圖像識別領域取得了巨大進步,而這一切也最終使得Amazon Alexa語音助手及谷歌自動駕駛車輛等方案成為可能。
Bezos同時指出,Amazon方面將利用機器學習支持Alexa、Prime Air送貨無人機以及Amazon Go商店。其它機器學習方案則將繼續提供幕后技術,包括進行供電需求預測、產品改進建議等等。Bezos希望這項新型技術能夠最大程度為人類提供便利。
“關注這一領域”Amazon公司的下一階段目標在于利用Amazon Web Services云提供更為低廉的成本與易用效果,從而將機器學習成果交付至廣大開發者手中。Amazon公司于去年秋季通過自家云環境中的Lex等一系列新服務面向開發者嘗試機器學習能力交付,希望借此提供更為便攜的交互界面——例如通過Polly服務將文本轉換為語音,或通過Rekognition實現圖像分析與關聯。
Bezos指出,“客戶們已經開發出多種強大的系統方案,其功能涵蓋從早期疾病檢測到提升農作物產量等多個領域。”
這位Amazon公司創始人不僅是在追求最新發展潮流。事實上,機器學習服務亦能夠幫助Amazon在日益升溫的云計算市場競爭中占據優勢地位,特別是考慮到谷歌與微軟在云業務領域的快速崛起。很明顯,Amazon公司希望成為未來智能應用時代下的主要技術供應商。
CB Insights公司在最新報道中表示,“Amazon很可能會將AI作為下一大與其會員免費發貨服務及AWS等同的業務支柱。Amazon公司正以前所未有的勢頭發展成一家平臺廠商。”
通過對Gartner等市場分析企業結論的解讀,Amazon找到了在云機器學習產品領域趕超微軟與谷歌的有效途徑。在上周于舊金山召開的AWS峰會上,該公司公布了一系列更新與全新功能,旨在快速縮小自身在AI領域與競爭對手間的差距。
為了更為深入地了解Amazon公司的機器學習規劃,我們與Amazon AWS AI副總裁Swami Sivasubramanian進行了交流。以下為相關對話內容(經過編輯與調整):
問:您能否談談Amazon公司目前在機器學習領域的工作范疇?
答:具體可以分為三大層面。Lex、Polly與Rekognition等高級應用屬于經過預先訓練的深度學習模型,其通過應用程序編輯接口為那些不打算親自涉足機器學習,但又希望開發出具備聽取、朗讀或者觀察能力的智能應用程序的開發者們提供相關功能。
下一個層面則為Amazon Machine Learning等API平臺服務以及EMR(即Elastic MapReduce,用于分析大規模數據)等相關組成部分,其適用于那些樂于利用Redshift(AWS數據倉庫)或者其它關系數據庫數據自行構建機器學習模型的用戶。而我們團隊的下一項目標則為開發深度學習框架與機器學習算法。
目前團隊中有一大批科學家正在研究核心深度學習框架。在AWS公司,我們采取非常開放的心態并支持一切深度學習框架,具體包括Apache MXNet、TensorFlow乃至Caffe與Theano等等。
Amazon公司AWS AI事務負責人Swami Subramanian
問:總體來講,您希望在這一領域達成怎樣的目標?
答:我們的目標基本上是實現人工智能民主化,意味著每位開發人員皆可以訪問AI功能。一般來講,即使立足于當下,開發人工智能方案通常也需要開發者擁有博士學位。
我們希望能夠構建起新型智能應用程序,并真正造福于人類,例如確保其能夠看到、聽到、說出或者理解我們的表達。另外,我們也致力于幫助企業及其業務部門立足于存儲在AWS當中的數據作出更為明智的商業決策。
問:為了實現這一目標,您已經采取了哪些行動?
答:Netflix公司已經利用深度學習建立起一套推薦引擎,用以向客戶推薦其可能感興趣的內容。Pinterest公司則打造出圖像識別方案。我們在Amazon當中利用機器學習技術支持物流機制,因此當您點擊購買某商品的按鈕時,機器人將利用計算機視覺與深度學習技術以了解您所選擇并應當發貨的商品。我們還利用這類技術增強現有產品——舉例來說,我們將計算機視覺與深度學習引入Amazon即時視頻功能X-Ray當中,意味著用戶在暫停當前畫面時,其能夠幫助您識別出每一位出現在畫面中的演員。
我們還利用它創建新的產品系列。現在大家對于Alexa應該不再陌生。我們與Alexa進行了兩年的對話交流,就像是面對真人一樣對其加以訓練。而在Amazon Go商店方面,憑借著視覺識別技術,我們能夠看到顧客拿起及放下商品的動作,從而提供零結帳購物體驗。
問:Amazon公司最近一直在強調AI業務,但在這方面谷歌、微軟、Facebook等企業的表現似乎更加引人注目。您是否在努力改變這一現狀?
答:在Amazon,我們只關注真正關乎客戶利益的事項。以Amazon Go為例,我們希望提供零結帳銷售體驗以幫助客戶更高效地完成購物。在這方面,我們并不會刻意將其與AI技術聯系起來。Alexa也是一樣。雖然我是一位科學家,但我更喜歡談體驗而非技術,畢竟我的家人確實很喜歡跟Alexa交流。
具體來講,Amazon公司多年來一直在機器學習與人工智能方面投入巨資,我們也在以相當開放的方式與科學界共享我們的貢獻。我們今年又提交了多篇研究論文。在MXnet,我們的代碼貢獻量占其中的35%。
問:作為一項已經存在20年甚至更長的技術,為什么近年來深度學習算法迎來了快速發展?
答:主要原因有三。其一,我們現在有能力以低廉的成本存儲全部數據,而無需向存儲方案供應商支付巨額資金。第二,擁有專業計算方案。GPU(圖形處理單元)與FPGA(現場可編程門陣列)芯片有效加速了此類應用的執行速度。最后,一旦建立并訓練出相關模型,我們即可通過預配置的模板輕松將分布式訓練基礎設施擴展到數百個GPU當中。憑借著云計算的資源優勢,現在大家能夠充分享受相關編程的便捷優勢。
未來展望問:Amazon在以怎樣的比例關注現有技術應用與新型算法或技術的構建?
答:我們在多個領域進行基礎性創新研究,具體包括語音識別、自然語言理解以及視覺識別。如果將時間退回到十年前,我們必須持續推動深度學習技術的邊界才能為客戶交付擁有實際價值的準確性結果。在這一過程當中,我們不斷發明新的算法,以確保Alexa等服務能夠提供與預期相符的客戶體驗——或者像在Amazon Go項目當中,大幅提高深度學習與計算機視覺識別能力以將設想變為現實。
我們亦在核心引擎領域進行著基礎性研究,包括開發各類深度學習框架。我們擁有一支專門的深度學習引擎開發團隊,他們負責努力擴展相關系統。客戶目前希望處理的圖像、視頻等數據問題經常達到PB級別,隨著待處理數據量的不斷增加,可擴展性也將成為未來幾年內各廠商所提供之解決方案的主要差異之一。
問:您的機器學習模型能夠在云網絡的邊緣位置起效——例如當無法接入中央云環境時,支持自動駕駛車輛順利運行?
答:我們認為,面向云環境構建的模式也應當能夠在邊緣位置運行。我們構建的深度學習模型能夠在傳統計算機環境下運行,亦可對接EC2(AWS彈性計算云服務)或者Lambda(AWS專用計算服務)。Greengrass(一款軟件,能夠在無需云服務的條件下實現數據的離線操作與本地處理)可將邊緣設備作為良好的運行環境。我們的團隊還移植了一款MXNet深度學習模型,其可以識別表中的對象,且能夠運行于Raspberry Pi攝像頭(一款小型低成本計算設備)內。
我們的目標是建立一整套混合體,其中部分深度學習模型立足邊緣位置運行以支持快速使用情況,另一部分則運行在云環境中以支持更為復雜的用例。Alexa采取的正是這種設計方式。也正因為如此,我們認為這種新的混合部署模式將在未來擁有強大的生命力。
問:機器學習的未來發展方向是什么?
答:我兒女今年兩歲了,她只需要看過兩枚西紅柿,就能了解西紅柿究竟是什么樣子——而不像機器學習那樣需要比較上千個西紅柿才能完成學習。正因為如此,我清醒地意識到深度學習目前還處于起步階段。實際上,目前的多種現有技術已經能夠利用非常有限的數據提升深度學習模型的分析準確性。
我們一直在進行相關嘗試。有時候人們并不需要太高的準確性。好使是對于視覺搜索這樣的方案,人們往往也更傾向于選擇更大的覆蓋面,且愿意為此犧牲一部分精度。
因此還有更多的任務等待我們完成。如果將Amazon的機器學習研究視為完整的一天,那么我們目前身處的階段僅僅是剛剛醒來——甚至還沒有喝下早餐咖啡。