機器學習代表著計算新領域,而公共云正使這項原本高大上的技術變得比以往更親民、更實惠和更可用。但是,這并不意味著隨便什么人都應該趨之若鶩。
機器學習是基于傳統人工智能概念的。在1959年,它被定義為能夠讓系統學習且不必由外部經常更新的能力。它派生出了模式識別和計算學習兩個分支,并在近期由幾家主要公共云供應商提供他們自己的機器學習服務而進入了業界大部分人士的視野。
今天,我們都知道所謂機器學習是一種學習算法,它能夠讓計算機通過在數據中尋找某種模式而擁有學習的能力。很多人都將機器學習視為一種卓越的靜態編程方法。它能夠模擬人類通過經驗進行學習的方法,隨學習時間的增長而有所提高,而無需人工干預添加新代碼或其他配置信息。
云讓機器學習服務變得在實現上更易用,在價格上更親民,在實效上更有用。我們現在可以通過租用的方式而非購買來使用計算和存儲資源。用戶可以使用PB量級的數據用于機器學習應用程序的學習,其費用支出只相當于原來內部部署硬件成本的一小部分。對于機器學習的新興趣更多的是來源于這項技術的新功能和低成本,而不是機器學習技術本身的原有功能。
常見的機器學習用例包括欺詐檢測、庫存管理、以及甚至是物聯網應用中控制機器的能力——幾乎是任何能夠從數據模式知識中獲益的所有應用。
當然,還有其他機器學習更為復雜的應用。例如,在美國麻省理工學院Sloan管理評論中有一篇銷售通過機器學習獲得提升的文章,Accenture卓越績效研究院共享了在眾多銷售額超過五億美元企業中的一項調研結果。調研受訪者被問及他們是否計劃通過技術實現更高的銷售增長,其中76%的人回答“是”。如果要做到這一點,他們計劃使用機器學習技術用于實現更高程度的預測精度,并相應地調整銷售資源。
公共云中的機器學習服務
谷歌云平臺上的谷歌云機器學習和亞馬遜網絡服務(AWS)上的亞馬遜機器學習都是公共云機器學習服務中的領先范例。這兩家巨頭都通過在他們各自環境中提供機器學習技術來提高用戶在他們云平臺上進行應用程序開發的興趣。他們兩家都為用戶提供了以較低成本使用機器學習服務的功能,以及作為數據源的大數據管理系統。
當用戶在選擇一家供應商時,應當考慮其機器學習需求以及公共云供應商如何滿足其需求的方方面面。除了實際的機器學習服務,用戶還應考慮云平臺中的數據、中間件和分析將如何共同協作以解決業務問題的方式。
公共云供應商所提供的機器學習系統囊括了軟件開發工具包和應用程序編程接口,這些工具能夠幫助開發人員將機器學習功能與他們的應用程序整合在一起。這將有助于填補機器學習功能與該項技術實際應用之間的空白。例如,一家金融企業可以根據其貸款申請系統中過去與當前的數據模式來確定某個貸款申請是否是欺詐行為。
當然,公共云中的機器學習服務也是有其短板的。首先,它要求所使用的機器學習服務對于公共云供應商來說是原產的,這就意味著用戶必須將數據導入其他云或本地,這可能是有問題的。
其次,很多企業都有一種過度使用機器學習的傾向,即將其用到實際上可能并不需要這項功能的應用;對那些本質上更多只是程序的簡單業務流程使用機器學習就顯得殺雞用牛刀了。通常來說,那些執行簡單結構化和序列化處理的應用程序并不適于使用機器學習。例如,預定銷售、跟蹤出貨以及處理其他已有良好定義的應用實際上并不真正地能夠從機器學習中獲益。