云計算機器學習平臺,有時也被稱為機器學習即服務(MLaaS)解決方案,可以讓企業更加輕松地采用人工智能(AI)。但專家表示,中小企業在考慮采用這些服務之前應該考慮其面臨的潛在挑戰。
機器學習(ML)是人工智能的一個分支,它涉及創建計算機系統,可以在沒有明確編程的情況下學習,其應用將越來越廣泛。德勤公司在其對2018年的技術、媒體和電信預測中表示:“2018年,大中型企業將加大對機器學習的使用力度,該技術的實施和試點項目數量將比2017年翻一番,到2020年將會再次翻番。”
同樣,在IDC公司最新的預測中,包括機器學習(ML)解決方案在內的認知和人工智能系統的支出將在2021年達到50.1%的復合年均增長率(CAGR),市場規模將達到576億美元。
IDC認知/人工智能系統研究總監David Schubmehl表示:“組織正在開發基于機器學習和深度學習的下一代智能應用項目,以及其他認知/人工智能技術。隨著企業競相將預測性和規范性功能嵌入其應用程序組合,人工智能成為企業和商業發展迅速擴大的領域。”
此外,據埃文斯數據公司最近的調查顯示,650萬技術開發人員正在使用某種形式的人工智能或機器學習,另有580萬開發人員計劃在六個月內開始使用人工智能或機器學習。鑒于全球有超過2200萬的開發人員,這意味著大多數(大約56%)的人已經在使用這些技術,或者很快就會這樣做。
而人工智能或機器學習的許多開發項目正在云端進行。Evans Data補充道:“那些正在使用人工智能或機器學習的開發人員中,有59%的人使用基于云計算的后端進行人工智能或機器學習的開發,因此我們估計大約有380萬開發人員在做這個事情。”
那么開發人員使用云計算機器學習工具構建的應用程序有哪些?為什么有些開發人員選擇基于云計算的工具而不是其他類型的軟件?
云計算機學習用例
基于云計算的機器學習的用例與其他類型的機器學習的用例非常相似。一般來說,MLaaS平臺非常適合需要分析大量數據的應用程序。如果這些數據已經存儲在云端,MLaaS平臺可能會更具吸引力。
例如,IDC公司曾表示,零售和金融服務行業將成為機器學習技術的最大嘗試者之一。對于這兩類公司而言,欺詐檢測是一個關鍵問題。而且,如果他們的交易數據已經駐留在公共云中,那么使用由同一供應商提供的MLaaS平臺是有意義的。對于在線開展業務的零售公司來說,基于云計算機器學習平臺的推薦引擎可能有助于增加銷售。其他用于云計算機學習的良好用例可能包括商業智能、風險分析、IT安全、金融交易等。
另一方面,數據駐留在網絡邊緣的應用可能不是采用云計算機學習的一個好選擇。最明顯的例子是自動駕駛汽車。由于延遲問題,自動駕駛汽車將花費一定時間將數據傳輸到云端進行分析,然后在做出行駛決策之前再返回指令,顯然云計算不能滿足這樣的實時要求。
同樣,物聯網(IoT)和醫療保健診斷也不是適合采用基于云計算的機器學習的行業領域,因為它們可能還需要大量的數據傳輸。但專家們表示,在某些情況下,采用云計算可能還是有意義的。一般來說,他們建議在仔細權衡可用選項的優缺點后選擇機器學習平臺。
基于云計算的機器學習的好處
云計算機學習相對于其他類型的機器學習解決方案的最大優點之一是,它可以使組織能夠訪問高性能的基礎設施,而這些基礎設施本身可能無法承受。機器學習應用需要大量的處理能力,而提供這種功率級別的系統在傳統上非常昂貴。如今,許多組織使用依賴圖形處理單元(GPU)來處理機器學習工作負載的系統,在云端租用這些系統通常比直接購買這些系統更加經濟實惠。
但是值得人們注意的是,在不久的將來,支持機器學習的基礎設施可能會變得更加實惠。德勤公司的報告指出,開發新型芯片可以使機器學習成本降低10倍到100倍,甚至1000倍。
云計算機學習的另一個與成本相關的好處是可以輕松獲得經濟實惠的數據存儲。隨著數據量的不斷增長,許多企業發現,將冷數據轉移到公共云系統比繼續將其存儲在自己的數據中心上成本要低很多。如果數據已經存儲在公共云中,那么使用基于云計算的機器學習服務通常也是有意義的。將大量數據從一個地方遷移到另一個地方可能會花費大量的時間,并為項目增加大量費用。但是,如果一個組織可以輕松地將機器學習工具應用于云端而不用遷移數據的話,那么這可能是使用MLaaS的強有力的理由。
基于云計算的機器學習的最后一個主要好處是由MLaaS或其他機器學習的自動化供應商提供的開發工具可以簡化在應用程序中嵌入機器學習的過程。應用程序開發人員和數據科學家與機器學習專業知識的競爭非常激烈,這需要企業提高人員的薪金。很多組織負擔不起甚至找不到工作人員來創建和使用機器學習應用程序。
MLaaS產品推出了讓民眾成為數據科學家的承諾,讓沒有編碼專業知識或高級學位的商業專業人員使用機器學習。例如,谷歌公司最近宣布了AutoML,它表示將“使人工智能可以訪問所有業務”。
許多機器學習廠商表示,他們的客戶能夠快速獲得基于云計算的機器學習解決方案。機器學習廠商DataRobot公司副總裁兼銀行總經理Greg Michaelson表示:“大規模部署機器學習可能是一個復雜的過程。但是,像AWS公司這樣的云計算服務和自動化機器學習的結合使得組織能夠在幾分鐘內啟動并運行,這使得他們的團隊能夠快速構建世界級的預測模型,從數據中獲得關鍵的洞察力。”
基于云計算機器學習面臨的挑戰
盡管云計算機器學習平臺有很多好處,組織仍然需要克服一些挑戰才能使用它們。這些挑戰中最大的問題是缺乏熟練的工作人員。
谷歌公司在其AutoML公告中指出,目前,世界上只有少數企業才能夠獲得所需的人才和預算,以充分了解機器學習和人工智能的發展。并且能夠創建高級機器學習模型的人數非常有限。如果是可以使用機器學習和人工智能工程師的公司之一,那么仍然需要管理構建自己的自定義機器學習模型的時間密集型和復雜的過程。雖然谷歌公司通過執行特定任務的API提供了預訓練的機器學習模型,但是如果想要把人工智能引入每個公司,那么還有很長的路要走。
而MLaaS平臺使機器學習更容易,但它們仍然不容易應用。
人工智能的風險投資基金機構DCVC公司的創始合伙人Bradford Cross曾經在博客中表示,MLaaS產品將會遭遇失敗,因為“知道自己在做什么的人只是使用開源,而不會使用任何東西工作的人,甚至是使用API??。”
時間會告訴人們,云計算機器學習產品是否能夠實現機器學習的民主化目標,但他們面臨著一個艱難的挑戰。
云計算機器學習平臺的另一個大問題是所有公共云所共有的問題:供應商鎖定。組織擔心,如果他們開始使用太多的單個供應商提供的服務,而其采用另一個供應商提供的服務將變得非常困難。而這反過來又可能使它們容易受到云計算服務提供商的價格上漲的影響。
整合來自不同數據源的數據也會造成障礙。許多機器學習項目都依賴于來自許多不同地方的數據。無論組織是使用云計算機器學習平臺還是其他類型的機器學習解決方案,收集這些數據并將其轉換為可用的數據都是一項艱巨的任務。
這給所有機器學習項目帶來了另一個挑戰——臟數據。當Kaggle公司對數據科學工作者的最大障礙進行調查時,49.4%的受訪者選擇的第一個反應是骯臟的數據。如果依賴于不良信息,世界上最好的機器學習工具將不會有效,并且使數據進入可用狀態,繼續為數據科學專業人士消耗大量時間和精力。
云計算機器學習的替代品
組織有很多其他MLaaS平臺的替代品。如前所述,許多專業數據科學家選擇使用開源機器學習工具,如TensorFlow,Apache Spark的MLlib或Caffe。此外,許多企業選擇從Alpine Data,Dataiku,DataRobot,Domino Data Lab,FICO,H2O.ai,RapidMiner,SAS和Statistica等廠商購買預測分析和機器學習解決方案。許多這樣的軟件(無論是專有的還是開源的)都可以部署在內部部署數據中心或云端。
此外,許多其他類型的企業軟件也具備一些機器學習功能。一些組織發現,他們已經使用或正在考慮購買的商業智能、CRM、營銷情報、安全情報、電子商務或其他類型的解決方案具有他們所需的機器學習功能。因此,一些組織可能不需要建立自己的機器學習應用程序。
流行的云計算機器學習服務
即使有了所有這些替代方案,隨著組織增加使用機器學習,云計算機器學習平臺仍然越來越受歡迎。以下的圖表提供了一些最著名的云機器學習工具的概述:
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。