在當今云計算超高速發展的時代,機器學習解決方案在改進系統方面取得了指數級的進步。機器學習利用大數據分析和識別模式的能力為當今的企業提供了關鍵的競爭優勢。
機器學習通常與人工智能和深度學習結合使用,使用復雜的統計建模。這些復雜的系統可能在私有云或公共云中運行。在任何情況下,時間的推移都會促進機器學習:隨著更多數據被添加到任務中并隨著時間的推移進行分析,機器學習會產生更準確的結果。
根據調研機構BCC Research的調查數據,2017年全球機器學習市場規模達到14億美元。到2022年,估計將達到88億美元,其復合年增長率(CAGR)高達43.6%。
企業在考慮選擇哪個機器學習供應商時,請權衡以下因素:
•主要平臺或獨立供應商:以下的一些機器學習供應商提供了完整的云計算平臺,其他供應商是專門針對機器學習的創業公司。由于沒有嚴格的規則,這些公司可能會更有動力為企業提供服務。
•機器學習類型:機器學習主要應用在零售行業還是醫療保健領域?企業可以詢問其潛在供應商在哪些行業投資最多。
•供應商的未來發展方向:在研發和投資方面,供應商在未來幾年將關注哪些方向?這個問題的答案可能會幫助企業找到最符合其長期目標的答案。
機器學習環境正在迅速變化。機器學習初創企業不斷涌入這個領域。成熟的供應商正在推出各種以某種形式使用機器學習的產品。對選項和選項進行排序可能會讓人感到困惑。因此需要根據他們提供的功能、分析師評論、客戶推薦和獨立研究,確定了機器學習領域的8家頂級供應商提供的解決方案。
(1)Alteryx
Alteryx公司提供統一的平臺,可以解決數據、分析和機器學習問題。該供應商致力于通過協作方法在IT、分析專家和業務線之間建立新的和改進的合作伙伴關系,從而最大限度地減少對數據科學家的需求。
該產品提供無代碼和代碼友好的格式。它使用拖放式工作流界面,并與第三方人口統計、公司和空間數據相關聯。該公司被評為Gartner 魔力象限(MQ)的“領導者”。調研機構Gartner公司指出,Alteryx公司正朝著強大的自動化和基于規則的方向邁進。
Alteryx公司提供與眾多主要合作伙伴的集成,其中包括Tableau、AWS、Teradata、Microsoft、DataRobot、Salesforce、Oracle、Cloudera和Qlik。機器學習功能具有并行模型分析和預測分析,以及自動化工作流和各種流程的能力。
(2)AWS SageMaker
完全托管的機器學習服務允許數據科學家和開發人員構建和訓練機器學習模型,并將其插入應用程序。這可以運行并行模型,進行靈活的分布式培訓,并解決A-B測試以及其他任務。
SageMaker是一個完全托管的AWS服務,包括一個集成的Jupyter記事本實例。這有助于深入了解數據源,從而有助于探索和分析。SageMaker提供了一套針對環境優化的算法,它支持專有算法和自定義培訓腳本。
Sagemaker還集成了Docker容器和Apache Spark。與AWS一起,可以使用集成的SageMaker控制臺快速啟動和擴展項目。該平臺支持HIPAA法規和其他合規標準。
(3)谷歌機器學習引擎
谷歌云計算機器學習(ML)引擎是一個為開發者和數據科學家設計的完全管理的平臺。該產品允許用戶使用多個機器學習框架構建高質量模型,其中包括Scikit Learn、XgBoost、Keras和TensorFlow。
這是一個復雜的深度學習框架,支持許多谷歌產品,從谷歌照片到谷歌云語音。它允許用戶將機器學習部署到生產中,而無需Docker容器。高度可擴展的環境,這適用于托管集群的培訓,并提供了一個自動設計和評估模型體系結構的框架。它旨在適應現有的工作流程,并可擴展以處理批量預測和在線預測要求。
其他主要功能包括:自動資源調配、使用便攜式模型、服務器端處理和集成云數據存儲。
(4)IBM Watson Studio
IBM公司是人工智能(AI)和機器學習領域的先驅。如今,調研機構Forrester公司將IBM公司列為多模式預測分析和機器學習解決方案提供商的“領導者”。
IBM Watson Studio旨在容納各種獨立平臺和各種類型的超級用戶。這包括數據工程師、應用程序開發人員和數據科學家。其結果是強大的協作能力。它的主要功能包括:強大的體系結構、強大的算法和執行機器學習的強大能力。
Watson Studio是IBM Watson保護傘下提供的大量技術和解決方案的一部分。它旨在適應IBM的SPSS建模工作流程,同時還插入開源機器學習庫和基于筆記本的接口。該解決方案可在桌面上或桌面上的云中使用。它結合了可視化拖放工具。
(5)微軟Azure Machine Learning Studio
微軟Azure 的Machine Learning Studio已成為托管云領域的領先解決方案。它提供了一個可視化工具,可以幫助開發人員、數據科學家和非數據科學家設計機器學習管道和解決方案,以解決各種各樣的任務。該平臺提供基于瀏覽器的可視化拖放創作環境,無需編碼。Gartner公司將微軟公司評價成為其魔力象限(MQ)中是一個“遠見者”。該解決方案提供高水平的靈活性、可擴展性和開放性。
Machine Learning Studio還提供了涵蓋描述性、診斷性、預測性和規定性分析類型的全面功能。微軟公司正在繼續擴展Azure機器學習中的功能和能力,這包括通過Microsoft認知工具包(以前稱為CNTK)以及神經網絡的聯合ONNX開放標準來促進深度學習。微軟公司還計劃在Azure機器學習平臺內自動化越來越多的功能。
(6)RapidMiner
RapidMiner提供了數據準備、機器學習和模型部署工具,可以深入了解數據。它提供了一個設計用于處理各種大數據和分析需求的平臺。
在機器學習領域,該公司已成為一個重量級廠商。它提供了一個簡單易用的可視化環境,其中包含自動化模型創建以及有關哪種方法最適合特定情況的建議、指南和信息。RapidMiner的功能和高度的靈活性使其成為機器學習解決方案中的一個熱門選擇。
數據科學家和非數據科學家都可以輕松地檢查和定制項目,并在其結果基礎上進行構建。 RapidMiner在Gartner MQ和Forrester Wave中被評為“領導者”。它是Gartner Peer Insights中評價最高的數據和機器學習解決方案之一。
(7)SAP Leonardo
Leonardo是各種SAP數據產品和服務的保護傘。它通過云平臺整合人工智能和機器學習。這包括一個機器學習基礎,允許開發人員、數據科學家和其他人創建、運行和部署算法和機器學習應用程序。
該技術從文本、圖像、自然語言和其他媒體中提取數據,生成基于計算機的預測。高度可擴展的平臺包括預先定義的和預先培訓的機器學習服務,但它還包含TensorFlow模型。這允許用戶采用一個靈活的框架來培訓和調整機器學習。Forrester公司將SAP列為整體預測分析和機器學習類別中的一個“強勁表現者”,并將服務的廣度和深度列為一個優勢。
然而,Gartner公司認為該公司在其魔力象限(MQ)是一個“利基廠商”。它指出SAP在數據和機器學習領域取得了相當大的進步,但在功能和功能方面仍然落后于其他領域。
(8)SAS可視化數據挖掘和機器學習
作為數據挖掘和分析領域的先驅,SAS已成為機器學習供應商的首選。它提供了可視化數據挖掘和機器學習(VDMML),它在Forrester Wave中稱為杰出的“領導者”,排名第一,并且作為Gartner公司魔力象限(MQ)中是一個頂級“領導者”,但Gartner公司指出,其整個平臺在視覺和執行能力方面已經失去了一些優勢。
可視化數據挖掘和機器學習(VDMML)連接到許多其他產品和數據源。Forrester公司指出,SAS已成為第一個真正的多模式PAML解決方案。它使用向導自動訓練模型,將其轉換為代碼并插入集成功能,以實現自動化機器學習。統一環境還包括用于創建模型的強大可視化工具以及深度神經網絡。
此外,數據科學家可以將代碼片段直接嵌入到SAS程序中,以進一步增強功能,其中包括機器學習和深度學習輸出。
數據科學和機器學習供應商一覽:
供應商和功能 |
Alteryx |
AWS SageMaker |
Google Machine Learning Engine |
IBM Watson Studio |
Microsoft Azure Machine Learning |
RapidMiner |
SAP Leonardo |
機器學習焦點 |
分析和機器學習平臺,允許用戶在單個工作流中構建模型 |
托管平臺可大規模運行機器學習培訓作業和預測。 |
托管平臺,可大規模運行機器學習培訓作業和預測。 |
廣泛的數據科學關注云計算和桌面機器學習平臺。 |
在托管的Azure云上運行的自動化機器學習平臺。 |
高度自動化的機器學習平臺適用于旨在廣泛使用機器學習的公司。 |
廣泛而深入的數據科學和機器學習平臺。 |
主要特點和功能 |
提供250多種免代碼預構建工具,并支持開源工具和腳本。 |
零設置集成Jupyter創作記事本實例。 訪問豐富的開源框架和工具。 |
CPU,GPU和TPU的自動資源配置和監視。 對工具和腳本語言的強大開源支持。 |
強大的視覺識別和自然分類工具。 采用開源工具的靈活方法。連接到IBM SPSS Modeler |
強大的描述性、診斷性、預測性和規范性分析工具和功能。 對開源機器學習工具和腳本的強大支持。 |
提供超過1,500種機器學習和數據準備功能,并支持40多種文件類型。連接到Amazon S3和Dropbox。 |
完全支持BYOM方法。 強大的開源集成。 在SAP的HANA公共云中運行。 |
用戶
評論 |
簡單性和可用性的高評級。 有關缺乏強大的報告和可視化功能的投訴。 |
基于ML筆記本實例和消耗的云資源的復雜分層定價模型。 |
功能和集成的高評級。 |
高度評價特性和功能。 一些投訴主要是使用記事本。 |
Gartner Peer Review的評級很高。 一些關于支持的抱怨。 |
雖然有人抱怨缺乏GPU支持,但用戶將其描述為強大且“革命性”。 |
客戶對SAP的可用性和性能給予高分。一些人抱怨外部數據缺乏可視化工具。 |
定價和許可 |
基于所用產品的分層系統。 每個座位每年5,195美元到33,800美元不等。 |
基于機器學習記事本實例和消耗的云資源的復雜分層定價模型。 |
基于資源和使用的培訓時間。 各種服務范圍從每小時1美分到每小時31美元不等。 |
分層模型從每用戶每月99美元到每個用戶每月6,000美元或更多在企業級別。 |
基于用戶和使用情況的分層定價。 每個用戶每年從近零到幾萬的范圍。 |
分層定價從每位用戶每年2,500美元到每位用戶每年10,000美元以上。 |
基于云中消耗的節點小時數的分層模型。 賬單的收費標準為7.25歐元。 |