調研機構Gartner公司將數據科學和機器學習平臺定義為“具有凝聚力的軟件應用程序,它提供了創建多種數據科學解決方案以及將這些解決方案合并到業務流程、周圍基礎設施和產品中所必需的基本構建塊的混合體。”
這樣的平臺支持數據科學家在整個數據和分析管道中執行任務。這些任務包括與數據訪問和接收、數據準備、交互式探索和可視化、功能工程、高級建模、測試、培訓、部署和性能工程相關的任務。考慮到這一點,Gartner公司發布了一份魔力象限報告,其中介紹了數據科學和機器學習這一領域的16個領先廠商和平臺。
領導者
Gartner公司分析師寫道:“魔力象限中的領導者在數據科學和機器學習市場中擁有強大的影響力和重要的知識分享能力。他們在整個探索、模型開發和實施過程中展示了深度和廣度的優勢。在提供出色服務和支持的同時,領導者也能靈活應對瞬息萬變的市場環境。熟練使用領導者平臺的數據科學家專業人員數量巨大并且不斷增長。領導者在影響市場增長和方向方面處于最有利的地位。它們涉及所有行業、地理位置、數據域和用例,因此,對該市場有著扎實的理解和戰略。他們不僅能夠根據當前的市場條件,專注于有效地執行,而且他們還擁有堅實和強大的路線圖,以利用這一快速轉型行業的新發展和先進技術。他們提供思想領導和創新差異化,經常在實施過程中顛覆市場。”
(1)Alteryx公司
Alteryx公司總部位于加利福尼亞州歐文市。Gartner公司分析師表示,“Alteryx公司提供統一的機器學習平臺Alteryx Analytics,使公民數據科學家能夠在單一工作流程中構建模型。2017年中期,Alteryx公司收購了專注于模型部署和管理的數據科學供應商Yhat公司。Alteryx公司于2017年初在紐約證券交易所發行首次公開募股(IPO),加強了其投資擴展和增強其平臺的能力。Alteryx公司已經從挑戰者象限發展到領導者象限。這得益于強大的執行力(在收入增長和客戶獲取方面),其具有令人印象深刻的客戶滿意度,以及專注于幫助組織灌輸數據和分析文化。”
(2)H20.ai公司
H2O.ai公司總部位于加州山景城。Gartner公司分析師表示,“H2O.ai公司提供了一個開源的機器學習平臺,對于這個魔力象限,我們評估了核心組件H2O Flow,H2O Steam;用于Spark集成H2O Sparkling Water;以及提供深度學習能力的H2O Deep Water。H2O.ai已從先前魔力象限的夢想者發展為領導者。它通過重大的商業擴張繼續取得進展,并鞏固了其作為思想領袖和創新者的地位。”
(3)KNIME公司
KNIME公司總部位于瑞士蘇黎世。Gartner公司表示,“KNIME公司提供完全開源的KNIME分析平臺,全球有超過100,000人使用。KNIME提供商業支持和商業擴展,以促進企業部署的協作、安全性和性能。在過去的一年中,KNIME公司為AWS和Microsoft Azure引入了其云平臺版本,更加注重數據質量,擴展了其深度學習功能,并將其部分商業功能轉換為開源。KNIME正在加速其產品開發和客戶獲取工作。KNIME的平臺被大多數行業和世界上大多數地區使用。該供應商展示了對市場的深刻理解,強大的產品戰略和所有用例的優勢。這些屬性共同鞏固了其作為領導者的地位。”
(4)RapidMiner公司
RapidMiner公司總部位于馬薩諸塞州波士頓。Gartner公司分析師表示,“RapidMiner公司的平臺包括RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。RapidMiner Studio是模型開發工具,提供免費版和商業版;它的價格取決于邏輯處理器的數量和模型使用的數據量。通過采用免費版,客戶可以獲得一個邏輯處理器和10,000行數據。 RapidMiner Server旨在共享、協作和維護模型。RapidMiner Radoop將RapidMiner的執行直接擴展到Hadoop環境中。RapidMiner公司仍然是一個領導者,為全方位的數據科學家和數據科學團隊提供全面且易于使用的平臺。RapidMiner通過引入新的生產力和性能能力,繼續強調核心數據科學以及模型開發和執行的速度。”
(5)SAS公司
SAS公司總部位于北卡羅來納州卡里市。Gartner公司分析師表示,“SAS公司為分析和數據科學提供了許多軟件產品。對于這個Magic Quadrant,我們評估了SAS Enterprise Miner(EM)和SAS Visual Analytics產品套件,其中包括Visual Statistics和Visual Data Mining以及Machine Learning。SAS仍然是領導者,但在視覺完整性和執行能力方面已經失去了一些基礎。Visual Analytics套件因其Viya云就緒架構而顯示出發展前景,該架構比以前的SAS架構更加開放,并且使得廣泛的用戶更容易訪問分析。然而,其令人困惑的多產品策略影響了SAS的視覺完整性,并且高許可成本的感知削弱了其執行能力。隨著市場焦點轉向開源軟件和靈活性,SAS公司提供有凝聚力的開放平臺的速度緩慢,并已經為此付出了代價。”
挑戰者
Gartner公司分析師表示,“挑戰者擁有穩固的存在、可信度、可行性和強大的產品能力。然而,他們可能不會像領導者那樣展示思想領導力和創新能力。挑戰者主要有兩種類型。長期建立的數據科學和機器學習供應商,因其穩定性、可預測性和長期客戶關系而取得成功。他們需要振興發展愿景,以便與市場發展保持同步,并變得更具影響力和創新性。如果他們繼續做一直在做的事情,其業務增長和市場存在可能會受到損害。在相關市場中建立良好基礎的供應商,正在進入數據科學和機器學習市場,其解決方案可擴展現有客戶的現有平臺,但對許多潛在新客戶而言也是合理的選擇。由于這些供應商證明他們可以影響這個市場,并提供明確的方向和愿景,他們可能會發展成領導者。”
(1)MathWorks公司
MathWorks公司是一家總部位于馬薩諸塞州內蒂克的私營公司。Gartner公司分析師表示,“Mathwork的兩個主要產品是MATLAB和Simulink,但只有MATLAB符合此魔力象限的入選標準。MathWorks公司仍然是挑戰者。它的執行能力得益于其在一般高級分析領域的持續可見性,重要的安裝基礎和強大的客戶關系,但受到參考客戶對關鍵能力的平均分數的影響。其完整的愿景受限于其對工程和高端財務用例的關注。”
(2)TIBCO Software公司
TIBCO Software公司位于加利福尼亞州的帕洛阿爾托。Gartner公司分析師表示,“基于其在分析和商務智能領域的地位,TIBCO公司于2017年6月從Quest Software收購了成熟的Statistica平臺,進入了數據科學和機器學習市場。此外,2017年11月,TIBCO宣布收購Alpine Data,這是之前魔力象限的遠見者。在執行能力方面,此魔力象限僅評估TIBCO公司在Statistica平臺上的能力。 TIBCO的其他收購僅對其完整性有所貢獻。 TIBCO作為挑戰者進入這個魔力象限。Statistica平臺擁有龐大而成熟的客戶群,并在三個最典型的用例中獲得高分:業務探索、高級原型設計和生產改進。”
遠見者
Gartner公司表示,“遠見者通常是規模較小的供應商或代表正在塑造或有可能影響市場的趨勢的新進入者。然而,可能會擔心這些供應商能夠有效地繼續執行并隨著他們的成長而擴展。它們通常在市場上并不為人所知,因此相對于挑戰者和領導者而言,它們的領導力往往較低。遠見者有強烈的愿景和支持路線圖。他們在解決市場需求方面具有創新精神。雖然他們提供的功能通常具有創新性和可靠性,但在產品的完整性和廣度上往往存在差距。”
遠見者值得考慮,因為他們可能:
•提供啟動創新計劃的機會。
•提供一些引人注目的差異化功能,作為現有解決方案的補充或替代,并提供競爭優勢。
•更容易受到產品路線圖和方法的影響。
(1)Databricks公司
Databricks公司總部位于加利福尼亞州舊金山。Gartner公司分析師表示,“Databricks公司在云中提供基于Apache Spark的Databricks統一分析平臺。除Spark外,它還為Amazon Web Services(AWS)提供安全性、可靠性、操作性、性能和實時支持的專有功能。Databricks公司于2017年11月宣布推出一款Microsoft Azure Databricks平臺,該平臺未在此魔力象限中考慮,因為它在評估時通常不可用。Databricks公司是這個魔力象限的新進入者。作為遠見者,它利用開源社區和自己的Spark專業知識,提供一個易于訪問且熟悉的平臺。除數據科學和機器學習外,Databricks公司還專注于數據工程。2017年D輪融資額為1.4億美元,為Databricks公司提供了大量資源,可以擴展其部署選項并實現其愿景。”
(2)Dataiku
Dataiku公司總部位于紐約市,在法國巴黎設有總部。Gartner分析師表示,“Dataiku公司提供的數據科學工作室(DSS)專注于跨學科協作和易用性,通過使用戶能夠快速啟動機器學習項目,Dataiku仍然是一個遠見者,并且是許多數據科學需求的熱門選擇。它的完整性愿景是由于其合作和開源支持,這也是其產品路線圖的重點。由于用例方面的廣度相對較差以及自動化和數據流的不足,其整體視覺分數低于之前的魔力象限。由于操作和擴展機器學習模型的一些困難,Dataiku公司的執行能力也有所下降。”
(3)Domino公司
Domino公司(Domino Data Lab)總部位于加利福尼亞州舊金山。Gartner公司分析師表示,“Domino公司提供了Domino數據科學平臺。這是專家數據科學團隊的端到端解決方案。該平臺專注于集成開源和專有工具生態系統的工具,協作、可重復性以及模型開發和部署的集中化。Domino公司成立于2013年,是該市場知名廠商,并繼續在數據科學家中獲得知名度。Domino公司堅持其作為遠見者的地位。它的執行能力雖然得到了改進,但在機器學習生命周期(數據訪問、數據準備、數據探索和可視化)開始時功能較弱仍然受到阻礙。然而,在過去一年中,多米諾已經證明了在競爭激烈的市場中贏得新用戶并獲得領導力的能力。”
(4)IBM公司
IBM公司總部位于紐約阿蒙克。Gartner分析師表示,“IBM提供了許多分析解決方案。對于這個魔力象限,我們評估了SPSS,其中包括SPSS Modeler和SPSS Statistics。數據科學體驗(DSX)是第二個數據科學和機器學習產品,不符合我們對執行能力軸的評估標準,但確實有助于IBM的完整性。IBM現在是一個遠見者,相對于其他供應商而言,在遠見者的完整性和執行能力方面已經失去了優勢。然而,IBM公司的DSX產品有可能激發更全面和創新的愿景。IBM公司已宣布計劃在2018年為其SPSS產品提供新接口,該接口將SPSS Modeler完全集成到DSX中。”
(5)微軟公司
微軟公司總部位于華盛頓州雷德蒙市。Gartner公司分析師表示,“微軟為數據科學和機器學習提供了許多軟件產品。在云端,它提供Azure機器學習(包括Azure機器學習工作室),Azure數據工廠、Azure流分析、Azure HDInsight、Azure數據湖和Power BI。對于本地工作負載,微軟公司提供帶有機器學習服務的SQL Server,該服務于2017年9月發布。在此魔力象限的截止日期之后。只有Azure機器學習工作室符合此魔力象限的納入標準,盡管微軟公司具有更廣泛的高級分析產品確實影響了我們對其完整性的評估。但微軟公司仍然是一個遠見者。它獲得這個地位主要是因為其市場響應能力和產品可行性得分較低,因為Azure機器學習工作室的純云特性限制了它在許多需要內部部署選項的高級分析用例中的可用性。”
利基企業
Gartner公司分析師解釋說:“利基公司在特定行業或方法中表現出優勢,或與特定技術堆棧完美結合。一些利基公司表現出一定程度的遠見,這表明他們有可能成為遠見者。然而,相對于市場上的其他公司,他們往往難以讓自己的愿景引人注目,也可能在努力創造創新和思想領導的歷史記錄,從而使他們成為遠見者。如果其他利基企業繼續以增強其在市場中的勢頭和吸引力的方式執行任務,他們可能會成為挑戰者。”
(1)Anaconda公司
Anaconda公司前身為Continuum Analytics,該公司總部位于德克薩斯州奧斯汀市。Gartner分析師解釋說,“Anaconda公司銷售Anaconda Enterprise 5.0,這是一個基于交互式筆記本概念的開源開發環境。它還提供了一個松散耦合的分發環境,可以訪問各種開源開發環境和開源庫,主要是基于Python。Anaconda公司的優勢在于它能夠聯合并為大量不斷構建機器學習功能的Python開發人員提供中央訪問點。然而,Anaconda公司對這些開發人員在質量、可靠性和可持續性方面的努力幾乎沒有控制權。 Anaconda通過Anaconda Cloud培育廣泛的開發者社區。Anaconda作為利基公司的地位反映了它對于熟練掌握Python的經驗豐富的數據科學家的適用性。”
(2)Angoss公司
總部位于加拿大多倫多的Angoss公司于2018年1月被Datawatch公司收購。Gartner公司分析師表示,“由于收購的延遲,相對于魔力象限流程,以及不確定的影響,它在文檔中的名稱仍為Angoss公司。此評估涵蓋以下產品:該公司最基本的產品KnowledgeSEEKER,主要針對桌面環境中的公民數據科學家;KnowledgeSTUDIO,包含比KnowledgeSEEKER更多的模型和功能;以及新推出的KnowledgeENTERPRISE,這是一款包含全系列功能的旗艦產品。 Angoss公司與銀行客戶有著長期的合作經驗。這有助于向銀行業和其他具有類似數據和分析需求的行業提供服務,例如保險、運輸和公用事業。”
(3)SAP公司
SAP總部位于德國瓦爾多夫。Gartner公司分析師表示,“SAP公司再次將其平臺重新命名為:SAP Business Objects Predictive Analytics。該平臺具有許多組件,例如用于數據集準備和特征工程的Data Manager,用于公民數據科學家的Automated Modeler,用于更復雜機器學習的Predictive Composer以及用于操作的Predictive Factory。SAP Leonardo機器學習和SAP Leonardo生態系統的其他組件對SAP在此魔力象限中的執行能力沒有貢獻。在過去的一年中,SAP公司在幾個方面取得了很好的進展,但在其他方面仍然落后。它是一個利基企業,因為相對于其他公司來說,其客戶滿意度低,缺乏思想共享。”
(4)Teradata公司
Teradata公司總部位于加利福尼亞州圣地亞哥。Gartner公司分析師表示,“Teradata公司統一數據架構(UDA)是一個企業分析生態系統,它結合了開源和商業技術,提供分析功能。UDA包括Aster Analytics、Teradata數據庫、Hadoop和數據管理工具。盡管Teradata公司具有強大的運營能力,但它仍然缺乏統一的端到端技術平臺。Teradata公司保持了其內在的性能和可靠性優勢,但其在數據科學開發方面缺乏凝聚力和易用性,削弱了其執行能力和在視覺完整性方面取得的進展。它仍然是一個利基企業。”