如今的數據格局如果沒有人工智能就不再完整。商業智能領域出現了一個整合浪潮,這引發了一個問題,是否會推出新一代人工智能?混合云現在不再成為大多數企業的抽象術語。
與五年前不同的是,Hadoop不再是分析大數據的唯一途徑。從完整平臺到專門的點服務(如Spark、流媒體、數據轉換、人工智能)都采用了云計算產品。此外,在云中,對象存儲正在成為事實上的數據湖。但是隨著Mapr的衰落以及HortonWorks和Cloudera的合并,仍然有著很好的客戶基礎,至少有兩千個藍籌股客戶,并且絕大多數是內部客戶,他們每年將支付上百萬美元的支持費用。而這些工作負載不會一夜之間轉移到云端。
盡管如此,企業將業務遷移到云端是顯而易見的。Firstmark公司的調查報告與Ovum公司所做的預測一致,2019年,大多數新的大數據工作負載將從云端開始。FirstMark公司期待出現這一點,但也有一些問題。當企業考慮云計算新的戰略工作負載時,有人擔心云供應商的鎖定。混合云得到了行業廠商的關注,而像IBM這樣的基礎設施廠商已經在云計算第一輪發展浪潮中錯過,因此有些廠商希望獲得第二次機會。而Kubernetes并沒有迷失,谷歌開源項目讓用戶更加關注混合云。當然,這也推動了IBM公司以340億美元收購Red Hat,但其舉措遠遠落后于谷歌Anthos產品,該公司重新打包其Kubernetes服務,企業可以在AWS云平臺中運行谷歌云本地工作負載(無需采用谷歌硬件)。
但是人們在采用Kubernetes服務時需要花費時間熟悉和適應,Kubernetes仍然是一塊未經打磨的鉆石,其安全性、負載平衡、服務配置等方面的最佳實踐仍在進行中。盡管如此,FirstMark推測,由于數據科學家或數據工程師希望對他們的環境施加更多的控制,Kubernetes可能會促使他們遠離基于云計算的機器學習服務。機器學習對數據的需求非常旺盛,因此,其關鍵的推動因素或者說障礙,取決于人們的觀點,將是企業在內部存儲或處理所有數據的能力、意愿、成本等等。而專家對Kubernetes的看法是,對于除了最復雜的企業IT組織之外的所有人來說,它將變得過于復雜,盡管像IBM公司或Pivotal公司這樣的第三方的使命是將所有的復雜性隱藏在一個黑盒里。
該報告還研究了復雜分析和機器學習工作負載的無服務器計算的狀態,同樣認為它處在黃金時期還為時尚早。無服務器隨著敏捷開發具有短期流程的應用程序或具有不穩定流量峰值的數據庫而變得流行。無服務器的開發簡單性,讓系統自動調整計算量,對于實現敏捷的開發人員具有吸引力,但是長時間運行的機器學習過程將使無服務器遇到障礙,正如FirstMark公司調查報告所指出的那樣。
另一個痛苦的領域將是數據管理和治理,這個問題與一系列新的和擬議的數據隱私法相結合。對于數據庫和商業智能的經驗豐富的公司和個人來說,這些問題并不新鮮。當企業擁有如此多的數據時,如何找到要查找的內容?數據目錄由Alation和Waterline Data等第三方提供,并內置于像Cloudera這樣的數據平臺。例如,由Google Ventures提供部分支持的Colibra公司最近籌集到1億美元,但同時,并沒有阻止谷歌云計算人員公布他們自己的數據目錄,這些數據目錄與Collibra的數據目錄重疊。但并非所有數據目錄都是平等的。有些是高度協作的工具,它們利用機器學習來抓取和構建查詢以訪問數據,而其他工具則是一些數據字典。
FirstMark公司的調查報告認為,數據沿襲是新興的另一項技術——它應該告訴人們數據來自何處,并提供審計跟蹤,以了解數據是如何被使用的,最好是由誰使用。雖然數據沿襲應該提供單一的真相來源,但面臨的挑戰是,分析工具、數據目錄、數據平臺都在記錄各自對數據沿襲的看法,提供了擁有很多好處的最新示例。
如果不涉及商業領域的最新一輪整合,那么對2019年數據和分析領域的調查就不會完整,谷歌公司收購Looker公司,Salesforce公司兼并Tableau公司, Alteryx公司收購ClearStory Data公司,以及Logi Analyti公司收購Zoomdata公司。與10年前的商業智能整合浪潮相似的是,Business Objects、Cognos和Hyperion分別被SAP、IBM和Oracle收購。FirstMark公司推測市場的兼容并購可能還沒有結束,亞馬遜公司可能考慮收購QuickSight。商業智能的下一波創新將是將作為數字助理的機器學習嵌入到業務分析中,幫助選擇和清理數據。人們可能會在現有工具中看到很多這種創新,例如Tableau公司的Ask Data自然語言查詢,但這也可能是初創企業圍繞自然語言和數字輔助進行設計的動力,而不是對其進行改造。
作為商業智能民主化分析,FirstMark公司將機器學習視為下一個適合市場發展的分析領域。它將市場空間分成幾個部分:第一個是AutoML,它可以自動化開發和生產機器學習模型的大部分工作,受到云計算用戶和第三方(如Data Robot)的關注。第二個是存儲桶,主要是第三方的領域,如Dataiku、RapidMiner和H2O,它添加了大量的協作組件。Firstmark公司的調查報告描繪出這些工具將如何解釋人工智能模型。
FirstMark公司還在水平服務中看到人工智能活動的溫床,例如計算機視覺、自然語言處理、語音到文本,它們正在將數據池的深度學習端商業化。但也提出了一個警告,那就是水平服務敲開了人工通用智能(人工智能越來越接近人類能力)的大門,現在其能力相對有限(他們執行文本翻譯等任務,但實際思考能力有限)。因此,市場處于更加早期的發展狀態。還有一些常規服務,如Amazon Rekognition,以及谷歌聯系中心人工智能等垂直服務的開端。 FirstMark公司注意到自然語言處理(NLP)等基線功能的重大改進。
最終,人工智能的最大收益將嵌入到業務應用程序中。這是SAP Leonardo計劃背后的主要推動力。Leonardo計劃本身不是一種產品或一組產品,但其作用之一是作為一個實驗室,讓SAP從客戶參與中發現生產機會。但Firstmark公司認為這意味著要經歷3~4年的漫長旅程。