在2016年,是數據準備和分析突破的一年。 采用自助式分析解決方案的速度飛快發展起來,因為業務用戶需要能夠分析數據而不必再依賴IT。 自助數據準備工具也經歷了快速增長,因為越來越多的數據用戶意識到這項技術可以通過快速找到并訪問來自任何來源的數據來節省他們巨大的時間,預算和資源,然后準備在幾分之一的時間內進行分析它使用電子表格和其他手動強化措施。 而這一趨勢將繼續擴大到2017年,事實上,巨大的機會在前面。 我們將繼續看到盡可能多的創新,這些創新將持續改變數據科學家,數據分析師和業務用戶如何利用洞察力來實現企業價值并改進運營流程。
數據準備和分析領域在2016年取得了巨大的增長,包括自助服務工具的興起。 那么明年的空間會怎樣?
數據社會化將成為大事
自助服務分析無意中致使許多公司的數據格局變得像狂野西部。 數據現在分布在整個組織中,并且經常被孤立地管理。 數據和分析結果沒有被共享和重用,相反,用戶沒有體會到重復數據建模的好處,而是需要從頭開始進行每個項目的分析。 此外,由于分布式架構,IT部門在管理和保護這些信息方面還處于掙扎之中。
自助數據準備服務將徹底變革
這種變革性的新功能將傳統的自助服務數據準備優勢與社交媒體平臺常見的關鍵屬性相結合,使數據科學家,業務分析師甚至公司的新手業務用戶都能夠搜索,共享和重用準備好的管理數據,從而更好的進行商業決策。 公司將通過使用集中的,具有合規性的,獲批準的數據源,進行更安心的數據治理。
認證的數據集將升級
因為數據分布在整個組織中,用戶經常在隔離中工作,所以信息變得不可控和不可預測。 信息治理不善會增加安全性和合規性風險,并導致較差的數據質量。 因此,數據分析師和業務用戶經常不信任其來源,并且缺乏對數據準確性,及時性和有效性的信心。
數據湖將變得不那么重要
許多公司已經嘗試在中央存儲器實現數據湖,但是該方法已經證明很大程度上不成功。 數據用戶通常難以找到并訪問正確的數據進行分析。 在2017年,我們將看到由IT和數據分析師創建的認證數據集的興起,它驗證了不同來源的分組,并允許業務用戶輕松訪問。 跨部門共享這些經過認證的數據集將確保數據質量,增強對數據,分析流程和結果的信任。
數據質量和數據準備將開始融合
數據質量和數據準備現在是兩個單獨、不同的功能。 但隨著他們的發展,數據準備解決方案現在已經融入了許多數據質量能力,而數據質量供應商正在解決數據準備問題。 在2017年,數據質量和數據準備將趨于一致,組織將更好地了解如何實施兩者的功能以獲得最佳的分析結果。
物聯網數據將推動時間序列數據庫的需求
越來越多的公司開始使用互聯網的物聯網數據來進行分析。 但是他們發現,將這些信息放到沒有能力有效地分析來自物聯網設備的數據的存儲庫中不再有效。 由于物聯網設備及其生產的實時數據,明年我們將看到對時間序列數據庫的需求以及實時數據準備功能的上升。
機器學習將產生更多的智能數據
機器學習或算法分析是在數據被清理,準備和分析之前對數據進行應用智能,從而產生更好的數據集。 通過使用智能數據,用戶可以洞察其他人做了什么,以及它如何補充其他數據集,以提高分析過程。在新的一年里,我們將看到更多的組織利用智能數據進行分析和改進操作流程。
高級分析將變得更加普遍
高級分析的過程在傳統上往往被委托給數據科學家。 但更多的供應商正在將高級分析功能添加到他們的解決方案中,使業務用戶能夠處理這一過程以獲得預測性的洞察力。 在2017年,我們將看到高級分析從新穎性轉變為驅動公司運營的核心能力。
虛擬化和云計算將至高無上
數據虛擬化將成為更受歡迎的分析處理。 這是個充滿希望的技術。 它降低成本,因為組織不需要創建倉庫; 它有助于實時分析,因為數據不需要移動; 并提高敏捷性,使用戶能夠更快地分析更多來源。
數據虛擬化將獲得綠燈
數據虛擬化在過去的幾年間存在著多重阻礙,致使其不被用于分析。 雖然挑戰仍然存在,但是我們將在2017年再次對這項技術感興趣,主要是由于供應商將數據虛擬化與數據準備相結合,創建了一種以較低成本提供自助服務敏捷性的信息架構。 在云計算中,我們將看到該技術的突出程度將在2017年達到了一個全新的水平,與本地系統相比,更多的數據訪問和存儲將基于云的數據倉庫。