對GenAI的炒作主導了2023年,GenAI并不是影響2024年數據操作的唯一趨勢。隨著數據繼續成為業務運營、分析、機器學習和AI的核心要素,對改善數據可見性和治理的需求正在增加。
2022年以來的幾個數據管理趨勢在2023年繼續發展,包括向云數據湖和數據湖屋架構的轉變。宏觀經濟狀況——包括通貨膨脹——繼續給試圖最大化其潛在數據價值的組織帶來壓力。盡管經濟面臨挑戰,一些供應商也能夠籌集到資金,盡管2023年的融資額與2021年和2022年的數字相比相形見絀。
GenAI主導數據
就像在IT和其他行業一樣,GenAI成為數據管理的主導趨勢也就不足為奇了。
2023年,幾乎每個主要的數據庫和數據平臺供應商都有某種形式的GenAI新聞,一些供應商包括GenAI作為助手的工具,幫助用戶執行不同的任務。長期以來,管理數據平臺和編寫不同類型的數據查詢一直是一項復雜的工作,GenAI簡化了這一工作。
在眾多集成了某種形式的AI助手的供應商中,Dremio在6月份推出了其文本到SQL AI支持的工具,使用戶能夠更輕松地生成SQL查詢。今年8月,Couchbase發布了Capella IQ,這是一款幫助開發人員編寫數據庫應用程序代碼的生成式AI工具。同樣在8月份,SnapLogic推出了SnapGPT AI工具,幫助用戶使用自然語言構建數據管道。Alation在10月份宣布了其Allie AI工具,以幫助提高其數據目錄和治理工具套件的生產率。
除了集成AI支持的助手外,數據庫供應商還添加了新的功能,以幫助啟用大型語言模型(LLM)。LLM通常通過提供矢量數據庫類型的功能,充當檢索增強生成(RAG)的知識庫,這些功能通常涉及支持將向量嵌入為一種數據類型,并提供向量搜索功能。許多數據庫供應商在2023年增加了對矢量搜索的支持,包括Rockset、Neo4j、Oracle數據庫23c、MongoDB和SingleStore。
數據倉庫勢頭繼續增強
越來越流行的數據倉庫——用作數據湖的云對象存儲——擁有類似于數據倉庫的數據分析用途。
數據庫公司在2020年率先提出了數據倉庫的基本概念,自那以來,其他公司也紛紛進入市場。數據庫在2023年通過多次更新推動了數據湖的努力,其中最引人注目的是6月份發布的Delta Lake 3.0。Delta Lake是與Apache Iceberg和Apache Hudi并駕齊驅的三大開源數據湖表格式之一。
為了幫助限制三種開源數據湖表格式的潛在混淆和鎖定風險,OneTable開源項目宣布了一個跨Hudi、Delta Lake和Iceberg的可互操作的元數據層。Apache Hudi供應商One House在谷歌和微軟的支持下創辦了OneTable。
甲骨文在7月份推出了MySQL HeatWave服務,從而加入了湖屋行動。MySQL HeatWave是一項將操作和分析數據庫功能結合為一個融合數據庫的服務,這是另一個總體上變得強勁的趨勢。
數據治理和可見性仍然是重中之重
無論是AI、數據運營還是分析,數據治理的話題都變得越來越重要。
能夠了解數據從何而來,如何使其可用和使用,對于安全性、保密性、準確性和可靠性都很重要。在2023年期間,多家供應商擴展和增強了數據治理功能,以幫助管理數據。
出于加強數據治理的需要,Informatica在6月份收購了初創公司Privitar,以幫助提高這家云數據平臺供應商的能力。ColLibra對其數據質量、譜系和發現能力進行了改進。
去年11月,StarBurst使用自動化數據治理更新了Galaxy云服務,部分由GenAI提供支持。
具備可見性是能夠有效管理和治理數據的一部分。隨著GenAI和矢量數據庫在2023年的興起,觀察和管理用于AI的數據的能力在未來變得越來越重要。11月,Monte Carlo推出了專門針對矢量數據庫的新的數據可見性功能。
投資融資放緩
衡量數據管理行業健康狀況的眾多指標之一是新興供應商的融資活動速度。
盡管融資活動的數量少于過去兩年,但在整個2023年,幾家數據平臺供應商獲得了幾輪重大融資,以推動擴張和創新。
今年年初,InfluxDB時間序列數據庫的創建者InfluxData在2月份的一輪融資中獲得了8100萬美元,該公司在4月份發布了InfluxDB 3.0,并為私有云和內部部署環境提供了包括InfluxDB在內的新部署選項。
One House在2月份籌集了2500萬美元,通過其OneTable努力促進數據倉庫的互操作性。Databricks在9月份籌集了5億美元,并計劃將這筆資金用于專注于GenAI的研發,以及地理增長。Databricks推出了新的工具,用于構建由客戶自己的數據支持的GenAI應用程序,例如矢量搜索和RAG管道。
同樣在9月份,Denodo從私募股權公司TPG Growth獲得了3.36億美元的股權投資。Denodo最近添加了新的數據治理功能,包括數據沿襲,并推出了一個免費層來接觸新用戶。
在2024年及以后,數據管理應該仍然是數據分析、運營和AI努力的基礎。GenAI進一步整合到數據平臺中,包括數據倉庫的努力,對于供應商和用戶來說,都有理由提高效率,以更少的努力完成更多的工作。
企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。