2023 年已經到來,企業極為重視這一年。從初創企業到大型企業集團,每家公司都肩負著同樣的使命進入新的一年,即通過提高運營效率、生產效率和韌性來推動增長。
由于在完成這一使命過程中數據發揮著關鍵作用,一些優秀的行業專家和供應商就未來幾個月數據領域如何發展分享了自己的預測。
1. 首席信息官們將開始整合數據和簡化架構
“在與其他首席信息官交談時,我注意到,企業正在呈指數級發展,但沒有制定計劃來組織自己的數據。當一個公司考慮全力以赴擴大規模,卻不對適合自己的技術進行投入以支持這種業務增長時,就會出現問題。”
“問題之一是,如今的首席信息官不得不管理太多的系統。過多彼此脫節的數據庫會導致數據重復、孤立和被鎖住,這不僅為管理和分析工作帶來更高的時間和其他成本,而且還會導致產生安全問題。”
“對于一家公司來說,要真正推進數字化轉型,他們需要將數據科學和數據分析相結合,并應從單一且可靠的來源提取數據。我們將看到更多的首席信息官會削減在供應商方面的開支,以簡化自身的數據架構。對于那些已采用事后分析和預測分析架構來制定高效和智能解決方案的公司,他們最終將得到成功發展。”
- Databricks 公司首席信息官——Naveen Zutshi
2. 更廣泛地使用數據合約
“為防止數據生成服務發生意外改變導致上游出現數據質量問題,數據合約變得非常受歡迎。為什么?由于軟件工程師做出了一些更改,而無意中通過一些可影響下游數據管道的升級過程帶來某些結果,并導致數據建模的興起,(這些結果讓)數據工程師可選擇預先建模,然后將數據交付到數據倉庫。2023 年,隨著從業者嘗試使用這些框架,我們將看到人們更廣泛地使用數據合約。”
-Monte Carlo 公司聯合創始人兼首席技術官 (CTO)——Lior Gavish
3. 可用性將是 2023 年的致勝關鍵
“近年來,我們學到的一個經驗是,服務中斷可能會對企業造成嚴重影響。在 2023 年,可用性將是區分贏家和輸家的秘密武器。企業需要避免被鎖定,同時要擁有擴大業務規模的靈活性。通過使其云環境多樣化,企業將最大限度地減少服務中斷對其業務持續運營能力的影響。”
- MariaDB 公司產品經理——Patrick Bossman
4. 2023 年將是數據應用程序之年
“在過去的十年里,我們看到了 web 應用程序和手機應用程序的崛起,但 2023年是數據應用程序之年。隨著企業尋求新的解決方案來改善面向客戶的應用程序和內部業務運營,可靠且高效的數據應用程序將是企業成功的關鍵工具。隨著像Uber、Lyft 和 Doordash 等按需數據應用程序觸手可及,對于客戶來說,沒有什么比陷入對一個應用程序的漫長等待和一個請求沒有得到回應更糟糕的了。在實時分析技術的支持下,我們將看到數據應用程序承受越來越大的壓力,其不僅要做到實時響應,而且要做到無故障。”
- Rockset 公司聯合創始人兼首席技術官——Dhruba Borthakur
5. 數據處理協議 (DPA) 的興起
“企業如何在內部系統中處理數據,歷來是一個受到嚴格管控的過程,需要周密的設計和使用大量的保護措施。然而,當我們使用如今的 SaaS 數據基礎設施時,跨部門、跨地區和跨公司進行數據共享和訪問變得前所未有的簡單。考慮到這一點,以及由于數據本地化/主權法規的不斷完善,與如何訪問、處理和報告數據使用情況的相關規則需要通過合同協議(也稱為數據處理協議)來界定。”
“在 2023 年,我們將看到數據處理協議成為 SaaS 合同和數據共享談判的一個標準要素。企業如何處理這些合同將從根本上改變他們構建數據基礎設施的方式,并將定義其數據的商業價值。因此,在 2023 年及以后,完全接受數據處理協議將給數據主管們帶來最大利益。這些文件將非常冗長且復雜,但數據處理協議的數字化和法律團隊的參與將使這些文件更容易理解和實施。”
- Immuta 公司聯合創始人兼首席執行官——馬特·卡羅爾 (Matt Carroll)
6. 無副本的數據交換將占主導地位
“2023 年,隨著數據共享業務持續增加,以及數據和 IT 團隊疲于應對這方面的業務增長,無副本數據交換將成為新的標準。隨著企業將其現代數據堆棧產品化,數據集的大小和數量將出現爆炸性增長。在數據分享之前先進行復制,已不再可行。在 2023 年,企業將涌向成熟的平臺(如 Snowflake 公司的數據交換平臺和 Databricks 公司的 Delta Sharing 協議),以更容易地共享數據和利用數據盈利。”
- Immuta 公司聯合創始人兼首席執行官——馬特·卡羅爾 (Matt Carroll)
7. 用于非結構化數據管理的人工智能自動化將獲得關注
“隨著自適應機器學習和人工智能自動化技術可以合理地引導完成數據放置、生命周期管理、搜索和移動操作,文件和對象數據的管理正變得日益復雜。解決方案可根據客戶的成本狀況、數據狀況和目標配置進行調整,并隨著時間的推移了解更多情況以提出更好的建議。例如,人工智能算法可用于主動識別敏感的數據集(如含有與財務文檔相關的擴展名或標簽的文件),這些文件不按照規定進行保存——如保存在首席營銷官的目錄中,而不是保存在首席財務官管理的只讀目錄中。”
- Komprise 公司首席執行官兼聯合創始人——庫馬爾·戈斯瓦米 (Kumar Goswami)
8. 合成數據將加快推進 AI 創新
“2023 年,在加快推進人工智能發展和部署,以及防止出現算法偏見方面,合成數據將成為游戲規則改變者。發展人工智能技術所面臨的一個重大挑戰是獲取適當數量和多樣性的數據來訓練基于機器學習技術的算法。這些算法需要大量的數據,而這些數據代表著使用數據的不同的人以及使用數據的一些背景信息。”
“獲取這種具有廣度和深度的數據非常困難,極為耗時且需付出很高成本。數據合成技術使人工智能公司可以快速增加其現有的數據集,并能模擬在現實環境中難以發生的場景。”
“例如,在汽車行業,合成數據工具可使用駕駛員的一個源圖像,在使用不同光照條件或不同頭部運動情況下,創建一些合成的變化。這些工具甚至可以模擬駕駛員在駕駛過程中睡著的場景,而這些數據在現實生活中很少見,而且非常危險。部署合成數據工具非常重要,其不僅可以解決在數據收集方面所面臨的這些復雜難題,而且還可通過數據集所具有的真正多樣性來防止出現算法偏見。”
- Smart Eye 公司副首席執行官——Rana el Kaliouby 博士
9. 在多云的環境中,對象存儲是主要的存儲方式
“如今,數據庫正趨向于將對象存儲作為其主要的存儲解決方案。這是由性能、可擴展性和開放表格式所推動。開放表格式(Iceberg、Hudi、Delta)興起的一個關鍵優勢是,其允許多個數據庫和分析引擎共存。因此,這又帶來了人們在任何地點都能運行的需求——這恰好非常適合現代的對象存儲。”
“初期的跡象已非常明顯;Snowflake 公司和微軟公司都將在 2023 年底推出外部表功能。如今,企業將能夠針對任何數據庫使用對象存儲,而不再需要將這些對象直接移入數據庫;企業可以就地查詢。”
- MinIO 公司聯合創始人兼首席執行官——Anand Babu Periasamy
10. 數據收集將成為人們關注的焦點
“數據收集是當今業內最大的隱秘之一。2022 年有 144 億個連接點,企業正坐在數據寶藏之上,而沒有真正使用這些數據。人們的想法是,他們能夠在未來以不同于如今的方式來使用這些數據。”
“隨著技術的不斷進步,每條數據也在變得更大。一切東西都變得更加先進,例如更高分辨率的相機、更高質量的麥克風等——所有這些都需要占用大量的空間。我希望企業和消費者都能開始關注他們無意中開始收集的數據。”
- VAST Data 公司創始人兼首席執行官——Renen Hallak
11. “自帶數據庫”(BYODB) 混合云部署的興起
“將某些數據驅動的項目遷移到云端的好處是毋庸置疑的——可以更快的部署,減少基礎設施和維護成本,提供配套的技術支持和服務等級協議 (SLA),以及在需要時可以立即進行業務擴展。然而,總會有一些用例合同要求將數據保存在企業內部,包括工作數據、安全數據、法規遵從信息、本地開發數據和實體隔離硬件(僅舉幾例)。對于現代數據供應商而言,一個更靈活的解決方案是支持‘自帶數據庫’的混合云部署,以及支持更常見的企業內部部署方案和完全托管的云服務方案。”
“這種新方法將在未來幾年內流行起來,其允許數據保存在原地且不被更改,并可遠程連接到位于附近數據中心頂層的 SaaS 服務。這就帶來了云端的所有好處,同時仍對公司的最寶貴資源——數據——擁有完全的主權和控制權。”
- Directus 公司首席執行官兼聯合創始人——本·海恩斯 (Ben Haynes)
12. 管道將變得更復雜
“數據管道是指數據從其原始來源進入數據倉庫的方式。由于存在如此多新的數據類型,以及數據不斷涌入,這些管道不僅變得更為重要,而且可能變得更加復雜。在 2023 年,用戶應期待數據倉庫供應商來提供新的且更好的方法,以提取、轉換、加載、建模、測試和部署數據。供應商在做這方面工作時,應側重于整合和易用性。”
- Ocient 公司首席執行官兼聯合創始人——克里斯·格拉德溫 (Chris Gladwin)
13. 矢量數據庫占據主導地位,釋放非結構化數據的未利用價值
“隨著企業步入人工智能時代,并試圖在生產中充分利用人工智能的優勢,由此,各種形式的非結構化數據大幅飆升,而人們需要了解這些數據。為了應對從非結構化數據中獲取有形價值所面臨的這些挑戰,矢量數據庫(一種新型數據庫管理技術,專門用于處理非結構化數據)正在興起,并將在未來幾年內占據主導地位。”
- Zilliz 公司運營總監——Frank Liu
14. 數據可觀察性將成為一個重要產業
“在如今的經濟形勢下,不斷計算投資回報率,并優先考慮那些花小錢辦大事的方法,這是至關重要的。我相信工程團隊可以精益求精,努力提高公司成功發展的能力。”
“我預測,我們將越來越多地看到工程師和數據團隊成為推動者,通過構建基礎設施和為其他團隊(特別是非技術團隊)高效工作提供所需的工具,使公司能夠基于數據做出決策。他們開啟這種轉變的方式之一是幫助團隊了解如何獨立地訪問他們的數據,而非始終在回答各種問題。我希望數據團隊不要雇傭更多的數據專家,而是要更多地發揮數據工程的作用,以構建可長期使用的基礎設施,使所有業務人員能獨立回答問題。”
- Amplitude 公司工程高級副總裁——Shadi Rostami
關于企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營18個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。