數據的意義在于提供洞察力,洞察力的意義在于企業的進一步發展:更低的成本、更高的利潤、更滿意的客戶,以及在某些情況下對緊急威脅下挽救企業生命的響應。良好的數據策略與糟糕的數據策略之間區別在于,粗略地說就是獲得洞察力的時間。也就是,企業從數據分析中得出正確答案、戰略或政策需要多長時間?企業對緊急威脅、中斷或機遇的響應能力如何?
因為數據是現代企業的命脈,它是每個企業的主要戰略資產,可以說比人力資產更重要。迄今為止,現代數據戰略主要關注數據量、獲取數據的速度,但較少關注數據多樣性。人們現在處于一個混合的多云時代,數據環境的激增(即公有云和私有云數量的增長)是提高復雜性的一種強勁的驅動因素。在混合多云世界中,數據管理戰略與業務增長戰略本身越來越難以區分。雖然全球云計算行業三巨頭(AWS、Azure、GCP)對于這個新世界的運作至關重要,但行業專家認為,解決混合多云的數據戰略獨特挑戰的完整解決方案必須來自云計算三巨頭之外。
云計算市場的博弈
如何在混合多云世界中集成數據?不幸的是,很多企業以傳統一貫的方式來做這件事:通過在各種存儲系統之間移動和復制數據——從數據湖到數據倉庫和數據庫之間的云計算應用程序和API等等。但是,可以假設現代數據集成需要在內部部署和云計算、托管數據中心等資產上平等運行,因為85%的企業都在多個云平臺中擁有數據資產。即使是小型企業也可能將數據托管在AWS S3中,并將銷售數據托管在Salesforce云平臺中。
為什么內部部署數據很重要?企業將一切都在轉移到云平臺中,所有的云托管數據不是都已經集成了嗎?先回答第二個問題:云平臺只是別人的數據中心,從來沒有什么神奇的方法可以將所有數據在云平臺上集成。數據的物理協同定位并不意味著數據已經集成并準備好進行分析。那么如何回答第一個問題呢?實際上,一切都沒有轉移到云中。然而,人們越來越意識到,即使大多數數據移動到多個云平臺,重要的問題不是“我們的大部分數據在哪里”,而是“我們在多少個不同的地方擁有數據?”
此外,人們越來越擔心云平臺的整合和三大云計算供應商鎖定,以至于導致“數據遣返”(將數據從云平臺遣返回內部部署設施)是一件越來越重要的事情。例如,考慮一下云計算三巨頭的出口費用和入口費用是根本不對稱的原因。這是一個棘手的問題:云計算三巨頭不收取入口費用,因為一旦他們擁有企業的數據,他們就不會打算放棄。
所有這些都不是特定行業的擔憂;如果是一家大型零售企業的首席信息官,可能會對采用AWS云平臺感到疑慮,因為不確定是否希望其競爭對手AWS公司托管他們的數據。最后,還有對成本的擔憂,即使沒有對云計算供應商鎖定的擔憂。雖然很多企業都喜歡將資本支出轉變為運營支出,但無論資產負債表上有多少變動都無法抵消無休止的成本增長。
那么到目前為止企業需要怎么做?
•必須將數據集成到混合多云世界中,以促進更好的分析。
•將數據包含在多云的任何一個云平臺中,并且數據仍在內部部署設施中,這些數據可能永遠不會遷移到云中。
•數據存在的位置在增加而不是減少;這增加了而不是減少了數據集成的難度。
•在未來。數據同時存在于許多不同的運營環境中,并且對集成或連接這些數據的要求越來越高。
最佳時代的垂直集成堆棧
現在人們已經很好地理解了云計算三巨頭無法在混合多云世界中獲勝的原因。其答案是,這三個巨頭都在最佳的時代運營云原生、垂直集成的堆棧。這意味著與存在于其競爭對手環境中的數據集成永遠不會符合這三家云計算供應商的自身利益,而這樣做是混合多云中數據集成的關鍵挑戰。在跨混合多云連接數據方面,企業的利益與三大巨頭捕獲和保留垂直集成堆棧內(而不是跨垂直集成堆棧)的數據資產的利益之間存在根本性的脫節。
這種脫節是一個大問題,這也是云計算三巨頭無法獲勝的真正原因,以下再進行一下深入了解。由于現代數據棧非常復雜,只考慮三個核心部分:
(1)數據存儲在哪里?
(2)數據在哪里管理和編目?
(3)數據在哪里分析?
企業要從數據中獲得洞察力,需要存儲數據;還需要管理和編目該數據;最后,需要以某種方式將這些數據組合在一起,以便可以對其進行分析以產生洞察力。當然,企業還需要做其他事情,但已經有足夠的細節來說明要點。
因此,云計算三巨頭擁有涵蓋存儲、治理、分析這三個核心要素的垂直集成堆棧,并且他們擁有龐大的數據中心,所以這一切都很好。當然,如果企業的所有數據也都在或者可以駐留在云計算三巨頭的存儲層中,那么一切也很好。但需要記住的是,幾乎每家企業都在許多數據環境(包括內部部署設施)中擁有數據。
這又是云計算三巨頭面臨競爭困境的癥結所在,這一困境由經濟、技術和監管障礙組成。只要有多云,企業就會在很多地方擁有數據。云計算三巨頭將鎖定這些數據資產,因此采用出口和入口的不對稱以及其他策略。但是,企業的數據堆棧越高,就越需要跨越多云,而不僅僅是將其整合到存儲層中。無論數據存儲在哪里,客戶都需要連接數據。云計算三巨頭在經濟和技術上都會受到激勵,以防止這種情況發生。事實上,企業知道多云集成的必要性;而在堆棧的存儲、治理、分析的核心存在多云數據集成問題。
由于分布在多云上的數據、創新的愿望以及尋求避免云計算鎖定成本和威脅的推動,大多數企業都追求采用最佳的IT采購策略。企業的首席信息官希望選擇最佳存儲解決方案、最佳治理或目錄解決方案以及最佳分析解決方案。例如,考慮使用Databricks(或Snowflake)進行標準化存儲的企業;用于治理和編目的Collibra(或Alation);以及用于分析的Tableau(或PowerBI)。
對于企業的首席信息官或首席數據官來說,擺脫這種困境有兩種方法:或者采用云計算三巨頭的垂直整合堆棧,并承擔上述風險,關鍵是忽略其他環境中的數據;或者對存儲治理分析核心采用同類最佳的解決方案,并自行承擔集成負擔。這種困境是可以解決的,但天下并沒有免費的午餐。
出于經濟和監管原因,企業并不期望在這個規模和級別進行合并或收購;云計算三巨頭都難以收購這三方的任何一家。因為這是不可想象的,并且會面臨巨大的監管障礙,即使經濟上是合理的。雖然云計算三巨頭正在開發“堡壘主機”技術,以將他們的云計算環境擴展到客戶的內部部署環境中,這是一個受歡迎的趨勢,可以嘗試想象他們將這些技術相互擴展。很難假設AWS的堆棧在GCP或Azure中可用,反之亦然。
未來將何去何從?
解決以上提出的困境的唯一可行的解??決方案是采用同類最佳的方法并直接解決存儲、治理、分析的集成問題。這為云計算三巨頭之外的數據管理提供商留下了一個清晰而明顯的機會,他們沒有垂直集成的堆棧以避免自我顛覆,取代云計算三巨頭并滿足對混合多云數據集成解決方案的這一未滿足的需求。這是因為這種級別的數據連通性是產生在知識經濟中,具有競爭力所需的數據驅動的洞察力是必需的。
這里的關鍵見解是,企業只能通過轉向數據集成解決方案來避免全棧解決方案的局限性:
(1)將數據集成從存儲移動到計算,即在不移動或復制數據的情況下完全連接數據。
(2)可以同時在內部部署設施和任何云平臺中運行。
云計算三巨頭不會自我顛覆,也不會自己來構建這樣的解決方案,因此,如果希望解決這些問題,那么將由三巨頭之外的供應商、初創公司或供應商聯盟來解決。研究表明,未來20年的數據集成博弈的贏家將是AWS、Azure、GCP以外的市場參與者,這意味著云計算三巨頭無法贏得這場博弈。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。