1.現(xiàn)代化應(yīng)用開發(fā)之難亦是數(shù)據(jù)架構(gòu)創(chuàng)新之難
現(xiàn)代化應(yīng)用對規(guī)模、可用性和性能都提出了更高的要求。
對于現(xiàn)代化應(yīng)用來說,不僅要應(yīng)對劇增的用戶數(shù)量,還要支撐不斷增長的應(yīng)用負(fù)載種類和數(shù)量。這是現(xiàn)代化應(yīng)用開發(fā)面對的第一個難題——更強(qiáng)的可擴(kuò)展性。
以游戲的場景為例,目前排名靠前的國民級游戲日活用戶已經(jīng)超過 1 億多人,未來百萬以上用戶量將成為應(yīng)用程序的常態(tài),我們暢想一下最近大火的元宇宙場景,如果是一個全球級別的元宇宙應(yīng)用,其用戶數(shù)量會是這個數(shù)據(jù)的數(shù)倍,甚至數(shù)十倍,媲美亞馬遜黑色星期五大促銷的高并發(fā)情況將成為日常。所有人都在一個元宇宙進(jìn)行交互的場景,對應(yīng)的后端系統(tǒng)響應(yīng)并發(fā)的要求是極高的。這不是在揣測,而是基于事實(shí)和現(xiàn)狀,對未來的合理預(yù)測。因此首先需要解決的,就是更大規(guī)模并發(fā)問題。
現(xiàn)代化應(yīng)用開發(fā)面對的第二個問題,是如何存儲海量數(shù)據(jù),以及存儲海量數(shù)據(jù)之后,如何對這些數(shù)據(jù)進(jìn)行實(shí)時化和智能化處理。
當(dāng)前數(shù)據(jù)已呈現(xiàn)出“二八定律”:結(jié)構(gòu)化數(shù)據(jù)占 20%,非結(jié)構(gòu)化數(shù)據(jù)占 80%。《微軟飛行模擬器》模擬真實(shí)的山脈、道路、云朵,產(chǎn)生了超過 2.5PB(2.5 x 10^6 GB)的結(jié)構(gòu)化數(shù)據(jù),終極元宇宙所需數(shù)據(jù)量至少比此高出多個數(shù)量級。
根據(jù) IDC 的最新報告,現(xiàn)有數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)占比已超過 90%。隨著新型軟件的增多,非結(jié)構(gòu)化數(shù)據(jù)占比將越來越高。不同格式、不同標(biāo)準(zhǔn)的非結(jié)構(gòu)化數(shù)據(jù)在技術(shù)上比結(jié)構(gòu)化數(shù)據(jù)更難存儲和分析。傳統(tǒng)數(shù)據(jù)架構(gòu)應(yīng)對這樣的海量數(shù)據(jù)將會很吃力。
另外,現(xiàn)代化應(yīng)用還需要考慮性能和延遲的問題。未來,新的現(xiàn)代化應(yīng)用都會以遍布全球的用戶為目標(biāo),這就對延遲有極高的要求。在游戲中,10ms 的延遲都是不可接受的,有些游戲甚至需要內(nèi)存級別的延遲。超強(qiáng)的帶寬、超快的傳輸速度等的實(shí)現(xiàn),需要遍布全球的通信基礎(chǔ)設(shè)施建設(shè)。
需要注意的是,在考慮高并發(fā)和低延遲的同時,還需要兼顧考慮總體質(zhì)量和成本。建立、運(yùn)行和維護(hù)這么大規(guī)模的應(yīng)用需要耗費(fèi)的人力和物力,一般企業(yè)可能難以承受。所以除了質(zhì)量,成本也是需要考慮的問題。
總結(jié)來看,現(xiàn)代化應(yīng)用至少要處理 TB 級、PB 級的結(jié)構(gòu)化數(shù)據(jù)和數(shù)倍于此的非結(jié)構(gòu)化數(shù)據(jù),支持分布在全球的數(shù)百萬用戶,并以極低的延遲每秒處理數(shù)百萬個請求。
對于非結(jié)構(gòu)化數(shù)據(jù),如今很多企業(yè)開始基于 Amazon S3 這類具備 EB 級擴(kuò)展能力的云存儲構(gòu)建云上數(shù)據(jù)湖,并通過云原生數(shù)據(jù)分析處理工具對這些數(shù)據(jù)進(jìn)行處理分析。而對于結(jié)構(gòu)化數(shù)據(jù),還需要彌補(bǔ)以下缺陷:
-
企業(yè)被傳統(tǒng)商業(yè)數(shù)據(jù)庫束縛,而難以開展創(chuàng)新。傳統(tǒng)商業(yè)數(shù)據(jù)庫不僅價格昂貴,還有專有技術(shù)及許可條款,需要經(jīng)常進(jìn)行審計(jì)。雖然越來越多的企業(yè)轉(zhuǎn)向了 MySQL 和 PostgreSQL 等開源數(shù)據(jù)庫,但他們?nèi)孕枰逃脭?shù)據(jù)庫的性能;
-
無法滿足特定場景需求。隨著應(yīng)用場景的不斷增加,不同應(yīng)用程序有了自己特定的需求。現(xiàn)在,開發(fā)人員越來越多地使用微服務(wù)架構(gòu)來構(gòu)建應(yīng)用程序,并且選擇新一代的關(guān)系型和非關(guān)系型數(shù)據(jù)庫。但關(guān)系型數(shù)據(jù)庫的結(jié)構(gòu)數(shù)據(jù)耦合性大,不利于擴(kuò)展分布式部署。非關(guān)系型數(shù)據(jù)庫沒有事務(wù)處理,復(fù)雜查詢方面略微欠缺;
-
傳統(tǒng)數(shù)據(jù)庫運(yùn)維模式仍舊需要耗費(fèi)精力和成本。運(yùn)維耗時但價值輸出較低,但企業(yè)又不得不在這方面耗費(fèi)精力和成本。
2.現(xiàn)代化應(yīng)用需要什么樣的數(shù)據(jù)架構(gòu)作為支撐?
既然現(xiàn)有數(shù)據(jù)架構(gòu)難以支撐現(xiàn)代化應(yīng)用的實(shí)現(xiàn),一場數(shù)據(jù)架構(gòu)變革勢在必行。這個新型數(shù)據(jù)架構(gòu)要能夠解決上述提到的問題,即需要擁有更高的擴(kuò)展性、能夠適應(yīng)多樣化的數(shù)據(jù)形態(tài)、有更高的數(shù)據(jù)處理能力和更低的延遲,當(dāng)然還要有實(shí)現(xiàn)的路徑和工具。
相關(guān)技術(shù)方案與創(chuàng)新
當(dāng)下,IT 界的最佳技術(shù)組合可能就是“云計(jì)算 + 人工智能”。云計(jì)算解決了擴(kuò)展性、數(shù)據(jù)存儲、性能等問題,而人工智能技術(shù)則大大提高了數(shù)據(jù)分析和處理效率。
云計(jì)算可以為現(xiàn)代化應(yīng)用的峰值需求“無限續(xù)杯”與平穩(wěn)運(yùn)行時的“最佳能耗”。作為云計(jì)算模型之一的 Serverless,在理論上可以自動適配應(yīng)用從零到無窮大的需求峰值,更加擅長解決擴(kuò)展性的問題。
Serverless 架構(gòu)的好處在于可以按需加載,這樣應(yīng)用便不會持續(xù)占用資源,只有在請求到達(dá)或有事件發(fā)生時才會被部署和啟動,避免了成本浪費(fèi)。同時,Serverless 應(yīng)用原生支持高可用,可以更好地應(yīng)對突發(fā)的高訪問量。當(dāng)數(shù)據(jù)庫也 Serverless 化,就可以實(shí)現(xiàn)高度擴(kuò)展性及容量自動伸縮,做到按量付費(fèi)、降低支出成本,進(jìn)一步解放數(shù)據(jù)庫的管理和運(yùn)維。2012 年亞馬遜公司推出的 Amazon DynamoDB 就是 Serverless 數(shù)據(jù)庫。
2007 年,亞馬遜公司發(fā)表的關(guān)于 Key-value 存儲的劃時代論文《Dynamo: Amazon's Highly Available Key-value Store》解決的核心訴求就是滿足“永遠(yuǎn)在線”的用戶體驗(yàn),提升其數(shù)據(jù)庫的可用性、擴(kuò)展性和性能,被認(rèn)為是 NoSQL 的開山之作,之后催生了一系列 NoSQL 分布式數(shù)據(jù)庫。而 Amazon DynamoDB 就是 Dynamo 理念的正統(tǒng)實(shí)現(xiàn),它正在驅(qū)動那些傳統(tǒng)數(shù)據(jù)庫難以承載的新一代高性能、互聯(lián)網(wǎng)規(guī)模應(yīng)用。
以 Serverless 數(shù)據(jù)庫為代表,云數(shù)據(jù)庫正在迅速發(fā)展成熟,并帶來更好的可訪問性和高可用性,還有高擴(kuò)展性與可遷移性。此外,云數(shù)據(jù)庫也降低了部署的難度和成本,不會給企業(yè)造成特別大的負(fù)擔(dān)。
面對大規(guī)模數(shù)據(jù),傳統(tǒng)數(shù)據(jù)庫組件還存在業(yè)務(wù)類型不敏感、自動運(yùn)維能力弱等問題,機(jī)器學(xué)習(xí)算法可以分析大量數(shù)據(jù)記錄,標(biāo)記異常值和異常模式,還可以在系統(tǒng)運(yùn)行時自動、連續(xù)、無人工干預(yù)地執(zhí)行修補(bǔ)、調(diào)優(yōu)、備份和升級操作,盡可能減少人為錯誤或惡意行為,確保數(shù)據(jù)庫安全、高效運(yùn)行。而亞馬遜云科技在 re:Invent 上最新發(fā)布的 Amazon DevOps Guru for RDS 就可以幫助檢測數(shù)據(jù)庫問題、執(zhí)行根本原因分析和推薦更改建議,甚至能夠自動修復(fù)數(shù)據(jù)庫問題。
現(xiàn)代化應(yīng)用最終是面向全球的,現(xiàn)在很多企業(yè)也在做全球化布局。在這個過程中,全球分布式應(yīng)用系統(tǒng)成為企業(yè)首選。分布式系統(tǒng)中各個節(jié)點(diǎn)通過一個通信網(wǎng)絡(luò)互聯(lián)在一起,不僅方便通信還可以實(shí)現(xiàn)資源共享,也加快了計(jì)算速度。不過,這也讓企業(yè)的運(yùn)維壓力變大,同時存在一定的數(shù)據(jù)傳輸安全問題。所以,自動化的、安全的部署非常重要。
技術(shù)的選擇永遠(yuǎn)伴隨著一定性能的犧牲,很難有一個產(chǎn)品能夠在性能、功能和可用性等方方面面都做到極致。傳統(tǒng)數(shù)據(jù)庫廠商“一個數(shù)據(jù)庫打天下”的做法已經(jīng)無法滿足需要。按照不同的目的、使用場景構(gòu)建不同類型的數(shù)據(jù)庫產(chǎn)品,做到“專庫專用”則是新數(shù)據(jù)架構(gòu)的核心。專庫專用可以適配各種不同規(guī)模的應(yīng)用程序,優(yōu)先提供應(yīng)用程序最需要的性能,可用性大大提高。
3.如何實(shí)現(xiàn)架構(gòu)現(xiàn)代化?
架構(gòu)的通俗理解就是,企業(yè)可以使用現(xiàn)代的數(shù)據(jù)架構(gòu)來擺脫傳統(tǒng)數(shù)據(jù)庫的束縛,并有專用工具來完成基礎(chǔ)設(shè)施的現(xiàn)代化。當(dāng)然這并不容易,很大程度上取決于廠商的能力。
根據(jù) Gartner 2020 全球云數(shù)據(jù)庫魔力象限報告,亞馬遜云科技持續(xù)保持創(chuàng)新與領(lǐng)先。因此,我們以亞馬遜云科技為例,看看其是如何為企業(yè)數(shù)字驅(qū)動轉(zhuǎn)型助力的。
三大重要特性,兩大重要支持
首先,亞馬遜云科技開創(chuàng)了 Serverless 數(shù)據(jù)庫,來實(shí)現(xiàn)數(shù)據(jù)庫的彈性伸縮,進(jìn)一步簡化企業(yè)創(chuàng)建、維護(hù)和擴(kuò)展數(shù)據(jù)庫的操作。
亞馬遜云科技旗下有五大 Serverless 數(shù)據(jù)庫:Amazon Aurora、Amazon DynamoDB、Amazon Timestream(一種時間序列數(shù)據(jù)庫服務(wù))、Amazon Keyspaces(兼容 Apache Cassandra 的托管數(shù)據(jù)庫服務(wù))和 Amazon QLDB(一種全托管的分類賬數(shù)據(jù)庫)。其中,Amazon Aurora 已經(jīng)進(jìn)化到 v2 版本,可以在一秒內(nèi)將數(shù)據(jù)庫工作負(fù)載從數(shù)百個事務(wù)擴(kuò)展到數(shù)十萬個事務(wù),與為峰值負(fù)載配置容量的成本相比,最多可節(jié)省 90%。
那么,Serverless 數(shù)據(jù)庫的表現(xiàn)如何呢?華米科技健康云可以算得上是一個典型案例。截至 2021 年 2 月 2 日,華米科技智能可穿戴設(shè)備記錄的累計(jì)步數(shù)為 151 萬億步,累計(jì)睡眠記錄 128 億晚,心率記錄總時長 1,208 億小時。華米科技健康云每天需要完成 TB 級數(shù)據(jù)的收集和存儲,不僅需要存儲的數(shù)據(jù)量巨大,同時還必須保證極高的數(shù)據(jù)安全性、穩(wěn)定性和低延遲響應(yīng)。為了解決這些難題,華米科技健康云使用 Amazon DynamoDB 作為核心數(shù)據(jù)庫,存儲用戶的健康及與運(yùn)動相關(guān)的數(shù)據(jù)。而 Amazon DynamoDB 在任何規(guī)模下都能提供延遲不超過 10 毫秒的一致響應(yīng)時間,支持構(gòu)建具有無限吞吐量和存儲空間的應(yīng)用程序,滿足了華米健康云的數(shù)據(jù)存儲需求。此外,Amazon DynamoDB 的無服務(wù)器架構(gòu)使用戶無需預(yù)置、修補(bǔ)和管理任何服務(wù)器,也無需安裝、維護(hù)或運(yùn)行任何軟件。
目前,華米科技已經(jīng)全面引入了亞馬遜云科技。華米科技大數(shù)據(jù)及云平臺副總裁張稷表示,“華米科技健康云在數(shù)據(jù)存儲和處理方面的特點(diǎn)是冷熱數(shù)據(jù)分層明顯,數(shù)據(jù)訪問的波峰波谷也很明顯,亞馬遜云科技豐富的功能使我們可以選用不同的服務(wù)來應(yīng)對不同的需求以平衡性能與成本。”現(xiàn)在,華米科技使用 Amazon DynamoDB 存儲核心數(shù)據(jù);用 Amazon Simple Storage Service (Amazon S3) 存儲冷數(shù)據(jù)、日志以及備份數(shù)據(jù);用 Amazon Simple Queue Service (SQS) 、Amazon Simple Notification Service (Amazon SNS) 和 Amazon Managed Streaming for Apache Kafka (Amazon MSK) 進(jìn)行數(shù)據(jù)同步;用 Amazon Lambda 進(jìn)行數(shù)據(jù)遷移和轉(zhuǎn)存;用 Amazon Kinesis 和 Amazon EMR 進(jìn)行大數(shù)據(jù)分析。與切換到亞馬遜云科技之前相比,如今華米科技健康云的 P0 和 P1 級別故障數(shù)量大約減少了 20%,故障恢復(fù)時長減少了約 30%,總體服務(wù)可用性提升了 0.25%,系統(tǒng)的可用性指標(biāo)達(dá)到 99.99%。
此外,九州通也使用 Amazon Aurora 替換了傳統(tǒng) MySQL 數(shù)據(jù)庫,整體數(shù)據(jù)庫性能提升了 5 倍,TCO 降低了 50%。
其次,為實(shí)現(xiàn)專庫專用,亞馬遜云科技現(xiàn)在已有十多種專門構(gòu)建的數(shù)據(jù)庫服務(wù),囊括了關(guān)系、鍵值、文檔、內(nèi)存、圖、時間序列、寬列和分類賬八大數(shù)據(jù)類型。這些數(shù)據(jù)庫產(chǎn)品各有優(yōu)勢,分別適用于不同的應(yīng)用場景。
其中,Amazon MemoryDB for Redis 是一個與 Redis 兼容的、持久的內(nèi)存數(shù)據(jù)庫服務(wù)。它是為具有微服務(wù)體系結(jié)構(gòu)的現(xiàn)代應(yīng)用程序?qū)iT構(gòu)建的, 可以用作微服務(wù)應(yīng)用程序的高性能主數(shù)據(jù)庫,企業(yè)不需要再分別管理緩存和持久數(shù)據(jù)庫。
Amazon DocumentDB 則是一項(xiàng)快速、可擴(kuò)展、高度可用且完全托管式文檔數(shù)據(jù)庫服務(wù),支持 MongoDB 工作負(fù)載。作為一個文檔數(shù)據(jù)庫,Amazon DocumentDB 可以簡化存儲、查詢和索引 JSON 數(shù)據(jù)。開發(fā)人員可以使用與今天相同的 MongoDB 應(yīng)用程序代碼、驅(qū)動程序和工具,來運(yùn)行、管理和擴(kuò)展 Amazon DocumentDB 上的工作負(fù)載,享受改進(jìn)后的性能、可擴(kuò)展性和可用性,而無需擔(dān)心底層基礎(chǔ)設(shè)施的管理。
Amazon DynamoDB 是為海量數(shù)據(jù)、大型混合工作負(fù)載而生的鍵值數(shù)據(jù)庫服務(wù),根據(jù)官方介紹,Amazon DynamoDB 可以構(gòu)建吞吐量和存儲空間幾乎無限的應(yīng)用程序,在任意規(guī)模環(huán)境中提供一致的個位數(shù)毫秒響應(yīng)時間,極其適合游戲、廣告技術(shù)、移動互聯(lián)以及其它需要任何規(guī)模的低延遲數(shù)據(jù)訪問的應(yīng)用程序。虎牙已經(jīng)通過 Amazon DynamoDB 自動擴(kuò)容來應(yīng)對 10 倍以上的流量突增。
眾所周知,NoSQL 很多時候是在做“大力出奇跡”的事情,即通過大量的冗余存儲 + 索引實(shí)現(xiàn)快速訪問,但是這也有可能造成存儲空間的浪費(fèi)。而在亞馬遜云科技 re:Invent 大會上正式發(fā)布的 Amazon DynamoDB Standard-Infrequent Access (DynamoDB Standard-IA),在保持同樣性能、耐用性和伸縮性的同時,最高還可以為使用者節(jié)省 60% 的存儲空間。
再者,亞馬遜云科技的數(shù)據(jù)庫服務(wù)與人工智能技術(shù)深度集成。亞馬遜云科技的 Amazon Aurora ML、Amazon Neptune ML 等服務(wù),支持?jǐn)?shù)據(jù)庫開發(fā)者在不具備機(jī)器學(xué)習(xí)專業(yè)知識情況下,只需使用熟悉的數(shù)據(jù)庫查詢語言(比如 SQL)即可進(jìn)行機(jī)器學(xué)習(xí)操作。
我們不得不談的是云數(shù)據(jù)庫在提供數(shù)據(jù)存儲服務(wù)于應(yīng)用之后的價值, 實(shí)現(xiàn)統(tǒng)一分析和利用機(jī)器學(xué)習(xí)進(jìn)行業(yè)務(wù)創(chuàng)新,助力企業(yè)數(shù)據(jù)驅(qū)動的業(yè)務(wù)轉(zhuǎn)型。像亞馬遜云科技提出的“智能湖倉架構(gòu)”實(shí)現(xiàn)的是通過一系列的服務(wù),允許數(shù)據(jù)庫,數(shù)據(jù)倉庫以及各種分析工具之間的數(shù)據(jù)無縫流動,同時在數(shù)據(jù)庫內(nèi)提供直接開始機(jī)器學(xué)習(xí)的能力, 讓 DBA、數(shù)據(jù)庫工程師也能很快利用機(jī)器學(xué)習(xí)來進(jìn)行業(yè)務(wù)創(chuàng)新而不是關(guān)注技術(shù)學(xué)習(xí), 這都是云數(shù)據(jù)庫的優(yōu)勢。人工智能平臺公司啟元世界使用了“智能湖倉”進(jìn)行云上創(chuàng)新,實(shí)現(xiàn)了數(shù)據(jù)的融合和統(tǒng)一治理,加快了其全生命周期產(chǎn)品矩陣?yán)砟畹穆涞睾鸵?guī)模發(fā)展。同時,對流數(shù)據(jù)處理系統(tǒng)實(shí)現(xiàn)了分鐘級部署,并能夠輕松承載百萬 QPS(每秒查詢率)流數(shù)據(jù),還將批處理運(yùn)行時間減少 80%,運(yùn)營總成本下降 50%。
另外,為支持企業(yè)的全球分布式應(yīng)用系統(tǒng),亞馬遜云科技推出了 Amazon Aurora Global Database(全球數(shù)據(jù)庫)、Amazon DynamoDB Global Tables(全局表)、Amazon ElastiCache for Redis Global Datastore(全局?jǐn)?shù)據(jù)存儲)、Amazon DocumentDB Global Clusters(全局集群)等功能,企業(yè)可以一鍵配置現(xiàn)有集群,本地寫入數(shù)據(jù)全球可讀,并享有亞毫秒級延遲能力。
根據(jù) CAIDA 統(tǒng)計(jì),亞馬遜云科技也是全球大的互聯(lián)網(wǎng)帶寬擁有者之一。亞馬遜云科技全球所有的區(qū)域、可用區(qū)和邊緣節(jié)點(diǎn)之間,均通過跨越大洲和大洋的高帶寬冗余光纜連接,并 100% 加密。據(jù)悉,亞馬遜云科技的基礎(chǔ)設(shè)施遍及全球 25 個地理區(qū)域的 81 個可用區(qū)(AZ)。
最后,制定遷移計(jì)劃對企業(yè)來說可能是一項(xiàng)挑戰(zhàn)。為此,亞馬遜云科技研發(fā)了多種遷移工具,如 Amazon Schema Conversion Tool 可用于轉(zhuǎn)換數(shù)據(jù)庫模式、Amazon Database Migration Service (Amazon DMS)用于遷移數(shù)據(jù),還有今年新發(fā)布的 Amazon DMS Fleet Advisor,可以用來收集分析數(shù)據(jù)庫模式和對象,包括關(guān)于功能元數(shù)據(jù)、模式對象和使用情況指標(biāo)的信息,并且允許企業(yè)通過確定將源數(shù)據(jù)庫遷移到亞馬遜云科技中目標(biāo)服務(wù)的復(fù)雜性來構(gòu)建定制的遷移計(jì)劃。此外,剛剛在全球上線的 Babelfish for Amazon Aurora PostgreSQL 還可以幫助企業(yè)遷移到 SQL Server 應(yīng)用程序。據(jù)悉,目前全球已有超過 45 萬個數(shù)據(jù)庫遷移至亞馬遜云科技。
值得注意的是,亞馬遜云科技已經(jīng)成為元宇宙公司 Meta 的戰(zhàn)略云服務(wù)提供商。Meta 將使用更多亞馬遜云科技的計(jì)算、存儲、數(shù)據(jù)庫和安全服務(wù),并將在亞馬遜云科技上運(yùn)行第三方合作應(yīng)用,同時 Meta 將使用亞馬遜云科技的計(jì)算服務(wù)來進(jìn)行包括人工智能項(xiàng)目在內(nèi)的相關(guān)研發(fā)工作。
此外,當(dāng)下十分流行、在全球已經(jīng)擁有超過 3.5 億用戶的元宇宙游戲“堡壘之夜”,其工作負(fù)載,如 3D 圖像建模、實(shí)時渲染等也幾乎全部都運(yùn)行在亞馬遜云科技的產(chǎn)品之上。英雄聯(lián)盟的開發(fā)商 Riot 也將游戲的基礎(chǔ)設(shè)施部署在亞馬遜云科技之上。全球化運(yùn)營的三七互娛也已經(jīng)將一部分?jǐn)?shù)據(jù)遷移到亞馬遜云科技服務(wù)上,基礎(chǔ)設(shè)施方面的壓力得以大大減輕,此外,三七互娛還在亞馬遜云科技的幫助下快速構(gòu)建出了全球同服的云架構(gòu),使全球各地玩家都能獲得幾乎一致的順暢體驗(yàn)。
對于這些正在構(gòu)建現(xiàn)代化應(yīng)用的企業(yè)來說,亞馬遜云科技已經(jīng)成為不可或缺的支撐平臺。
4.結(jié)束語
Serverless、AI 賦能、專門構(gòu)建、全球部署和平滑遷移這五大理念,正是亞馬遜云科技“現(xiàn)代端到端數(shù)據(jù)戰(zhàn)略 - 架構(gòu)現(xiàn)代化”的內(nèi)涵。
亞馬遜云科技的現(xiàn)代端到端數(shù)據(jù)戰(zhàn)略是一種面向未來應(yīng)用的戰(zhàn)略思考,也是一種可交付的架構(gòu),旨在為企業(yè)發(fā)展提供源源不斷的動能。現(xiàn)代端到端數(shù)據(jù)戰(zhàn)略主要包括三個要素:
-
首先是我們前文所述的數(shù)據(jù)架構(gòu)現(xiàn)代化。架構(gòu)現(xiàn)代化是一切創(chuàng)新的基石,其最重要的理念是“The right tool for the job”,即在不同的場景使用專門構(gòu)建的工具,而專門的工具需要專業(yè)的現(xiàn)代化托管平臺,這些都可以大量節(jié)省企業(yè)的時間、金錢和精力;
另外還有兩大部分內(nèi)容我們在本文沒有擴(kuò)展:
-
統(tǒng)一分析數(shù)據(jù)。統(tǒng)一分析數(shù)據(jù)則是通過云上專門工具實(shí)現(xiàn)數(shù)據(jù)有機(jī)整合與統(tǒng)一,將所有數(shù)據(jù)連接到一個安全且管理良好的連貫系統(tǒng)中,使企業(yè)擁有靈活擴(kuò)展與極致性能。企業(yè)在獲得實(shí)時反饋和數(shù)據(jù)后,可以很快地擴(kuò)大服務(wù)規(guī)模;
-
基于數(shù)據(jù)進(jìn)行業(yè)務(wù)創(chuàng)新。“蓬勃發(fā)展的公司與艱難求生的公司之間的關(guān)鍵區(qū)別在于是否將創(chuàng)建一個數(shù)據(jù)驅(qū)動型組織視為當(dāng)務(wù)之急。”Amazon 機(jī)器學(xué)習(xí)副總裁 Swami Sivasubramanian 在亞馬遜云科技 re:Invent 全球大會上說道。企業(yè)植根于自身業(yè)務(wù)的創(chuàng)新訴求是創(chuàng)新的原動力,其中訓(xùn)練與調(diào)優(yōu)、模型部署與管理都涉及到了基礎(chǔ)設(shè)施層面的創(chuàng)新。
當(dāng)前企業(yè)主要面臨著嚴(yán)重的基礎(chǔ)設(shè)施老舊、自動化程度低和專用工具缺乏的問題,同時繁重的資本支出也阻礙了企業(yè)前進(jìn)。因此,企業(yè)要做出改變的決心是很大的。Gartner 預(yù)測,到 2024 年,企業(yè)為成為數(shù)據(jù)驅(qū)動和數(shù)字化企業(yè),將在數(shù)據(jù)和分析上增加 40% 的投入。
未來,亞馬遜云科技的產(chǎn)品布局將進(jìn)一步擴(kuò)大。在現(xiàn)有產(chǎn)品基礎(chǔ)上,亞馬遜云科技將根據(jù)客戶需要研發(fā)各種新產(chǎn)品,包括面向金融、電信、醫(yī)療和汽車等特定行業(yè)。這些都將成為企業(yè)數(shù)字驅(qū)動轉(zhuǎn)型的重要利器,也會是現(xiàn)代化應(yīng)用建設(shè)的重要基礎(chǔ)設(shè)施。