數字經濟時代,數據已經成為企業的核心資產和創新的主要驅動力。Forrester Research的一份報告表明:數據驅動型企業正以平均每年30%的速度快速增長。這讓越來越多的企業確立了構建數據驅動型企業的目標。
亞馬遜云科技大中華區產品部總經理陳曉建在近日的媒體溝通會上提到,IDC對亞馬遜云科技數據庫、大數據和AI/ML產品分析的文章揭示:如果現有客戶采用數據相關的云服務,五年后的投資回報率將達到415%,總體運營成本可降低48%。實際上,大多數企業都已意識到了數據對企業的重要性,紛紛加速了數字化轉型進程。
亞馬遜云科技大中華區產品部總經理陳曉建
傳統企業數字化轉型面臨五大數據挑戰
伴隨轉型的深入,每家企業都有大量數據,這些數據在為業務賦能的同時,也帶來重重挑戰,尤其對于傳統行業中的企業而言,更是如此。
首先是快速擴展難。面對來自于不同數據源的、海量的、多樣化的、異構的數據,傳統IDC資源有限且無法快速擴展,共享存儲、MPP等傳統數據庫的技術架構無法充分利用云的彈性能力,難以充分發揮云的優勢。
其次是高成本。不僅購買商業數據庫的License需要花費高昂的費用,而且需要大量硬件投資以及經驗豐富的DBA團隊來運維數據庫。
三是對業務發展的支撐能力有限。當企業需要進行業務擴展開辟全新市場時(例如出海業務等),如果采用傳統的商業數據庫必須在當地建機房、搭IT架構、招運營團隊,很難支撐全球業務的快速擴展。
四是迭代速度慢。繁瑣的部署運維工作必然會讓IT團隊分散精力,減緩系統迭代速度以及創新速度。與此同時,無論是商業數據庫還是開源數據庫,更新迭代的節奏大多是由數據庫廠商的節奏而定,企業自身很難控制。
五是存在功能和性能的瓶頸。傳統關系型數據庫在應對不同業務場景下的需求時能力瓶頸日益凸顯,掣肘業務快速發展。
云原生數據庫服務的六大核心優勢
分布式、云計算、大數據正在重塑數據庫的市場格局,2021 年全球云數據庫市場份額已超過傳統部署模式的數據庫,這標志著云數據庫取代傳統數據庫地位的趨勢已經確立。
陳曉建表示:“作為云計算領域的引領者,亞馬遜云科技不斷推動云服務的創新,也在積極探索公有云架構與數據庫演進的結合,希望通過云原生數據庫服務的創新,幫助各行業企業展開云上創新之旅。”
會上,陳曉建梳理了亞馬遜云科技云原生數據庫服務的六大核心優勢。
1、降低成本。云計算解決了開源數據庫在易用性、可靠性、擴展性、性能等方面的問題,相比傳統商業數據庫,降低了高昂的成本。通過云上托管的數據庫服務,客戶可以用開源數據庫實現媲美商業數據庫的性能,而成本通常只有商業數據庫的幾分之一。
2、專庫專用。云上專門構建的托管數據庫,為企業工作負載,尤其是現代化應用架構下的微服務提供極致性能,不同的問題由專門的數據庫來解決。
3、快速彈性擴展。基于云端海量資源池的云數據庫可以根據企業的工作負載需求快速彈性擴展,無服務器的數據庫更是將這一特性發揮到了極致。
4、深度集成。云原生數據庫可以利用云端的其他服務,包括計算、網絡、存儲、安全、大數據、AI/ML等,通過深度集成,將各種能力融會貫通。
5、按需付費。企業可以非常精準地控制自己使用的資源,按用量付費,無需預置資源,并且可以無限擴充自己所需要的能力。
6、支持全球業務擴展。托管數據庫服務使客戶可以集中精力在高價值的應用開發上,并借助全球數據庫配合全球業務擴展。此外,亞馬遜云科技的云原生數據庫具備全球災備能力,有五個數據庫產品具備了跨區容災能力,可以幫助企業輕松實現全球的業務拓展。
陳曉建介紹,亞馬遜云科技一直通過不斷創新推動云上數據庫服務的迭代與發展,目前已推出超過15種專門構建的云上托管數據庫服務,幫助傳統行業企業從海量多樣化數據中獲取洞察能力,并降低使用成本。
賦能汽車行業處理海量以及多樣化數據
在“電動化、網聯化、智能化、共享化”的發展趨勢下,汽車本身的數據采集能力越來越強,汽車行業正面臨海量、多樣化數據的挑戰,缺乏有效手段來充分挖掘數據的價值。以自動駕駛場景為例,汽車每天采集到的數據是TB級,當幾千輛車進行路試,一年的數據量已經遠遠超出傳統車企對IT能力的整體規劃和期望值,如何以更有效的方式使用這些海量數據以獲取數據洞察更是難上加難,這是每個車企都在思考的問題。
亞馬遜云科技云原生數據庫可以幫助車企用戶解決以上問題。陳曉建提到:針對SQL、NoSQL以及不同場景,亞馬遜云科技提供15種專門構建的數據庫,能夠滿足不同場景下用戶的需求。
以車聯網場景下最常用的位置信息服務為例,位置信息的數據量大、對查詢性能的要求高,在這類場景下,車企可使用 Amazon DocumentDB ,支持存儲、查詢和索引地理空間數據,可以創建 2dsphere 索引并使用流行的 MongoDB 地理空間 API,來對存儲在 DocumentDB 的數據執行查詢。Amazon DocumentDB兼容MongoDB,與后者相比優勢在于可以根據數據的吞吐量輕松擴展數據庫計算資源,通常可在幾分鐘之內完成,并且會隨著客戶的集群存儲需求的增長而自動提高存儲卷大小。
云遠知行是由人工智能驅動、以無人駕駛技術為核心的智能出行公司,其目標是實現基于L4的自動駕駛能力,為大眾提供便捷可靠的出行服務。云遠知行起初采用自建服務器的方式控制成本,但是當公司的業務規模擴大、路試車輛翻翻后,復雜度呈指數級增長,系統的穩定性也難以保障,底層自建能力不僅難以滿足業務的需求,更難以有效地控制成本。
為破解上述瓶頸,文遠知行于2019年初在亞馬遜云科技上部署其數據處理和機器學習平臺。首先,文遠知行通過Amazon EC2 P3服務器(GPU服務器)實例構建其分布式機器學習集群;其次,采用Amazon Snowball導出路測數據,并通過Amazon Snowball上傳到亞馬遜云科技公有云;第三,數據上云后通過Amazon RDS、Amazon Aurora、Amazon DynamoDB等存儲這些數據,并且通過Amazon EMR進行大數據分析。由于亞馬遜云科技上的各個數據庫和大數據服務之間可以無縫打通,因此文遠知行基于完整的數據可以非常輕松的進行數據分析和處理。
采用亞馬遜云科技服務給文遠知行帶來三大益處:
一是云的可擴展性可以很好地滿足公司業務快速擴張對底層資源的要求,可以將新業務的部署時間從月縮短至以周為單位。
二是降低了整體資源成本,將TCO降低了三分之一,運維效率提升了50%,可以更專注于企業自身業務。
三是提升了系統的可用性。通過亞馬遜云科技多種跨區域的可用災備方案,使文遠知行的業務擁有更好的敏捷性和數據的持久性。
此外,汽車行業利用云原生數據庫的無服務器Serverless功能同樣可以應對車聯網海量數據的并發接入挑戰。陳曉建提到:Serverless的好處在于可以根據系統的負載自動伸縮后臺資源,以云原生數據庫Amazon Aurora的Serverless版本為例,可在一秒之內將性能從幾百個事務拓展到數十萬個事務,不僅無需人工干涉,還可以幫助企業用戶顯著降低云上的部署成本。此外,云原生數據庫還提供智能分層功能,可以自動完成分層并有效減少數據的存儲成本。
再以Amazon DynamoDB為例,它是業界第一款云原生數據庫,自誕生之日起就是Serverless架構,可在任意規模環境中提供一致的個位數毫秒級的響應時間, 每天處理超過10萬億次請求,每秒支持超過2000萬請求峰值。Amazon DynamoDB在亞馬遜Prime Day期間,每秒支持請求峰值高達1.052億個,API總調用次數達數萬億次。如今,豐田、大眾旗下的MOIA等眾多車企客戶都用Amazon DynamoDB來處理關鍵數據,保證業務的穩定性和數據的持久性。
賦能制造業釋放數據不同生命周期價值并獲得數據洞察
數據同樣是驅動制造業發展的關鍵因素。制造業的數據類型多種多樣,數據來源復雜,數據量巨大,如何通過智能制造提升設備的總體效率?如何實現產品即服務?如何從非智能化向智能化轉變?如何實現可持續性制造,在生產過程中降低成本、減少碳排放?是每個制造業的企業都在思考的問題。在制造業數字化轉型的過程中,數據的多樣性矛盾日益突出,冷熱數據的存儲問題、數據孤島問題、商業數據庫高昂的成本問題等挑戰日益嚴峻。
亞馬遜云科技賦能制造業企業應對數據挑戰的思路是:
首先,針對多樣化的數據類型,結合實際場景選擇合適的專門構建的數據庫來滿足企業業務的需求;
其次,針對海量數據的挑戰,提供數據庫的數據分層存儲功能,可處理海量的冷暖數據,幫助企業節省大量成本;
第三,針對數據孤島問題,通過圖數據庫Amazon Neptune和AI/ML的統計分析能力,可建立各個不同數據之間的相關性,并通過ML洞察出數據的真正價值,充分釋放數據在不同生命周期的價值;
第四,亞馬遜云科技進一步提供應用程序遷移服務,利用Babelfish for Amazon Aurora PostgreSQL,幫助客戶把傳統數據庫平滑地遷移上云原生數據庫,在簡化上云成本的同時,幫助企業大幅降低數據庫的總體使用成本。
華米公司成立于2013年,已于2018年在紐約上市,是一家基于云的健康服務提供商,為客戶提供各類可穿戴設備。由于華米的核心業務依賴于各類智能設備所采集的用戶健康數據,如步數、睡眠記錄、心率數據、甚至是房顫數據等,既要保護用戶隱私,又要保障后臺系統擁有非常穩定的性能,提供持久、穩定的數據響應,最后華米選擇Amazon DynamoDB為其快速發展的全球化業務進行支撐,提升業務的穩定性。
Amazon DynamoDB可以構建幾乎無限的性能和幾乎無限吞吐量的后臺存儲,并且提供了冷熱數據分層,能夠滿足華米的存儲要求。無論數據規模多么龐大,在任何情況下Amazon DynamoDB都可以為華米提供不超過10毫秒的一致響應時間,很好地滿足了華米對自身業務穩定性的需求。數據顯示,在使用亞馬遜云科技后,華米與之前相比P0和P1的整體故障發生率減少了20%,故障恢復時長降低了30%,系統可用性指標達到99.99%。
傳統的關系型數據庫產品不但許可成本高,更新、服務等也需要更多的費用,而且很難管理,致使數據庫的管理、維護成本居高不下。使用云上的云原生數據庫,不僅可以大幅降低成本,還能降低運維復雜度。但是,對于制造業的企業用戶而言,從商業數據庫遷移到云原生數據庫的遷移工作和遷移成本是不能回避的問題。為此,亞馬遜云科技提供Bablefish for Amazon Aurora PostgreSQL這一新產品,幫助傳統制造業快速遷移上云,以擺脫商業數據庫高昂的成本。
以全球知名的消防和安防公司——開利消防為例,開利消防的工程師評估之后發現:Babelfish for Amazon Aurora PostgreSQL能夠兼容其95%以上的代碼,最后開利消防只用了5周時間便完成了業務改造和數據庫切換。此外,Amazon Aurora相比開利消防之前使用的Microsoft SQL Server,降低了70%的成本。
賦能金融業加強風險控制能力,實現風控智能化
除汽車、制造行業外,金融行業所面臨的數字化挑戰同樣不容樂觀。亞馬遜云科技提供了圖數據庫Amazon Neptune + ML的方案,引入知識圖譜、機器學習等人工智能技術,可以極大提升原有風控平臺,優化對企業/消費者關聯關系圖譜,構建全面的客戶 360度視圖,為風險管理提供了深度業務洞察和數據分析支持,助力實現金融機構風控智能化,提升金融風控的底層核心能力。
此外,面對需要支持全球業務、提升客戶體驗及業務連續性需求,亞馬遜云科技提供全球數據庫解決方案,可幫助金融機構輕松將數據庫讀取擴展至世界范圍,讓數據更靠近各地區的用戶。亞馬遜云科技還提供三個可用區的災備保護能力,有效保障金融機構全球業務的一致性與連續性。亞馬遜云科技全球數據庫服務具體包括Amazon Aurora Global Database、 Amazon DynamoDB Global Tables、Amazon Neptune Global Database、Amazon DocumentDB Global Clusters以及Amazon ElastiCache for Redis Global Datastore。
全球領先的稅務軟件公司Intuit,利用Amazon Aurora 全球數據庫的亞秒級全球復制速度,在不受性能或延遲限制的情況下,滿足全球用戶在報稅季節的流量需求。Amazon Aurora 全球數據庫讓Intuit能夠通過在亞馬遜云科技區域內分發數據來保持強大的災難恢復能力,故障轉移所完成時間不足 1 分鐘。
艾瑞咨詢研究總監王巍令表示:“云原生數據庫將會成為未來數據庫的重要趨勢之一。在調研和走訪中,發現不少企業盡管存在顧慮和實際困難,但是大多數也都表示愿意嘗試云原生數據庫。以亞馬遜云科技為代表的公有云廠商,提供豐富的云原生數據庫,使得企業可以安心地收數和用數,并聚焦核心業務。如果再考慮云上同時提供機器學習模型構建等服務,用數也變得簡單起來。”
關于企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營18個IT行業公眾號(微信搜索D1net即可關注)。