精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

國產數據庫近200家!談談數據庫技術選型

責任編輯:shjiaz |來源:企業網D1Net  2022-04-11 09:33:57 本文摘自:云技術之家

隨著企業數字化轉型深入,對于數據使用場景也呈現多元化趨勢,正有越來越多數據被企業利用起來。如何為眾多場景選擇一款合適的數據庫產品,是很多企業面臨的問題。而另一方面,近些年來數據庫技術蓬勃發展,初創新興廠商大量涌現。據不完全統計,僅國內的數據庫廠商就有近200家,還不算國外以及開源數據庫產品。上述情況更加劇了企業選擇數據庫的困難。本文從一些角度切入,通過圖譜的形式嘗試為企業選擇數據庫產品描述出一條路徑。

1. 技術選型:場景區分

當用戶面對數據庫選型時,首先是做場景的大致區分。這里我們將業務場景分為三種類型:

通用場景

第一類為通用場景,是具有較為普遍的意義,絕大多數業務場景都是適用的。這里面包含了企業常規的業務系統,也包括像互聯網應用、實時交互分析等場景。

分析場景

第二類為分析場景,這類場景比較明確,是對企業內包含線上活躍和歷史在內的全量數據進行實時或批量的分析。這類場景主要強調對數據的加工處理能力,并將結果在數據可視化平臺進行輸出。

特定場景

第三類較為特殊,此部分場景屬于相對較窄的范圍,屬于特定方向的數據應用。如比較常見的圖、時序等。這類應用有別于傳統的業務應用。

2. 技術選型:通用場景

針對通用場景,可進一步安裝數據模型、標準SQL訪問及ACID能力做進一步區分。大的方面可分為兩類:

非關系模型+無SQL+無ACID

此類產品提供較為多元的數據訪問需求。隨著互聯網興起,針對非關系模型的數據受到更多的重視。這類數據通常提供專有訪問接口且對ACID能力沒有需求,更多強調是對異構數據的存儲和擴展能力。其根據存儲數據模型,又可進一步細分為KV、文檔型、寬列型等。這類產品與后面談到的特有場景數據庫產品不同,其往往是作為生產業務系統中的一部分,但兩者有時是有交叉的。

關系模型+SQL+ACID

絕大多數數據庫產品都是在此分類,它們提供結構化數據的存儲,提供SQL訪問接口,支持ACID能力,強調事務等能力。這類產品種類眾多、架構各異,因此后續按擴展能力、可用性水平等做進一步劃分。

1).按擴展性/可用性劃分

從這個維度進一步細分通用數據庫場景產品,可按照其架構分為單機、共享、集群、分布式等多種架構。

單機架構

單機數據庫是大家最為熟悉的,提供基礎數據庫功能。從擴展性來說,一般只具有Scale UP的能力,通過升級硬件來進行擴展其性能。從可用性角度來看,單機的可用性有限,一般作為非核心系統或者作為研發、測試用途。

共享架構

共享架構數據庫,是針對單機庫的升級,通過共享存儲資源,將上層計算資源實現水平擴展,可以提供更好的性能及可用性表現。從擴展性來說,其能提供計算能力的有限擴展,存儲能力擴展則取決于底層存儲。從可用性來看,可以解決實例級、主機級故障,提供整體可用性。

集群架構

集群架構數據庫,是提供了在單機/共享模式之上的數據庫架構。通過復制技術,可實現數據庫主從的工作模式。從擴展性上看,這種方式可提供提供一定范圍內計算資源的水平擴展,這里強調是一定范圍是指計算能力不能“完整擴展”,如僅能提供只讀的擴展能力。對可用性來說,通過集群可實現主出現問題時,切換到從的能力,進而提升整體可用性。

分布式架構

分布式架構數據庫,近些年來很火熱,其突破單機、共享、集群架構下的數據庫局限。通過存算分離技術,可實現上層計算資源、底層存儲資源的水平擴展,進而滿足更高性能、更大容量的承載。從擴展性來看,其擴展能力要遠遠優于前幾種架構。從可用性來看,分布式架構因其多副本技術等,原生提供了更高的可用性。但這部分的具體實現技術上有著不同的方式,下面針對這部分加以說明。

2).按規模/一致性/侵入性/負載特征

原生分布式架構

原生分布式架構,通過存算分離技術,可實現計算與存儲的獨立擴展。但受到其管理能力限制,一般擴展能力較后者稍差。技術上按分布式重構了整個架構,可提供全局的MVCC、標準ACID、數據強一致等能力。對于用戶來說,可類似普通數據庫一樣去使用,無應用浸入性。在性能上,可提供很大的吞吐量,但受限于架構在響應時間上有一定劣勢。此外,還有些產品通過構造第二引擎及MPP的引入,也可提供一定的在線分析能力,滿足類似HTAP的要求。

分布式計算+單機引擎

這種架構利用成熟的單機引擎與上層分布式計算層的結合,可實現存算分離。其擴展能力,較前者有更大的擴展能力。技術上此類產品僅重構了部分數據庫架構,可通過上層與底層的部分改造,實現全局MVCC、ACID和強一致能力。但從實現上看,并不是十分優雅。此外,這種架構是需要用戶明確數據分片方法,帶有一定的侵入性,但也因這點其帶來較好的延時表現。在性能上,可提供很大的吞吐量。

單機計算+分布式存儲

這種架構是以分布式存儲為基礎,在其上構建單機的計算層。通過底層存儲和上層無狀態計算節點的擴展能力,實現一定程度的存算分離和彈性擴展。但從整體擴展能力來看,相較于前兩者,有著明顯的劣勢。且受限于底座能力的約束,必須滿足一定的部署條件。從產品能力上看,其是非分布式數據庫最為接近的,用戶幾乎無感。

3. 技術選型:分析場景

針對分析場景,可以做進一步的功能細分。這里可從支持事務情況、在線性、數據模型及實時性要求來做區分。

MPP架構

第一類產品是MPP類型的數據倉庫,是一種大規模并行計算數據庫。此類產品屬于數據庫定位,提供數據庫特有的ACID能力,對用戶非常友好。提供標準的SQL能力及企業級能力(例如權限、資源)等。此類產品曾經是數據分析的唯一選擇,后來面對更大規模、多模異構等場景不太適用,才出現后續基于大數據及其他方案。但隨著近些年產品的發展,此類產品突破之前集群規模的限制,已經可以支持PB級及以上的規模。在使用體驗上更加接近于數據庫的能力。因此更為受到企業級用戶的歡迎。后續此類產品在向細粒度控制、資源彈性、異構計算等方向發展。

大數據架構

第二類產品是大數據架構的產品,其本質是一種并行計算及存儲系統。從早期出現的Hadoop及Hive、Spark到后期一系列產品,對應產品非常多樣。此類產品提供多種計算方式,且通常為了降低使用成本也提供了類SQL的訪問方式。但在如數據一致性、事務等方面較前者有明顯的差異。通常適用于某類特定場景的數據分析,其擴展能力較前者更有優勢。

分布式存儲架構

第三類產品是來自于分布式存儲產品,其原始訴求是提供各類數據的存儲。這里包括結構化、半結構乃至非結構化數據。隨著這些數據被保存,計算類的需求也被提出來。但通常這些計算往往是探索性的、無規律的。同時為了方便存儲的各類不同數據,還需提供統一的元數據,建立整體數據視角。

4. 技術選型:特定場景

對于特定場景部分,其根據數據專項應用領域,通常是比較好選擇的。例如針對圖數據庫領域,Neo4j等是常規的選擇;針對時序數據庫InfluxDB等是常規的選擇。此類產品選擇,往往可選擇的產品范圍不同,只需關注被選產品的核心能力即可。

關鍵字:數據庫技術選型

本文摘自:云技術之家

x 國產數據庫近200家!談談數據庫技術選型 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

國產數據庫近200家!談談數據庫技術選型

責任編輯:shjiaz |來源:企業網D1Net  2022-04-11 09:33:57 本文摘自:云技術之家

隨著企業數字化轉型深入,對于數據使用場景也呈現多元化趨勢,正有越來越多數據被企業利用起來。如何為眾多場景選擇一款合適的數據庫產品,是很多企業面臨的問題。而另一方面,近些年來數據庫技術蓬勃發展,初創新興廠商大量涌現。據不完全統計,僅國內的數據庫廠商就有近200家,還不算國外以及開源數據庫產品。上述情況更加劇了企業選擇數據庫的困難。本文從一些角度切入,通過圖譜的形式嘗試為企業選擇數據庫產品描述出一條路徑。

1. 技術選型:場景區分

當用戶面對數據庫選型時,首先是做場景的大致區分。這里我們將業務場景分為三種類型:

通用場景

第一類為通用場景,是具有較為普遍的意義,絕大多數業務場景都是適用的。這里面包含了企業常規的業務系統,也包括像互聯網應用、實時交互分析等場景。

分析場景

第二類為分析場景,這類場景比較明確,是對企業內包含線上活躍和歷史在內的全量數據進行實時或批量的分析。這類場景主要強調對數據的加工處理能力,并將結果在數據可視化平臺進行輸出。

特定場景

第三類較為特殊,此部分場景屬于相對較窄的范圍,屬于特定方向的數據應用。如比較常見的圖、時序等。這類應用有別于傳統的業務應用。

2. 技術選型:通用場景

針對通用場景,可進一步安裝數據模型、標準SQL訪問及ACID能力做進一步區分。大的方面可分為兩類:

非關系模型+無SQL+無ACID

此類產品提供較為多元的數據訪問需求。隨著互聯網興起,針對非關系模型的數據受到更多的重視。這類數據通常提供專有訪問接口且對ACID能力沒有需求,更多強調是對異構數據的存儲和擴展能力。其根據存儲數據模型,又可進一步細分為KV、文檔型、寬列型等。這類產品與后面談到的特有場景數據庫產品不同,其往往是作為生產業務系統中的一部分,但兩者有時是有交叉的。

關系模型+SQL+ACID

絕大多數數據庫產品都是在此分類,它們提供結構化數據的存儲,提供SQL訪問接口,支持ACID能力,強調事務等能力。這類產品種類眾多、架構各異,因此后續按擴展能力、可用性水平等做進一步劃分。

1).按擴展性/可用性劃分

從這個維度進一步細分通用數據庫場景產品,可按照其架構分為單機、共享、集群、分布式等多種架構。

單機架構

單機數據庫是大家最為熟悉的,提供基礎數據庫功能。從擴展性來說,一般只具有Scale UP的能力,通過升級硬件來進行擴展其性能。從可用性角度來看,單機的可用性有限,一般作為非核心系統或者作為研發、測試用途。

共享架構

共享架構數據庫,是針對單機庫的升級,通過共享存儲資源,將上層計算資源實現水平擴展,可以提供更好的性能及可用性表現。從擴展性來說,其能提供計算能力的有限擴展,存儲能力擴展則取決于底層存儲。從可用性來看,可以解決實例級、主機級故障,提供整體可用性。

集群架構

集群架構數據庫,是提供了在單機/共享模式之上的數據庫架構。通過復制技術,可實現數據庫主從的工作模式。從擴展性上看,這種方式可提供提供一定范圍內計算資源的水平擴展,這里強調是一定范圍是指計算能力不能“完整擴展”,如僅能提供只讀的擴展能力。對可用性來說,通過集群可實現主出現問題時,切換到從的能力,進而提升整體可用性。

分布式架構

分布式架構數據庫,近些年來很火熱,其突破單機、共享、集群架構下的數據庫局限。通過存算分離技術,可實現上層計算資源、底層存儲資源的水平擴展,進而滿足更高性能、更大容量的承載。從擴展性來看,其擴展能力要遠遠優于前幾種架構。從可用性來看,分布式架構因其多副本技術等,原生提供了更高的可用性。但這部分的具體實現技術上有著不同的方式,下面針對這部分加以說明。

2).按規模/一致性/侵入性/負載特征

原生分布式架構

原生分布式架構,通過存算分離技術,可實現計算與存儲的獨立擴展。但受到其管理能力限制,一般擴展能力較后者稍差。技術上按分布式重構了整個架構,可提供全局的MVCC、標準ACID、數據強一致等能力。對于用戶來說,可類似普通數據庫一樣去使用,無應用浸入性。在性能上,可提供很大的吞吐量,但受限于架構在響應時間上有一定劣勢。此外,還有些產品通過構造第二引擎及MPP的引入,也可提供一定的在線分析能力,滿足類似HTAP的要求。

分布式計算+單機引擎

這種架構利用成熟的單機引擎與上層分布式計算層的結合,可實現存算分離。其擴展能力,較前者有更大的擴展能力。技術上此類產品僅重構了部分數據庫架構,可通過上層與底層的部分改造,實現全局MVCC、ACID和強一致能力。但從實現上看,并不是十分優雅。此外,這種架構是需要用戶明確數據分片方法,帶有一定的侵入性,但也因這點其帶來較好的延時表現。在性能上,可提供很大的吞吐量。

單機計算+分布式存儲

這種架構是以分布式存儲為基礎,在其上構建單機的計算層。通過底層存儲和上層無狀態計算節點的擴展能力,實現一定程度的存算分離和彈性擴展。但從整體擴展能力來看,相較于前兩者,有著明顯的劣勢。且受限于底座能力的約束,必須滿足一定的部署條件。從產品能力上看,其是非分布式數據庫最為接近的,用戶幾乎無感。

3. 技術選型:分析場景

針對分析場景,可以做進一步的功能細分。這里可從支持事務情況、在線性、數據模型及實時性要求來做區分。

MPP架構

第一類產品是MPP類型的數據倉庫,是一種大規模并行計算數據庫。此類產品屬于數據庫定位,提供數據庫特有的ACID能力,對用戶非常友好。提供標準的SQL能力及企業級能力(例如權限、資源)等。此類產品曾經是數據分析的唯一選擇,后來面對更大規模、多模異構等場景不太適用,才出現后續基于大數據及其他方案。但隨著近些年產品的發展,此類產品突破之前集群規模的限制,已經可以支持PB級及以上的規模。在使用體驗上更加接近于數據庫的能力。因此更為受到企業級用戶的歡迎。后續此類產品在向細粒度控制、資源彈性、異構計算等方向發展。

大數據架構

第二類產品是大數據架構的產品,其本質是一種并行計算及存儲系統。從早期出現的Hadoop及Hive、Spark到后期一系列產品,對應產品非常多樣。此類產品提供多種計算方式,且通常為了降低使用成本也提供了類SQL的訪問方式。但在如數據一致性、事務等方面較前者有明顯的差異。通常適用于某類特定場景的數據分析,其擴展能力較前者更有優勢。

分布式存儲架構

第三類產品是來自于分布式存儲產品,其原始訴求是提供各類數據的存儲。這里包括結構化、半結構乃至非結構化數據。隨著這些數據被保存,計算類的需求也被提出來。但通常這些計算往往是探索性的、無規律的。同時為了方便存儲的各類不同數據,還需提供統一的元數據,建立整體數據視角。

4. 技術選型:特定場景

對于特定場景部分,其根據數據專項應用領域,通常是比較好選擇的。例如針對圖數據庫領域,Neo4j等是常規的選擇;針對時序數據庫InfluxDB等是常規的選擇。此類產品選擇,往往可選擇的產品范圍不同,只需關注被選產品的核心能力即可。

關鍵字:數據庫技術選型

本文摘自:云技術之家

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 确山县| 桓仁| 眉山市| 江阴市| 特克斯县| 涪陵区| 金塔县| 铁岭县| 定襄县| 沁源县| 绥中县| 富蕴县| 普格县| 盐边县| 平乐县| 赤峰市| 延川县| 彭泽县| 兴宁市| 泾源县| 银川市| 靖宇县| 高安市| 依兰县| 建德市| 定安县| 宝兴县| 甘洛县| 亚东县| 澄城县| 丰顺县| 衡阳县| 永清县| 交口县| 广河县| 全南县| 黄陵县| 乌兰浩特市| 三穗县| 长春市| 保靖县|