當(dāng)今社會(huì),可以說進(jìn)入了大數(shù)據(jù)時(shí)代,爆炸性的數(shù)據(jù)信息給傳統(tǒng)的計(jì)算技術(shù)以及信息技術(shù)帶來術(shù)挑戰(zhàn)。大數(shù)據(jù)技術(shù)正在助力公眾、企業(yè)打開DT世界的大門。學(xué)習(xí)大數(shù)據(jù)不僅前景好,而且工資高。為了幫助程序員更好、更深入的了解大數(shù)據(jù),w3cschool整理了GitHub Awesome Big Data資源,供大家參考。本資源類型主要包括:大數(shù)據(jù)框架、論文等實(shí)用資源集合。
1.關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)
關(guān)系數(shù)據(jù)庫管理系統(tǒng)就是管理關(guān)系數(shù)據(jù)庫,并將數(shù)據(jù)組織為相關(guān)的行和列的系統(tǒng)。mySQL、SQL Server、PostgreSQL 2、Oracle 數(shù)據(jù)庫等是一個(gè)關(guān)系數(shù)據(jù)庫管理系統(tǒng) (RDBMS)。
2.分布式文件系統(tǒng)
分布式文件系統(tǒng)是指文件系統(tǒng)管理的物理存儲(chǔ)資源不一定直接連接在本地節(jié)點(diǎn)上,而是通過計(jì)算機(jī)網(wǎng)絡(luò)與節(jié)點(diǎn)相連,也就是集群文件系統(tǒng),可以支持大數(shù)量的節(jié)點(diǎn)以及PB級的數(shù)量存儲(chǔ)。w3cschool資深用戶為大家收集的分布式文件系統(tǒng)資源,主要包括Apache HDFS、BeeGFS、Ceph Filesystem、Disco DDFS等。
3.鍵-值數(shù)據(jù)模型
鍵值數(shù)據(jù)庫特別面向聚合,也就是說這類數(shù)據(jù)庫主要是通過聚合來構(gòu)建的。它包含大量聚合,每個(gè)聚合中都有一個(gè)獲取數(shù)據(jù)所用的鍵或ID。此部分內(nèi)容,主要囊括Aerospike、Amazon DynamoDB、ElephantDB、EventStore、GridDB等。
4.分布式編程
分布式編程是可在分布計(jì)算機(jī)系統(tǒng)的幾臺(tái)計(jì)算機(jī)上同時(shí)協(xié)調(diào)執(zhí)行的程序設(shè)計(jì)方法,分布式程序設(shè)計(jì)的主要特征是分布和通信。采用分布式程序設(shè)計(jì)方法設(shè)計(jì)程序時(shí),一個(gè)程序由若干個(gè)可獨(dú)立執(zhí)行的程序模塊組成。W3Cschool資深用戶為大家收集的分布式編程資源,主要包括AddThis Hydra、AMPLab SIMR、Apache Beam、Apache Crunch、Cascalog等內(nèi)容。
5.文件數(shù)據(jù)模型
W3Cschool資深用戶為大家收集的文件數(shù)據(jù)模型,雖然內(nèi)容不多,但是都是精華,主要包括Actian Versant、Crate Data、Facebook Apollo、jumboDB等,都很實(shí)用,快去公眾號看看吧。
6.Key -Map 數(shù)據(jù)模型和框架
此部分內(nèi)容,主要囊括Apache Accumulo 、Apache Cassandra 、Apache HBase 等知識(shí)。
框架資源中,W3Cschool資深用戶還在收集中,暫時(shí)整理好的資源包括Apache Hadoop、Tigon。
上面W3Cschool資深用戶為大家收集的大數(shù)據(jù)學(xué)習(xí)資源大全,希望能夠幫助大家。這部分內(nèi)容,還在持續(xù)整理中。未來社會(huì)是大數(shù)據(jù)時(shí)代的社會(huì),大數(shù)據(jù)開發(fā)的前途無限光明,還等什么,趕緊去學(xué)習(xí)吧!