近年來,隨著數(shù)據(jù)量的高速增長,分布式數(shù)據(jù)庫技術(shù)得到了快速的發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫開始從集中式模型向分布式架構(gòu)發(fā)展,基于關(guān)系型的分布式數(shù)據(jù)庫在保留傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)模型和基本特征下,從集中式存儲走向分布式存儲,從集中式計算走向分布式計算。
SequoiaDB巨杉數(shù)據(jù)庫,專注新一代大數(shù)據(jù)基礎(chǔ)架構(gòu)研發(fā),是國內(nèi)領(lǐng)先的新一代分布式數(shù)據(jù)庫廠商。其產(chǎn)品SequoiaDB巨杉數(shù)據(jù)庫是一款支持SQL、高并發(fā)、實時性、分布式、可擴展、靈活存儲的NewSQL數(shù)據(jù)庫。
巨杉在2016年仍然保持了產(chǎn)品技術(shù)和商業(yè)上的不斷創(chuàng)新。而在企業(yè)大數(shù)據(jù)市場爆發(fā)的大背景之下,巨杉迎來了真正的蛻變,在眾多的應(yīng)用實踐中,巨杉更是重新定義了分布式數(shù)據(jù)庫在企業(yè)級大數(shù)據(jù)市場中的位置。
巨杉數(shù)據(jù)庫
訪談一開始,王濤就巨杉過去一年在數(shù)據(jù)庫領(lǐng)域取得的新進展做詳細介紹,王濤表示,過去一年以來巨杉取得了許多的成績,這離不開廣大用戶和愛好者們的關(guān)注和支持,總結(jié)來說主要分為以下四個方面:
首先,巨杉數(shù)據(jù)庫 2.0正式發(fā)布,巨杉數(shù)據(jù)庫正式進入"2.0時代",特別在企業(yè)級的功能上有了許多提升;
其次,是巨杉獲得B輪融資,在資本寒冬下得到DCM的近億元B輪融資,是目前國內(nèi)新一代分布式數(shù)據(jù)庫領(lǐng)域最大一筆投融資。
再次,巨杉的企業(yè)級用戶持續(xù)增長,深耕金融、政府、電信等行業(yè),交通、制造、醫(yī)療等新興行業(yè)大數(shù)據(jù)嶄露頭角;
最后,巨杉獲得業(yè)界的認(rèn)可,成為2016年唯一入選硅谷"大數(shù)據(jù)生態(tài)地形圖"的中國廠商,并且連續(xù)兩年獲得《紅鯡魚》"全球創(chuàng)新100強"。
SequoiaDB 2.0亮點解析
在今年,巨杉數(shù)據(jù)庫正式進入了"2.0時代",SequoiaDB 2.0為用戶提供高并發(fā)實時計算、高吞吐量批處理分析、以及在線流處理計算等一系列企業(yè)級解決方案。這些新特性,符合如今各個主要行業(yè)對于大數(shù)據(jù)技術(shù)的需求,包括海量數(shù)據(jù)存儲、企業(yè)應(yīng)用的兼容易用、存儲計算的整合與優(yōu)化、以及多數(shù)據(jù)源類型數(shù)據(jù)的統(tǒng)一存儲等,幫助用戶快速進行跨系統(tǒng)數(shù)據(jù)的融和、提煉和再加工,加速提升企業(yè)的數(shù)據(jù)價值。相比"1.0時代"巨杉數(shù)據(jù)庫,其亮點可歸納為以下三點:
1.標(biāo)準(zhǔn)SQL支持:支持標(biāo)準(zhǔn)SQL2003與事務(wù)機制,支持JDBC、ODBC、Hibernate、Spring等通用框架,完美兼容現(xiàn)有業(yè)務(wù)系統(tǒng)的無縫遷移。SequoiaDB 2.0在完全支持標(biāo)準(zhǔn)SQL之后,將能夠適應(yīng)幾乎所有的企業(yè)級大數(shù)據(jù)需求,保證最低限度的遷移成本、學(xué)習(xí)成本,真正實現(xiàn)無縫對接。
2.雙存儲引擎: 雙引擎即為記錄存儲和塊存儲,SequoiaDB 2.0提供的對象存儲引擎包含了完整ECM企業(yè)內(nèi)容管理解決方案,包括文件的批次管理、版本管理、流程管理等一系列內(nèi)容管理核心功能。
3.內(nèi)存計算引擎集成:SequoiaDB 2.0通過深度集成最新的Spark 2.0內(nèi)存計算框架,實現(xiàn)了批處理分析、流處理等貼近應(yīng)用的功能。存儲層和計算層兩層分離的架構(gòu)、技術(shù)互補,是硅谷大數(shù)據(jù)新架構(gòu)的主流,將分布式計算與分布式存儲的能力分別發(fā)揮到了極致。
王濤表示,巨杉的"2.0時代"更專注企業(yè)級的數(shù)據(jù)庫技術(shù),幫助企業(yè)大數(shù)據(jù)快速落地,而這些新的特性也在市場上得到了眾多客戶的認(rèn)可。
NewSQL重新定義的企業(yè)級應(yīng)用
王濤表示,巨杉的客戶主要是在金融、政府、電信以及互聯(lián)網(wǎng)等行業(yè),特別是今年以來,在交通、制造、醫(yī)療等新興行業(yè)嶄露頭角。巨杉目前已擁有的客戶包括多家世界五百強企業(yè)(如中國銀行、民生銀行、廣發(fā)銀行、中國移動、中國電信等),各級政府客戶(國稅總局、廣州市政府等)和包括途牛網(wǎng)在內(nèi)的多家知名互聯(lián)網(wǎng)科技公司。
典型客戶應(yīng)用場景包括集中在對歷史數(shù)據(jù)的全量在線應(yīng)用,以及對非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用這兩大領(lǐng)域。
其中,歷史數(shù)據(jù)全量在線應(yīng)用一個典型的例子。在這一場景中巨杉的NewSQL數(shù)據(jù)庫替代了傳統(tǒng)的數(shù)據(jù)架構(gòu)中的ODS(貼源層),作為全量歷史數(shù)據(jù)的存儲層。一方面為DW數(shù)據(jù)倉庫部分進行了"瘦身",另一方面也將能實現(xiàn)對海量的歷史數(shù)據(jù)的實時操作,包括實時查詢和高性能讀寫等。
除了歷史全量數(shù)據(jù)意外,在"雙引擎"的部分,巨杉數(shù)據(jù)庫的塊存儲引擎還能處理海量的非結(jié)構(gòu)化數(shù)據(jù)的存儲,包括圖像、音視頻等數(shù)據(jù)的存儲,成為傳統(tǒng)企業(yè)內(nèi)容管理(ECM)的有力替代。
巨杉數(shù)據(jù)庫通過豐富的行業(yè)時間經(jīng)驗,重新定義了新一代分布式數(shù)據(jù)庫在企業(yè)級場景下的應(yīng)用,這些甚至都走在了眾多硅谷同類產(chǎn)品的前面。
客戶需求的新變化
隨著企業(yè)數(shù)據(jù)量的不斷增長,對數(shù)據(jù)庫的需求也有了新的變化,王濤認(rèn)為主要有三方面表現(xiàn):
首先,首先從業(yè)務(wù)場景上來看,大數(shù)據(jù)業(yè)務(wù)目前主要分為分析類和交互類,巨杉數(shù)據(jù)庫大的發(fā)展方向是以實時交互類為主。在交互類這塊,NewSQL是Hadoop架構(gòu)的有力補充,也是目前企業(yè)級大數(shù)據(jù)應(yīng)用中落地和見效最快的部分。如近線數(shù)據(jù)管理和查詢、非結(jié)構(gòu)化數(shù)據(jù)和影像數(shù)據(jù)管理、用戶畫像、數(shù)據(jù)湖平臺等場景,都非常適合用巨杉數(shù)據(jù)庫這樣的新一代分布式數(shù)據(jù)庫。
其次,大家都在談NoSQL和NewSQL。從傳統(tǒng)來看,NoSQL本身針對的是從互聯(lián)網(wǎng)起家的一些玩家,這些玩家可能對于SQL和其他的企業(yè)級的功能并不是很重視。但是,未來隨著新一代分布式數(shù)據(jù)庫在各個行業(yè)的不斷應(yīng)用和普及,NoSQL和NewSQL這兩者肯定是逐漸統(tǒng)一的過程,NoSQL數(shù)據(jù)庫會不斷注重企業(yè)級功能如SQL支持的提升。
最后,大數(shù)據(jù)環(huán)境下對于性能和穩(wěn)定性要求更為苛刻,在企業(yè)級的大數(shù)據(jù)應(yīng)用中,用戶不僅會對產(chǎn)品本身的技術(shù)要求更高,同時也需要原廠廠商能夠做到100%了解自己的產(chǎn)品,這樣才能應(yīng)對不斷變化的大數(shù)據(jù)需求。
SequoiaDB巨杉數(shù)據(jù)庫在這些新的需求中將作為Hadoop架構(gòu)的有力補充,服務(wù)于海量數(shù)據(jù)的實時交互,也就是Lambda架構(gòu)中的 Speed Layer的實時交互部分。