導語:最近,一部由吳秀波主演的三國題材劇《虎嘯龍吟》火遍大江南北,說的是魏蜀吳三國瓜“分”天下,到司馬氏的一統(tǒng),天下三分歸晉,再次達到“合”。而數(shù)據(jù)庫市場亦是如此,由SQL,NoSQL和NewSQL一起撐起的數(shù)據(jù)庫市場如今也有融合的趨勢,也許未來的數(shù)據(jù)庫只有一個,那就是NewSQL。
數(shù)據(jù)庫其實是個很窄的領域,但作為基礎軟件之一,它又是企業(yè)架構中不可缺少且很難被替換的一環(huán),因為企業(yè)90%的業(yè)務應用系統(tǒng)都是圍繞數(shù)據(jù)庫開發(fā),替換成本高風險大。
因此,即使是在云計算時代,數(shù)據(jù)庫服務依舊成為了云計算巨頭如亞馬遜AWS、阿里云必爭之地。無論是在去年的亞馬遜AWS re:Invent 2017大會又或是2017阿里云棲大會上,細心的人都會發(fā)現(xiàn),數(shù)據(jù)庫的比重越來越高,新數(shù)據(jù)庫服務的發(fā)布也越來越多。哪怕是即將到來的人工智能時代,筆者相信亦是如此,沒有數(shù)據(jù)何來人工智能?
當然巨頭之爭,不僅因為數(shù)據(jù)庫是核心競爭力的一種體現(xiàn),同時數(shù)據(jù)庫服務高額利潤也不容忽視。有數(shù)據(jù)顯示,雖然IaaS年年降價,但在過去三年,SaaS的價格卻上漲了大約8%。
數(shù)據(jù)庫類型眾多,誰才是未來王者?
隨著時代發(fā)展,應用場景的不斷變化,數(shù)據(jù)庫也從關系型數(shù)據(jù)庫的一統(tǒng)江湖到如今的群雄逐鹿,類型越來越多,按國外權威的DB-Engines分類:
目前數(shù)據(jù)庫種類多達14種,如傳統(tǒng)關系型、文件存儲、Key-Value、圖形、時間序列、面向對象、搜索引擎、列存儲等等。
因為類型太多,為了方便,也有一種分法把數(shù)據(jù)庫歸納劃分為3大類:SQL、NoSQL、NewSQL。
SQL指的是傳統(tǒng)的關系型數(shù)據(jù)庫,關系模型是在1970年由IBM的研究員E.F.Codd博士首先提出的,之后成為數(shù)據(jù)庫領域主流模型,經典應用在金融和電信行業(yè),保證數(shù)據(jù)庫的數(shù)據(jù)不會出錯和丟失。
NoSQL則相反,泛指非關系型數(shù)據(jù)庫,其實非關系模型也并非新事物,早在關系型數(shù)據(jù)庫出現(xiàn)之前就已經存在,只不過從2000年開始隨著互聯(lián)網(wǎng)爆發(fā)才變得流行,主要應用在互聯(lián)網(wǎng)行業(yè),承接應用大規(guī)模并發(fā)性的流量,解決業(yè)務創(chuàng)新不受底層數(shù)據(jù)庫的約束,能快速靈活的擴展。
相比前兩者,NewSQL就要新的多,NewSQL一詞是在2011年的一份商業(yè)分析報告中被首次提出。NewSQL是指一類新式的關系型數(shù)據(jù)庫系統(tǒng),針對OLTP(讀-寫)工作負載,追求提供和NoSQL系統(tǒng)相同的擴展性能,且仍然保持ACID和SQL等特性。
那么到底誰才是數(shù)據(jù)庫未來的主流?其實答案已經呼之欲出,傳統(tǒng)的數(shù)據(jù)庫架構,在線數(shù)據(jù)處理的(OLTP)及在線數(shù)據(jù)分析(OLAP)的數(shù)據(jù)往往需要兩份存儲,效率及成本都是相應的挑戰(zhàn)。
因此,OLTP(查詢)+OLAP(分析)的融合才是未來數(shù)據(jù)庫發(fā)展方向和主流,對企業(yè)而言,不僅免去傳統(tǒng)數(shù)據(jù)倉庫的ETL過程,降低存儲成本的同時極大的縮短數(shù)據(jù)分析的延遲,使得實時分析決策系統(tǒng)成為可能。
眾觀以上三類數(shù)據(jù)庫,顯然符合條件的只有NewSQL。而從目前的發(fā)展來看,SQL與NoSQL也已經呈現(xiàn)向NewSQL融合的趨勢。阿里云近期就大膽預言,或許未來的數(shù)據(jù)庫只有1個,那就是NewSQL。
阿里云推出首個模塊化云數(shù)據(jù)庫
1月17日,阿里云在北京舉辦了一場2018云數(shù)據(jù)庫智能未來大會,看似只是一場普通的技術交流會,但其背后的意義卻非比尋常。
會上阿里云不僅分享了對數(shù)據(jù)庫未來趨勢的判斷,同時宣布推出首個模塊化云數(shù)據(jù)庫Redis 4.0版,性能上還提升了300%之多。非比尋常之處并非指性能提升300%,而是阿里云推出的這個模塊化云數(shù)據(jù)庫Redis 4.0,因為它打破了固化的鍵值存儲領域,開創(chuàng)了模塊化數(shù)據(jù)庫的先河。
阿里云對數(shù)據(jù)庫未來9個肯定的判斷
對于數(shù)據(jù)庫未來的趨勢,阿里云有9個肯定的判斷,筆者總結如下:
1) OLTP(查詢)+OLAP(分析)的融合未來是數(shù)據(jù)庫的主流
2) 未來只需要一個在線的插件式的NewSQL數(shù)據(jù)庫
3) 沒有NewSQL:大規(guī)模增長的,靈活的企業(yè)數(shù)據(jù)無從談起
4) 純軟件必死,軟硬一體是未來NewSQL的必然方向
5) 持續(xù)增長的海量計算壓力需要FPGA
6) 通用架構的時代一去不回,為數(shù)據(jù)庫定制的架構將是主流
7) 每一KB的數(shù)據(jù),都在變得越來越寶貴,多可用區(qū)容災,必將成為數(shù)據(jù)庫的標配
8) 數(shù)據(jù)庫勒索事件將更加泛濫,安全形勢越加嚴峻
9) 未來的數(shù)據(jù)庫,一定在云上
阿里云這9個肯定判斷大部分并不難理解筆者也部分認同,但同樣也有不少疑問,模塊化云數(shù)據(jù)庫是個什么玩意?阿里云為什么敢狂言說“純軟件必死,軟硬一體才是未來NewSQL的必然方向”,那是否意味著沒有一體機的純軟數(shù)據(jù)庫公司會死掉?數(shù)據(jù)庫定制架構又是怎么個定制邏輯?能給用戶帶來怎樣的提升?Redis是開源數(shù)據(jù)庫,阿里云在此基礎上又做了什么?
對話阿里云云數(shù)據(jù)庫技術總監(jiān)蔡松露
帶著這些問題,筆者現(xiàn)場采訪了阿里云云數(shù)據(jù)庫技術總監(jiān)蔡松露(花名:子嘉),就以上問題進行了深入的交流。
▲阿里云云數(shù)據(jù)庫技術總監(jiān)蔡松露
蔡松露對筆者表示,此次,Redis 4.0版的發(fā)布有著非同一般的意義,不僅是阿里云在源碼層面做了近40項的功能改進。更因為它打破了固化的鍵值存儲領域。Redis 4.0的模塊化功能提供了搜索、時序、機器學習、文檔處理等大數(shù)據(jù)分析模塊。用戶可以根據(jù)模塊基于Redis構建搜索、地理定位、時序、機器學習等場景,讓同一份數(shù)據(jù)庫的計算和分析成為可能。
眾所周知,過去,企業(yè)和開發(fā)者在數(shù)據(jù)庫上做搜索或機器學習所面臨的環(huán)境是不同的,每新增一個功能都需要重構一次數(shù)據(jù)庫代碼,既費時又費力。而模塊化數(shù)據(jù)庫不同,開發(fā)者只需將搜索、機器學習、地理位置和時序列裝到阿里云Redis module這個“集裝箱”里,無需代碼改動就可運行,效率大幅提升。
他還特別強調,在阿里提倡開源需要擁抱、回饋、融合、開放的主旨下:阿里云Redis進行了開源,項目名為ApsaraCache。阿里云Redis團隊在整個Redis 4.0開源版本中的貢獻僅次于Redis原作者,為第2名。發(fā)布了近40項功能。
“純軟件必死,軟硬一體才是未來NewSQL的必然方向”并非阿里云危言聳聽,蔡松露解釋道,硬件技術的發(fā)展讓以前很多的數(shù)據(jù)庫瓶頸正在被逐一突破,例如緩慢的磁盤被快速的閃存取代。因此,數(shù)據(jù)庫技術需要向配硬件適配,才能享受更大的技術紅利。尤其是在未來的邊緣計算和IOT場景中,需要深度定制和優(yōu)化。否則,競爭力只會越來越弱,即便不死也是半死不活。
關于數(shù)據(jù)庫定制架構成為主流,蔡松露指出,以前數(shù)據(jù)庫是跑在操作系統(tǒng)上,每次網(wǎng)絡和磁盤操作都要做大量的上下文切換,在全新的用戶態(tài)架構中,繞過了操作系統(tǒng)的多層調用,對性能有了100%的提升。
猶如以前的數(shù)據(jù)庫架構就想一道道的收費關閘,數(shù)據(jù)到達關閘后需要等待關閘開啟。用了全用戶態(tài)的架構后,猶如開了綠色通道,在數(shù)據(jù)庫到達關閘前,已經準備好快速放行。
據(jù)了解,性能方面,阿里云Redis已經完成25GE網(wǎng)絡的全線升級,并結合硬件性能提升,基于內核的技術架構改造,整體性能提升3倍。原先一個標準版的Redis提供10w的QPS,如果QPS要求更高需要選擇阿里云的讀寫分離版本或者集群版本架構擴展相應性能,現(xiàn)在30w以內的QPS就完全不用擴展配置,省去了大量成本。
此外,基于LFU的熱點Key發(fā)現(xiàn)及緩存機制等Feature,阿里云Redis4.0可以有效優(yōu)化直播場景中信息卡頓等現(xiàn)象。目前國內80%的視頻直播網(wǎng)站在使用阿里云Redis數(shù)據(jù)庫,包括近期如火如荼的《芝士超人》等移動直播答題APP都將題庫、消息等熱點數(shù)據(jù)放在阿里云Redis上
除了Redis外,本次大會上,阿里云還推出了MongoDB 3.4版本,可提供TerarkDB、RocksDB和WiredTiger三引擎切換。以及比社區(qū)版提升3倍新能的HBase1.1,成本僅有此前的十分之一。
采訪最后,蔡松露指出:“傳統(tǒng)的數(shù)據(jù)庫行業(yè)定律已經被打破,融合式、兼容并蓄的數(shù)據(jù)庫,將是未來行業(yè)發(fā)展的一大趨勢。”他還預言,也許未來的數(shù)據(jù)庫只有一個,那就是NewSQL。