以下是現(xiàn)場(chǎng)速記。
PingCAP合伙人執(zhí)行副總裁 余夢(mèng)杰
余夢(mèng)杰:大家下午好!我是來自PingCAP的余夢(mèng)杰,很高興今天給大家作一個(gè)分享。我今天講的題目是TiDB助力數(shù)據(jù)價(jià)值實(shí)時(shí)變現(xiàn)。
PingCAP是一家源自中國(guó)的分布式數(shù)據(jù)庫(kù)廠商,我們是一家創(chuàng)業(yè)公司,我們已經(jīng)成立第七個(gè)年頭了。到目前為止,我們?cè)谌蛴?個(gè)辦公室,研發(fā)人員的比例超過了60%,目前服務(wù)于全球超過2000的用戶。
如果關(guān)注數(shù)據(jù)庫(kù)的朋友都會(huì)了解到,在國(guó)內(nèi)我們是有比較全維的排行榜,TiDB在這個(gè)排行榜上已經(jīng)連續(xù)20多個(gè)月排名第一,處于比較領(lǐng)先的狀態(tài)。
值得一提的是這個(gè)排行榜目前收錄了大概230多家國(guó)產(chǎn)數(shù)據(jù)庫(kù),但是如果我們?nèi)タ慈蜃顧?quán)威的收錄的數(shù)據(jù)庫(kù)大概只有350家左右,在國(guó)家扶持、行業(yè)繁榮背景下,客觀的也給我們客戶、我們用戶在選擇數(shù)據(jù)庫(kù)時(shí)帶來了很多困擾 ,所以怎樣更好科學(xué)界定、評(píng)測(cè)、給出推薦,是我們的監(jiān)管要做的很重要的事情。相信隨著時(shí)間 的推移,會(huì)把頭部廠商逐步梳理出來。
在這個(gè)過程中,經(jīng)過七年的時(shí)間,我們已經(jīng)比較自豪的可以說TiDB是國(guó)人主導(dǎo)的全球的頂級(jí)的開源項(xiàng)目。我們可以看各種各樣的開源排名、活躍度、貢獻(xiàn)度以及分布的排名,我們都是排在非常前列的。值得一提的我們?cè)谌ツ昕苿?chuàng)中國(guó)開源創(chuàng)新榜唯一一家同時(shí)獲得開源社區(qū)、開源公司和開源產(chǎn)品的一家企業(yè)。
TiDB的發(fā)展是依托于開源、云一步步做起來的,如果熟悉開源的朋友大家都知道,開源本身有三個(gè)特別顯而易見的好處:加速產(chǎn)品創(chuàng)新,因?yàn)榈芸?在全球范圍內(nèi)更高效的病毒式口碑傳播;幫助我們更高效的獲客。
開源還有它本身承載極其重大的公益和社會(huì)價(jià)值。像國(guó)家疾控中心疫苗庫(kù)就在使用TiDB,但是也是通過我們合作伙伴去用的,這本身也是它的社會(huì)價(jià)值的體現(xiàn)。
云更不用說了,大家都知道我們的用戶可以像水和電一樣來使用云的資源,從而它的整個(gè)迭代,在它的彈性、灰度升級(jí)上都有極高的便利性。所以云和開源融合在一起的時(shí)候,它不是一個(gè)加法而是乘法,可以加速整個(gè)產(chǎn)品的迭代。
這是我們最近取得的成績(jī),數(shù)據(jù)庫(kù)行業(yè)客戶口碑和推薦是非常重要的。我們?cè)谏忱膱?bào)告里也處于領(lǐng)導(dǎo)的象限。
我做數(shù)據(jù)庫(kù)比較久了,在數(shù)據(jù)庫(kù)的行業(yè)我們有一些行話,我們通常講這個(gè)世界上只有兩種數(shù)據(jù)庫(kù):被人罵的;沒人用的。雖然它比較大白話,但是很樸素的反饋出了基礎(chǔ)軟件要想持續(xù)創(chuàng)新、要想繁榮發(fā)展做大的雞生蛋和蛋生雞的難題。PingCAP在這方面在探索中國(guó)基礎(chǔ)軟件全球化發(fā)展的最佳的路徑,我們講的是自主開源,我們會(huì)自主研發(fā),掌握核心的代碼,沒有用到一行mysql代碼,沒有斷供風(fēng)險(xiǎn)。
我們通過商業(yè)版、發(fā)行版拓展我們業(yè)務(wù)市場(chǎng),同時(shí)可以很好主導(dǎo)和決策我們產(chǎn)品的研發(fā)方向。這里有兩點(diǎn)重點(diǎn)去講:
第一.從供應(yīng)鏈來看,它占據(jù)了供應(yīng)鏈的上游,我們?cè)趪?guó)內(nèi)還有很多大的機(jī)構(gòu)跟我們合作TiDB的發(fā)行版,作為整個(gè)下游去豐富整個(gè)生態(tài),這個(gè)從根本上消除了斷供的風(fēng)險(xiǎn)。
第二.很多朋友問我們說TiDB發(fā)展這么多年,它核心的競(jìng)爭(zhēng)力在哪兒?我們認(rèn)為TiDB核心競(jìng)爭(zhēng)力在于它產(chǎn)品迭代和演進(jìn)的加速度和它的創(chuàng)造力,我覺得這個(gè)是最關(guān)鍵的。
這個(gè)動(dòng)能是怎么來的?歸根到底來自于中國(guó)領(lǐng)先全球的業(yè)務(wù)需求。大家都知道我們是從互聯(lián)網(wǎng)做起來的,通過開源的形式。中國(guó)的消費(fèi)互聯(lián)網(wǎng)是全球領(lǐng)先的,全球領(lǐng)先的需求一定能夠帶來領(lǐng)先的業(yè)務(wù)場(chǎng)景,從而能夠帶來最領(lǐng)先的產(chǎn)品需求。
另一方面中國(guó)經(jīng)過這么多年的發(fā)展,我們?nèi)瞬欧e累已經(jīng)跟硅谷跟世界上一流水平是可以齊頭并進(jìn)了。所以如果我們能用開源的形式打造人盡其才的設(shè)施,把場(chǎng)景、人才吸納進(jìn)來,這個(gè)是構(gòu)成我們最核心的競(jìng)爭(zhēng)力。
挑戰(zhàn)也很大,我們一直講做開源特別需要踐行長(zhǎng)期主義,要有長(zhǎng)期投入。以PingCAP為例,我們長(zhǎng)期有幾十個(gè)人團(tuán)隊(duì),沒有背任何的數(shù)字和營(yíng)銷目標(biāo),專注做開源社區(qū)。考核它的是能不能讓社區(qū)自發(fā)生長(zhǎng),活躍度、長(zhǎng)期度和貢獻(xiàn)。
相比國(guó)內(nèi)230多家國(guó)產(chǎn)數(shù)據(jù)庫(kù),這里還是有一些風(fēng)險(xiǎn)的。它的好處是可以快速的進(jìn)行封裝投入使用,但是有幾點(diǎn)風(fēng)險(xiǎn)需要大家注意。
第一.有很多廠商拿開源的mysql進(jìn)行封裝做成自己的產(chǎn)品,但是這個(gè)里面有很大的法律風(fēng)險(xiǎn)。因?yàn)閙ysql采用AGPL,按照甲骨文官方要求和國(guó)際通行準(zhǔn)則來看如果用它進(jìn)行封裝,必須把它開源出來,否則就違法,這個(gè)真的是違反法律的。包括國(guó)內(nèi)的知識(shí)產(chǎn)權(quán)相關(guān)的法院,也有多起類似的判例。
第二.它在整個(gè)迭代和演進(jìn)上的風(fēng)險(xiǎn)。現(xiàn)在不管你是用哪個(gè)數(shù)據(jù)庫(kù),它的架構(gòu)都是20年前、30年前的架構(gòu)了,它的整個(gè)架構(gòu)的天花板相對(duì)來講是比較低的。所以你在它的基礎(chǔ)上,在一個(gè)天花板比較低的架構(gòu)上做迭代、創(chuàng)新,你很難適應(yīng)未來大數(shù)據(jù)量還有海量并發(fā)的需求。所以我們算是順應(yīng)這個(gè)時(shí)代做了這樣的產(chǎn)品。
在國(guó)產(chǎn)化這一塊,我們一直非常積極的去擁抱整個(gè)國(guó)產(chǎn)化的工作。包括所有的信創(chuàng)相關(guān)的聯(lián)盟、工作組我們都在里面,我們也大量的參與了各種規(guī)范、標(biāo)準(zhǔn)的制定,也是在各種像分布式數(shù)據(jù)庫(kù)開源專委會(huì)相應(yīng)的委員,參與編制了很多這方面的標(biāo)準(zhǔn)。
從去年開始,像北京市的市委書記、市長(zhǎng)工信部副部長(zhǎng)陸續(xù)考察調(diào)研PingCAP,也考察我們自主開源+國(guó)際化的戰(zhàn)略。
這我們的logo墻,發(fā)展了七年,我們初步有統(tǒng)計(jì)的應(yīng)該是超過了2千多家。大家可以看到這個(gè)行業(yè)分布非常廣,就數(shù)據(jù)庫(kù)來講它是基礎(chǔ)軟件,基礎(chǔ)軟件的特點(diǎn)是它是全行業(yè)的,所以可以看到在像銀行、證券、保險(xiǎn)包括像制造業(yè)、電信、能源、零售、物流、快消等等其實(shí)都有涵蓋。以金融行業(yè)為例,四大行里的兩家,12股份制銀行里5家以及頭部的像銀行間組織、保險(xiǎn)、證券我們都有深度合作,也是和這些客戶一起解決我們面臨的卡脖子的問題和業(yè)務(wù)創(chuàng)新的情況。
我們可能還是為數(shù)不多的中國(guó)能夠真正走出去成功進(jìn)入發(fā)達(dá)國(guó)家經(jīng)濟(jì)體,參與競(jìng)爭(zhēng)全球標(biāo)準(zhǔn)的企業(yè)。我們現(xiàn)在在美國(guó)、日本、新加坡都有分公司,把業(yè)務(wù)做到了比較不錯(cuò)的體量,都有很多的頭部案例。
講一下HTAP,大家可以明顯的看到2014年開始整個(gè)云上數(shù)據(jù)庫(kù)或者說整個(gè)NewSQL創(chuàng)新出現(xiàn)非常多的變化,核心是云原生的興起帶來巨大的變革。
這幾年大家都會(huì)聽到一個(gè)詞,我們會(huì)講HTAP,它是指混合負(fù)載,在一套數(shù)據(jù)庫(kù)里又可以去處理你的在線交易就是生產(chǎn)系統(tǒng),同時(shí)你也不需要數(shù)據(jù)搬遷就可以做實(shí)時(shí)的分析,大大的簡(jiǎn)化我們技術(shù)棧。
為什么很多客戶需求層出不窮?本質(zhì)上大家都希望發(fā)揮數(shù)據(jù)價(jià)值,我們都知道數(shù)據(jù)是新時(shí)代的石油,數(shù)據(jù)的價(jià)值越實(shí)時(shí),它的價(jià)值就越高。因?yàn)閷?shí)時(shí)的意義在于它可以幫助我們做正確的決策,避免做錯(cuò)誤的決策或者是去糾錯(cuò)。比如做促銷或者做廣告的投放,肯定盡快知道它的評(píng)估效果,幫助你下一步的決策。
2022年開始整個(gè)在HTAP在混合交易這一塊出現(xiàn)了很多新的變化,包括去年我們5.0發(fā)布了并行計(jì)算引擎,大幅度提高了HTAP里面分析型的能力,包括今年的5月份谷歌AlloyDB也補(bǔ)全了它在整個(gè)HTAP的短板,包括SnowFlake在今年的6月份發(fā)布了Unistore為它的ODS提供在線的服務(wù)。
對(duì)于混合負(fù)載HTAP實(shí)時(shí)分析來看,它帶來幾個(gè)好處:
第一.它沒有任何數(shù)據(jù)搬遷的過程。以前都是生產(chǎn)系統(tǒng)產(chǎn)生數(shù)據(jù),這時(shí)通過文件的傳輸也好,通過計(jì)算也好會(huì)到一套AP系統(tǒng)再進(jìn)行分析,這個(gè)過程是非常本周的,我們沒有這個(gè)過程可以就地分析,它有非常好的TP和AP的隔離性。
第二.大量的簡(jiǎn)化技術(shù)棧。過去像一些中小企業(yè)要雇兩撥人,一撥人維護(hù)在線系統(tǒng),另外一撥是大數(shù)據(jù)團(tuán)隊(duì)做離線分析。但我們覺得用上TiDB,你只需要用一種語(yǔ)言,你只要會(huì)mysql就會(huì)大數(shù)據(jù)分析,這樣會(huì)大量節(jié)省運(yùn)維心力甚至團(tuán)隊(duì)。
第三.實(shí)時(shí)洞察。這張圖核心在于現(xiàn)在為止我們技術(shù)的舒適區(qū),只要數(shù)據(jù)量在500T以內(nèi),查詢平均要求在半分鐘,我們都是比較舒適的。我們?cè)谶@塊有大量的實(shí)踐。
從關(guān)鍵能力來看,TiDB首先是關(guān)系型數(shù)據(jù)庫(kù),100%的關(guān)系型,因?yàn)樗菍?shí)現(xiàn)強(qiáng)一致事務(wù)的。在這基礎(chǔ)上可以橫向擴(kuò)展,從而對(duì)應(yīng)用透明。所有業(yè)務(wù)問題通過加機(jī)器來解決,不用再去改你的應(yīng)用,應(yīng)用不會(huì)受制于基礎(chǔ)架構(gòu),同時(shí)它的運(yùn)維工具,它的接口包括它的擴(kuò)展性就不一一闡述了。
我們同時(shí)支持多種部署,不管你的虛機(jī)、云上的機(jī)器或者你用云原生容器管理平臺(tái),我們都可以去部署。值得一提的是,我們可能是極少數(shù)的支持在kubernetes去部署的國(guó)產(chǎn)數(shù)據(jù)庫(kù),這個(gè)為我們的客戶帶來極大的便利性。
作為OLTP數(shù)據(jù)庫(kù),所有該有的我們都齊備。包括它的擴(kuò)展性、高可用和數(shù)據(jù)強(qiáng)一致性以及高度兼容性,我們沒有用到一行mysql代碼,我們卻兼容它的協(xié)議,完全合規(guī)的去做這樣的工作。
從場(chǎng)景來看,我們初步的去列了這幾種場(chǎng)景包括混合負(fù)載、流式計(jì)算、數(shù)據(jù)中樞場(chǎng)景,數(shù)據(jù)在哪兒你就就地展開分析,提供saas場(chǎng)景。另外線上已經(jīng)有大量分庫(kù)分表之后的數(shù)據(jù)庫(kù),我可以通過我的實(shí)時(shí)寫入能力和快速分析能力,把所有的庫(kù)匯聚到更大的中臺(tái)數(shù)據(jù)里然后進(jìn)行實(shí)時(shí)分析帶來整個(gè)生產(chǎn)力的提升。
中通case,整個(gè)包裹物流追蹤系統(tǒng),需要全域的追蹤。我們成功的把它遷到了TiDB,從5分鐘變成了1分鐘以內(nèi)。
得益于我們的創(chuàng)新和迭代的能力,我們版本也快速的迭代和創(chuàng)新,每一個(gè)版本都有我們?cè)缙诤芏嗫蛻舫掷m(xù)的給我們?nèi)ゴ蚰ィ覀冇米詈玫姆?wù)保證客戶成功。大家可以看到從5.0開始,我們整體企業(yè)級(jí)能力,我們核心的OLTP響應(yīng)時(shí)間、延遲、抖動(dòng)都已經(jīng)是完全能夠滿足絕大部分客戶關(guān)鍵業(yè)務(wù)的需求,關(guān)鍵6.0也是今年4月份剛剛發(fā)布的,也是有巨大的性能提升,整體比5.0提升大概50%。
這是部分客戶的反饋,包括像微眾,它用我們來跑它的批量,做日間和日終結(jié)算,耗時(shí)降低58%。包括中通從5分鐘縮短為1分鐘,北京銀行,現(xiàn)在上了差不多23套業(yè)務(wù)系統(tǒng)了。
我們是天然為云而生的數(shù)據(jù)庫(kù),我們可以多云部署,我們可以跟K8S深度適配,可以在阿里云上享用我們的服務(wù)。我們堅(jiān)信開源、云原生加上全球化,這是PingCAP發(fā)展的核心理念,也是我們的戰(zhàn)略基石。
今天就給大家匯報(bào)到這里,謝謝!