佘暉認(rèn)為在大數(shù)據(jù)時(shí)代,關(guān)系型數(shù)據(jù)庫或?qū)⒈籋adoop解決方案取代。
傳統(tǒng)上,一個(gè)高端大氣的數(shù)據(jù)中心,IBM的小型機(jī)、Oracle(中文譯為甲骨文)的數(shù)據(jù)庫以及EMC存儲(chǔ)設(shè)備,可以說缺一不可。由這三駕馬車構(gòu)成的從軟件到硬件的企業(yè)數(shù)據(jù)庫系統(tǒng),幾乎占領(lǐng)了全球大部分企業(yè)級(jí)數(shù)據(jù)庫系統(tǒng)市場(chǎng)份額。
大數(shù)據(jù)時(shí)代讓IOE(IBM、Oracle、EMC)看似牢不可破的市場(chǎng)地位開始動(dòng)搖。在星環(huán)科技總經(jīng)理佘暉看來,傳統(tǒng)數(shù)據(jù)庫對(duì)海量數(shù)據(jù)的處理性能并不理想,大數(shù)據(jù)時(shí)代需要新一代數(shù)據(jù)庫產(chǎn)品,終將有新公司取代Oracle的市場(chǎng)地位。
Hadoop開源架構(gòu)逐漸深入適應(yīng)企業(yè)環(huán)境,其瘋狂的發(fā)展勢(shì)頭已無法阻擋。獨(dú)立分析機(jī)構(gòu)Forrester Research公司發(fā)布的《Forrester浪潮:大數(shù)據(jù)Hadoop解決方案》報(bào)告顯示,Hadoop全新獨(dú)特的數(shù)據(jù)管理方案正在幫助企業(yè)變革大數(shù)據(jù)存儲(chǔ)、處理、分析及共享的方式。不久前在美國,Hadoop領(lǐng)域里代表性公司之一的Cloudera獲得F輪融資,融得9億美元,估值達(dá)到41 億美元。Cloudera之所以能夠達(dá)到高估值,是因?yàn)橘Y本市場(chǎng)看到其可能會(huì)取代Oracle的市場(chǎng)地位。這樣的產(chǎn)業(yè)趨勢(shì)對(duì)中國也影響深遠(yuǎn)。2013年,曾任Intel數(shù)據(jù)中心軟件部亞太區(qū)CTO的孫元浩看準(zhǔn)這個(gè)趨勢(shì),創(chuàng)辦了星環(huán)信息科技(上海)有限公司(簡稱星環(huán)科技),專注為企業(yè)開發(fā)Hadoop發(fā)行版。2013年底,星環(huán)科技發(fā)布了國內(nèi)首個(gè)全面支持Spark和Hadoop2.0的大數(shù)據(jù)平臺(tái)軟件——Transwarp Data Hub(TDH)。Spark作為一個(gè)通用的并行計(jì)算框架,已經(jīng)成為繼Hadoop之后又一大熱門開源項(xiàng)目。
短短一年間,星環(huán)科技就被資本市場(chǎng)看中,并于今年中成功獲得近千萬美元規(guī)模的A輪融資。自此,以星環(huán)科技為代表的中國Hadoop發(fā)行版廠商真正確立,并開始形成國外以Cloudera為代表,國內(nèi)以星環(huán)科技為代表的Hadoop 發(fā)行版行業(yè)態(tài)勢(shì)。
星環(huán)科技創(chuàng)始團(tuán)隊(duì)在Hadoop發(fā)行版領(lǐng)域起步早。佘暉介紹,TDH是國內(nèi)落地案例最多的Hadoop數(shù)據(jù)管理軟件,用戶在用的項(xiàng)目已經(jīng)超過數(shù)十個(gè)。通常來說,要挖掘大數(shù)據(jù)價(jià)值應(yīng)用到各行各業(yè),需要一個(gè)硬件供應(yīng)商提供硬件,一個(gè)軟件供應(yīng)商提供數(shù)據(jù)庫,并由數(shù)據(jù)挖掘供應(yīng)商提供算法。星環(huán)科技發(fā)布的TDH可以看做是大數(shù)據(jù)時(shí)代的新型數(shù)據(jù)庫。
由于TDH融合了Spark和Hadoop2.0兩種先進(jìn)技術(shù),TDH處理數(shù)據(jù)性能并非傳統(tǒng)數(shù)據(jù)庫乃至開源Hadoop可比擬。據(jù)介紹,TDH能夠處理10GB到100PB的數(shù)據(jù),傳統(tǒng)Hadoop適用面為100TB以上(1TB=1024GB)。值得一提的是,Hadoop數(shù)據(jù)管理軟件對(duì)硬件要求低,只需要幾十臺(tái)便宜的PC Server即可。如果用戶數(shù)據(jù)增長,只需要將PC Server的數(shù)量變成幾百乃至幾萬臺(tái)。而傳統(tǒng)數(shù)據(jù)庫必須由價(jià)格不菲的小型機(jī)來支撐。
佘暉認(rèn)為在大數(shù)據(jù)時(shí)代,企業(yè)對(duì)TDH具有較大需求,Oracle的數(shù)據(jù)庫已經(jīng)無法跟上大數(shù)據(jù)時(shí)代的步伐。早在2011年,星環(huán)科技創(chuàng)始團(tuán)隊(duì)就在南方某運(yùn)營商落地一個(gè)Hadoop項(xiàng)目。過去手機(jī)賬單查詢?cè)谝幻雰?nèi)可以返回結(jié)果,但隨著數(shù)據(jù)業(yè)務(wù)的增加,手機(jī)賬單上不僅有電話短信明細(xì),同時(shí)還有流量明細(xì),使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫已經(jīng)無法做到秒級(jí)反饋。客戶在尋找解決方案時(shí)采用了該團(tuán)隊(duì)打造的Hadoop方案,最終以低成本獲得高性能。
在佘暉看來,數(shù)據(jù)庫產(chǎn)品比拼的就是研發(fā)實(shí)力。“有些客戶十分直接,直接給你20T的數(shù)據(jù),看你究竟要多長時(shí)間跑出來。”
佘暉認(rèn)為大數(shù)據(jù)領(lǐng)域是小公司的創(chuàng)業(yè)舞臺(tái)。“企業(yè)市場(chǎng)將來會(huì)有天翻地覆的變化,企業(yè)數(shù)據(jù)庫都要更換成能夠適應(yīng)大數(shù)據(jù)時(shí)代的產(chǎn)品。”星環(huán)科技希望能夠把握其中的機(jī)會(huì)。
盡管市場(chǎng)潛力巨大,但目前Hadoop數(shù)據(jù)管理軟件還僅僅被應(yīng)用在客戶的邊緣系統(tǒng)。佘暉稱,沒有人能夠預(yù)測(cè)這個(gè)市場(chǎng)何時(shí)會(huì)爆發(fā),但它一定會(huì)來。一旦Hadoop數(shù)據(jù)管理軟件進(jìn)入客戶的核心系統(tǒng),需求量將會(huì)劇增。
“在創(chuàng)業(yè)期,我們所要做的就是不斷將產(chǎn)品做好,然后靜待開花。” 佘暉說到。