《企業(yè)網(wǎng)D1Net》3月30日訊
2011年如果你去給大企業(yè)的IT經(jīng)理介紹大數(shù)據(jù),他會說有個叫“H”什么的技術(shù),沒有太多人聽說過Hadoop;2012年你再去,別人會問你,你的Hadoop和開源的有什么不同?2013年有人說Hadoop是每個大中企業(yè)的IT玩具;2014年企業(yè)紛紛試水Hadoop;2015年??
Hadoop真的來了!,起源于Google和Yahoo若干年前對傳統(tǒng)IOE架構(gòu)的顛覆。他們分別在自己的Web集群中采用了一種全新的、基于x86平臺的分布式存儲與計算調(diào)度架構(gòu),從而化解了傳統(tǒng)集中式架構(gòu)無法承擔互聯(lián)網(wǎng)數(shù)據(jù)幾何級數(shù)增長的問題。隨著市場快速發(fā)展,移動終端爆炸性增長,尤其近三年“大數(shù)據(jù)”的提出,企業(yè)系統(tǒng)中的數(shù)據(jù)也開始出現(xiàn)了類幾何級數(shù)增長的問題。在看到了這片新“處女地”后,開源及互聯(lián)網(wǎng)領(lǐng)域里的Hadoop技術(shù)專家們紛紛自立門戶,開始以Hadoop發(fā)行版的方式向企業(yè)級市場進軍,一時間Hadoop市場呈現(xiàn)出“群雄逐鹿”的戰(zhàn)國場面 – 畢竟,企業(yè)級市場才是整個IT領(lǐng)域中那顆“皇冠上的珍珠”。在美國,Cloudera、Hortonworks、MapR已經(jīng)成為主流Hadoop發(fā)行版廠商,各自擁有幾百個企業(yè)客戶IBM的 Big Insights也是一個Hadoop版本,雖然Big Insights輪不上IBM主要產(chǎn)品線,但相信客戶數(shù)也不少。
這樣的風潮固然起源于硅谷,但今日的地球“是平的”,中國IT業(yè)也早不是以前了。在國家“創(chuàng)新”戰(zhàn)略的影響下,紛紛加入到Hadoop技術(shù)的競爭中來,推出自己的企業(yè)版本。星環(huán)科技一馬當先,已經(jīng)加入到頂級技術(shù)PK的戰(zhàn)隊中,其Transwarp Data Hub是國內(nèi)自主的最早一個發(fā)行版,也是國際上除DataBricks以外最早的Spark企業(yè)發(fā)行版。華為,亞信,Redhaoop等也以自身的品牌,市場或者社區(qū)優(yōu)勢推出基于Hadoop的大數(shù)據(jù)平臺 。再加上國外的幾家廠商,可謂盛況空前。類似當年的Linux之爭,但不同的是這次的戰(zhàn)場是企業(yè)的IT核心-數(shù)據(jù)平臺。馬云說了,“Data is the future”。誰是對的,誰能解決客戶的問題,誰能在漫長而又短暫的競爭中勝出,遠還沒到判別的時候。但我們不妨來走馬看花,說幾句閑話。
Hotonworks和Cloudera在美國打的不可開交,前者已經(jīng)提前上市,上市后又宣布成立ODP,聯(lián)合一批廠商包括EMC/Pivotal搞開放聯(lián)盟,后者早就拿到Intel大筆資金,號稱不上市也能活到下個10年。但無論Cloudera還是Hortonworks都以O(shè)pen Source開源為商業(yè)模式,雖然Cloudera最好用的Manager(管理器)是閉源的。這種模式好處在于易于獲得,但對廠商自己而言,收入全來自于服務(wù)和支持費,如果客戶對服務(wù)要求簡單,這些服務(wù)就會被生態(tài)鏈的服務(wù)廠商拿走,如果服務(wù)復(fù)雜,就又會陷入低利潤的服務(wù)業(yè)務(wù)。Hortonworks2014年收入4千多萬美元,虧損8千多萬美元,也許說明一些問題。MapR則秉承另外的理念,開源不等于開放,滿足客戶需求是第一位的,MapR定位于為企業(yè)提供專有的穩(wěn)定、高性能的hadoop,重寫了hdfs和hbase并閉源。而國內(nèi)新秀星環(huán)的TDH定位于提供具備SQL和數(shù)據(jù)挖掘功能的高性能Hadoop平臺,支持企業(yè)核心分析應(yīng)用系統(tǒng)向Hadoop遷移,以此構(gòu)建復(fù)雜的全新大數(shù)據(jù)應(yīng)用。也主要強調(diào)SQL on Hadoop的功能,和企業(yè)現(xiàn)有應(yīng)用對接。剛結(jié)束的Strata-Conference提出SQL的支持是Hadoop目前最需要解決的問題之一,顯然,這方面星環(huán)已經(jīng)先發(fā),這也體現(xiàn)了我們國內(nèi)公司的技術(shù)視野。
IBM,華為,再到亞信則是另一類廠商,對這類廠商來講,Hadoop只是一個工具,他們關(guān)心的是整體方案,客戶喜歡什么就給什么。他們不太可能成為Hadoop的創(chuàng)新者,但這些廠家以其強大的市場能力,整體的方案,也一定是Hadoop的重要使用者。而浪潮,攜其對x86硬件體系常年的投入和研究,推出大數(shù)據(jù)一體機,從另一層面豐富了大數(shù)據(jù)平臺產(chǎn)品的交付方式,給用戶提供了一站式的解決方案。
競爭才剛剛開始,如果我們看下傳統(tǒng)數(shù)據(jù)庫廠商的收入和hadoop廠商的收入,我們就會明白這一點。Hadoop的興起不是一個產(chǎn)品代替另一類產(chǎn)品,而是在硬件發(fā)展到一定階段一個計算模式代替另一個計算模式。大數(shù)據(jù),云計算,大數(shù)據(jù)云計算技術(shù)的整合,相信吧,這才起了個頭。讓我們拭目以待。
作者介紹:復(fù)旦計算機學(xué)士、美國杜克計算機碩士。美國微軟總部服務(wù)13年,是數(shù)據(jù)分析、數(shù)據(jù)挖掘、產(chǎn)品研發(fā)及管理、互聯(lián)網(wǎng)廣告和互聯(lián)網(wǎng)營銷方面的專家。《New Internet:大數(shù)據(jù)挖掘》《數(shù)據(jù)掘金:電商數(shù)據(jù)運營》兩書作者。