3月7日消息,EMC全球高級副總裁、大中華區總裁葉成輝日前向騰訊科技表示,大數據領域內仍有無數的創業機遇,IBM、EMC這樣的大數據巨頭沒有精力在各個垂直領域進行數據挖掘工作,而大數據市場在國內的成熟又需要有人去做這些工作,只能去依賴獨立軟件開發商。
看好大數據挖掘機遇
他表示,大數據領域有多個細分子項,其中的數據挖掘和分析部分目前在國內仍處于發展階段,每一個產業的客戶都在想怎么利用開源,利用新的客戶資源,所以數據挖掘在未來會有非常多的機會。EMC鼓勵小型企業利用Hadoop這個平臺開發,Oracle、DB2開始時也有很多小公司開始做數據庫開發,并獲得成功。
他認為,以前大數據的應用會應用在信用卡、超市等等多一些,他們數據量很多多,有很個人資料。現在海外市場上例如零售業的沃爾瑪和部分證券公司、電信運營商也都有很多客戶資料,都在視圖去挖掘更多的商業機會。中國市場上需要思考的也是怎么利用現在的微博、移動互聯方面的資料,挖掘客戶。未來大數據的價值肯定能被量化,根據客戶數據,分析之后做不同的廣告、不同的推廣。每個公司未來都會做這樣的方向。
據悉,EMC中國剛剛發布了第二個五年計劃,核心目標為將中國建成做除了美國以外的最大基地(包含技術、投資、人力等方面),中國地區營收5年再增5倍。在其新五年計劃中,渠道建設的最關鍵一環就是重點挖掘和培養行業ISV(獨立軟件開發商)。
看好中國市場發展
葉成輝還透露,今年4月初,EMC和聯想將共同展示雙方在服務器領域的一些新進展。據悉,EMC在中國市場上跟富通、中電科、神州數碼、聯想都有很深入的合作。他透露,與聯想建立合資公司談了兩年半的時間,與神州數碼的合作也談了兩三年的時間。
他表示,EMC總部給于中國區充分的授權,包括說做合資公司這樣的重大決定。而其他美國公司,他們的總部都不太愿意在中國做這些工作。
在談到未來5年EMC在國內市場的主要關注方向時,他表示,醫療、教育、環保、公安和媒體領域是EMC主要關注的方向,此外他還看好國內中小企業的發展。他認為盡管受制于經濟環境的因素,小型企業中部分增長沒有以前那么快,但中小型企業都需要有自己的數據,自己的投資,從EMC的角度看,中小型企業未來五年還會繼續增長。
以下為專訪實錄:
關于大數據
問:您如何看待大數據?像開發地圖應用的公司算大數據廠商嗎?
葉成輝:越來越多小型的公司會開發大數據的應用,以前大數據的應用會應用在信用卡、超市等等多一些,他們數據量很多多,有很個人資料。現在,我們發覺越來越多小型的IT公司會發展自己的大數據應用。很多廠家說有大數據解決方案,其實沒有。我覺得大數據有三個層面:第一,如何安全地存儲非結構化數據,這個EMC有,IBM有一點點,NetApp有一點點。跟以前的Oracle、DB2結構化數據不一樣,應用在金融、政府里面,跟現在的大數據是不一樣的。第二是如何開發大數據,像Hadoop技術。第三是怎么挖掘大數據。像EMC Greenplum、Teradata。這些層面的東西有不同的廠家。為什么說EMC在領先的地位。EMC是唯一一家IT公司完完全全在三個方面都有,而且針對未來的方向會有越來越多的發布。去年,VMware CEO Paul Mariz(曾經在微軟負責開發Windows)和Pat Gelsinger(以前是Intel的CTO、X86架構的創始者)換位置,Pat做VMware CEO、Paul做大數據業務的CEO。可以看到,云計算/虛擬化是我們未來的一個重要方向,大數據是一個重要方向。我們已經收購了幾個公司,例如大數據網管,未來會有更多的并購在這個領域里面。
問:EMC提供了很高端的大數據的解決方案,提供給不同的企業,這個價值到底能不能被量化?
葉成輝:我自己覺得大數據的價值肯定能被量化,以前CIO保持系統穩定了就可以,服務器不停頓就可以了。現在的壓力是業務部門越來越重要,業務部門會逼他們做很多的東西,比如說大數據挖掘。甚至像阿里巴巴、淘寶這樣的公司,他們要利用自己的客戶數據,分析之后做不同的廣告、不同的推廣。每個公司未來都會做這樣的方向,所以價值肯定有。問題是有沒有決心。有一些客戶很有決心,覺得這個方向很重要。上周和一個證券公司CIO談,他完全沒有用過EMC,他說未來會投資很多錢,挖掘證券客戶,他們買賣股票的時候是什么樣的,怎么做推廣。他找到EMC,他其實根本沒有用過EMC。有一些客戶就是這樣的。有一些客戶是永遠在等,看看有沒有現行的東西就可以找來用。有一些公司投資多一些,有一些投資少一些,但是完全不做大數據的很少。現在大家都在想這個事情,未來一兩年大家都會有一部分計劃。
問:數據挖掘和分析這部分,未來中國的增長會怎樣?
葉成輝:整個產業里面以前做的很多東西是金融,用數據挖掘做信用卡客戶。但是你看整個產業的話,還有很多公司,例如零售業的沃爾瑪、我剛才提到的證券公司、電信運營商也都有很多客戶資料,他們在想怎么去挖掘。我自己覺得每一個產業的客戶都在想怎么利用開源,利用新的客戶資源,所以數據挖掘未來會是非常非常多,怎么利用現在的微博、移動互聯方面的資料,挖掘客戶。
問:中國的數據挖掘這塊目前做得比較好的是互聯網公司,其他的企業不是很好。
葉成輝:現在只是開始。
問:我們看到很多的例子都是國外的,國內的很少。
葉成輝:現在是開始,中國我覺得這個市場要做起來,一定要靠一些ISV,像剛才記者說做地圖什么的,你要懂這個行業。像IBM也好、EMC也好都沒有能力在每一個領域幫你做數據挖掘,除非是公司自己挖掘一些出來,要不然就要等這些小的ISV幫忙,所以你會看到數據挖掘公司越來越多。
記者:就是說小的IT公司有這樣的創業機會?
葉成輝:是的,我們也鼓勵他們利用Hadoop這個平臺進行開發,我們也宣布了一個Hadoop開發的整體版本,像以前的數據庫Oracle、DB2開始的時候,很多小公司開始做數據庫開發。
問:現在大數據市場,或者說技術方面,對企業發展有沒有局限性?
葉成輝:現在對大數據的投資還是剛開始,一定要一步一步地做,沒有辦法一步到位。現在中國大數據市場最大的問題就是:業務部門和IT部門誰說了算?這個在美國已經解決了,在中國還沒有解決。在美國,做大數據是業務部門說了算,我需要這個業務,我可以直接和IT部門或者拋開IT部門直接和廠商談。在中國還是一個政治斗爭。IT部門覺得我和廠家合作,你業務部門要退到后面,業務部門很多要求IT部門也做不到,溝通沒有那么順暢。
你說局限,我覺得這個局限就是怎么樣完完全全由業務部門做主。大數據由IT部門做主,很難做得好。IT部門不太了解業務需求,做完以后可能有一點用,但是不一定有很大的用。所以我覺得,要慢慢地從業務部門為重點,怎么開發大數據。
問:現在很多的大數據案例都是國外的,在國內你看到這種應用大數據的案例多嗎?在國內炒作大數據的概念大家談到的特別多,您覺得大數據在中國國內是不是存在一個被炒作的現象呢?
葉成輝:我不覺得大數據是被炒作。我剛才說了那么多,我覺得這個市場在中國未來幾年會越做越大,當然也有局限,我也說過局限是什么,業務部門是不是能夠去關注。我們有很多的案例:今天講的華大基因;中國電信(微博)有50到100PB;像公安,很多的大數據網絡都是我們的,整體的監控、分析都是我們的;圖書館里面很多大數據的圖書規劃都是我們做的,案例其實很多。
但是現在還是局限于用大數據的行業的案例多一些,華大基因肯定用,圖書館肯定用,公安也肯定用大數據。我希望看到一些傳統的行業,比如說金融、稅務局,能用大數據,現在還沒有建。希望看到這些傳統的大的IT投資的客戶,有很大的案例。