今天,大數據的價值得到了前所未有的重視,業內甚至有著“得數據者得天下”的斷言。雖然言之過重,但形象描述了大數據在經濟社會各個層面、各個領域都開始受到重視的現象。
正因為如此,大數據分析和營銷應用服務供應商Teradata天睿公司,上周于深圳舉辦了大中華地區最大規模的大數據峰會。峰會期間,Teradata天睿公司首席技術官寶立明(Stephen Brobst)接受了C114等媒體的采訪,分享了大數據技術趨勢和未來的前瞻觀點。
迎合中國市場的需求
根據Teradata天睿公司聯席總裁Hermann Wimmer的介紹,大中華區已經成為Teradata全球增長最快的市場,是僅次于美國的第二大市場。
Teradata將繼續對大中華區進行大力投資,迎合中國客戶的需求。
寶立明介紹,中國市場的客戶尤其喜歡Teradata Aster,這款產品能讓他們快速獲得價值。很多客戶對一些底層的編程不感興趣,Teradata Aster本身自帶了150種不同的分析函數功能,可以根據不同客戶的具體需求,迅速挖掘出價值,這是中國客戶最為欣賞的一點。
為了迎合Teradata Aster在國內的蓬勃發展,Teradata在北京設立了專門的研發實驗室,針對簡體中文進行了文本分析技術的開發;同時,Teradata還進行了路徑分析算法開發,這是因為很多中國零售商需要研究消費者的購買行為、如何更好地留住客戶,路徑分析算法的開發就非常迎合這一需求。
還有,國內部分用戶越來越傾向于采用開源架構,尤其是用于大數據的Hadoop技術,這種趨勢非常強勁,而且很多國內用戶都是最早使用Hadoop的企業。對于這一點,寶立明強調,Teradata是業界最早將開源Unix和Linux結構應用在數據庫平臺上的企業。
Teradata首席技術官寶立明(Stephen Brobst)
“當時,很多人都認為我們非常大膽,現在大家對開源技術越來越感到習以為常了。”
但寶立明同時指出,Hadoop用來存儲大量數據相當不錯,但問題是,如果想進一步從這些數據中挖掘出有價值的數據,并對之分析,Hadoop就不是一套非常經濟的系統了。后來,國內客戶發現一個非常致勝的組合,即Hadoop加上Teradata Aster,后者占用系統空間比較小,它的可管理性以及迅速實現價值的效應,使得兩者結合成為最佳組合。
數據變現已帶來持續穩定收入
根據Teradata大中華區首席執行官辛兒倫(Aaron Hsin)的介紹,Teradata在大中華區已經有十多個大行業的應用了。就通信行業而言,一些率先對大數據價值進行挖掘的運營商,已經取得了非常大的成功,在數據業務方面獲得持續、穩定的收入。而從全球市場看,比如沃達豐、西班牙電信、Verizon和AT&T等,他們都在做數據變現的嘗試,以彌補傳統電信業務的收入下滑。
行業基本已經認同,通過售賣帶寬獲得的收入很有限,因為人們都是以月付方式購買帶寬的,且通信支出只占人們整體支出的一小部分。所以,更多運營商將重點放在增值服務上,比如說西班牙電信利用大數據分析為零售企業提供選址建議。
就已經開發出來的商業模式看,運營商的數據變現模式基本上都是通過出售洞察力,將自己擁有的用戶信息分析處理后,在保證用戶隱私的前提下打包,以B2B的商業模式提供給企業客戶,換句話說,就是將消費者的數據作為產品銷售給企業客戶。
對于制造業來說,同樣如此,生產企業利用數據分析結果,更好的控制QC質量、流程優化、管理等個方面的改善。尤其是目前中國進入物聯網時代,傳感器的普及將為制造業帶來相當大的改變,Teradata已經看到,這是一個非常大的機會,也加大了對傳感器數據分析的投入。
Teradata對生態系統打造
寶立明認為,在對大數據進行分析的過程中,沒有任何一種技術能夠放之四海而皆準,解決所有的問題,這就是為什么業界開始從單一型的數據庫向著生態系統的方向去發展的原因,也就是說,在這個生態系統中,會有多個平臺一起運作。
據他介紹,Teradata打造的生態系統稱之為Teradata統一數據架構,即UDA(Unified Data Architecture)生態系統。這一生態系統涉及到三種應用:第一種就是“數據湖”或者“數據水庫”,主要用于捕獲原始數據,包括結構性和非結構性的數據,然后再在UDA架構中進行數據資料的分析;第二種就是整合型數據倉庫;第三種就是探索發現平臺,這是Aster的主要功能。Teradata將SQL和非SQL集合在一起,包括圖形和文本,都能在平臺上進行分析。這三個應用就是通過Teradata的專利技術QueryGrid實現互操作。
幾年前,大多數公司采集的數據基本上都是以記錄為導向的,或者說更多的是結構化的數據。但現在,大多數數據都是非傳統性的,比如JSON數據,文本數據和話音數據已經不再是最關鍵的數據了,由這些數據產生的大量其他數據才是關鍵。
在構建和完善大數據分析生態系統的過程中,Teradata進行了一系列大數據技術的收購,強化統一數據架構的實力。其中,Teradata收購Hadoop技術的主要目的是讓QueryGrid的互通能力更加有效;收購Loom Technology主要是為了完成數據沿襲的工作;收購Think Big是為了給客戶提供更優質的咨詢服務,比如說如何更好地管理Hadoop系統;收購RainStor是為了把那些大量的、可伸展性的數據進行壓縮,從而實現更高效率的數據存儲。
綜上所述,近年來的幾起收購都是為了打造生態系統上不同的能力所做的準備,未來Teradata還將通過QueryGrid軟件實現上述所有這些功能之間的互通、互操作,讓這項技術的使用面更加寬廣。