社會的發(fā)展,市場的繁榮,互聯(lián)網(wǎng)的熱鬧,讓信息數(shù)據(jù)越來越多,因此大數(shù)據(jù)時(shí)代誕生。大數(shù)據(jù)被譽(yù)為繼云計(jì)算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次重要技術(shù)變革。
中國企業(yè)已然身處大數(shù)據(jù)時(shí)代,但如何利用大數(shù)據(jù)技術(shù),成功提升自身價(jià)值,無疑仍是企業(yè)需要去探索的課題。近日,Teradata天睿公司大中華區(qū)大數(shù)據(jù)事業(yè)部總監(jiān)孔宇華表示,企業(yè)需要從分析入手去挖掘大數(shù)據(jù)價(jià)值,作為連續(xù)14年獲得Gartner公司評選的數(shù)據(jù)倉庫領(lǐng)導(dǎo)者象限企業(yè),Teradata始終站在數(shù)據(jù)倉庫和數(shù)據(jù)分析的前列,通過不斷的積累與創(chuàng)新,幫助客戶充分呈現(xiàn)其大數(shù)據(jù)價(jià)值。
分析:大數(shù)據(jù)價(jià)值之所在
孔宇華認(rèn)為,數(shù)據(jù)的價(jià)值不在于存儲,而是在于分析。
現(xiàn)在,很多企業(yè)認(rèn)為把各種結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)都收集起來,放到一個(gè)地方進(jìn)行統(tǒng)一存儲就能夠把大數(shù)據(jù)做好。而事實(shí)上,通過分析,才能釋放出數(shù)據(jù)的價(jià)值。
“我們想告訴客戶的是,不一定需要100個(gè)PC服務(wù)器才能把大數(shù)據(jù)做好,不一定需要1PB的數(shù)據(jù)才能把大數(shù)據(jù)做好。”孔宇華表示,“做大數(shù)據(jù)的時(shí)候,可以從一個(gè)應(yīng)用、一個(gè)業(yè)務(wù)的需求開始,通過不同的數(shù)據(jù)分析、不同的數(shù)據(jù)源,把數(shù)據(jù)應(yīng)用起來。”
據(jù)了解,TeradataAster大數(shù)據(jù)探索平臺可以匯集不同的數(shù)據(jù)源、結(jié)構(gòu)化的數(shù)據(jù)、非結(jié)構(gòu)化的數(shù)據(jù),并且有著很多不同的分析方法,如SQL、MapReduce,關(guān)聯(lián)分析、路徑分析、文本分析等,通過將這些分析方法進(jìn)行結(jié)合,將充分釋放數(shù)據(jù)的的價(jià)值。
此外,Teradata的數(shù)據(jù)探索平臺可以在很短的時(shí)間內(nèi),將數(shù)據(jù)進(jìn)行整理、分析,并將數(shù)據(jù)的價(jià)值展現(xiàn)給客戶。“當(dāng)企業(yè)看到數(shù)據(jù)的價(jià)值后,再做相關(guān)投入,就不會覺得大數(shù)據(jù)只是一個(gè)概念,是對我這家企業(yè)本身毫無影響的。讓管理者快速看到大數(shù)據(jù)背后的真正價(jià)值,正是Aster平臺的價(jià)值所在。”孔宇華表示。
Aster:大數(shù)據(jù)分析的瑞士軍刀
“Aster就是大數(shù)據(jù)分析的瑞士軍刀。”在向記者展示TeradataAster平臺最新成果時(shí),孔宇華如此描述。
同Hadoop相比,Aster探索平臺基于SQL、SAS或R的界面,利用其進(jìn)行大數(shù)據(jù)分析會更方便,而且數(shù)據(jù)永遠(yuǎn)存在一個(gè)地方,進(jìn)行不同的分析時(shí)只需要調(diào)用不同的工具就可以完成,避免了數(shù)據(jù)在不同位置間的移動。
另外,Aster還提供了豐富的數(shù)據(jù)接口,能夠連接到Hadoop、數(shù)據(jù)倉庫以及其他提供API的數(shù)據(jù)源,使得數(shù)據(jù)無需轉(zhuǎn)換到特定格式即可以進(jìn)行調(diào)用分析,節(jié)省了大量數(shù)據(jù)轉(zhuǎn)換與適配的時(shí)間。由于Aster提供了基于SQL運(yùn)算引擎的支持,因此也可以連接到其他主流的商業(yè)智能(BI)工具,獲得豐富的可視化功能。
孔宇華介紹,針對Aster大數(shù)據(jù)探索平臺,Teradata新增了SNAPFramework(無縫網(wǎng)絡(luò)分析處理框架),實(shí)現(xiàn)了分析引擎和文件存儲的無縫和同步集成,能夠執(zhí)行并優(yōu)化跨分析引擎和文件存儲的查詢。
SNAPFramework除了行存儲,還支持列存儲、文件存儲等多種存儲方式。在分析層面,除了傳統(tǒng)的SQL和MapReduce之外,還引入了最新的圖形分析引擎,能夠處理大規(guī)模分析圖表查詢以及預(yù)建圖形功能,并可以應(yīng)用到客戶流失、產(chǎn)品關(guān)聯(lián)性、欺詐偵測以及推薦引擎等分析場景。
就在上個(gè)月,Teradata實(shí)現(xiàn)了Aster與R的整合,通過放寬內(nèi)存和處理能力限制條件,擴(kuò)展開源R語言分析能力。在數(shù)據(jù)庫內(nèi)運(yùn)行R語言,可高速處理海量數(shù)據(jù),滿足企業(yè)分析能力需求。
孔宇華表示,TeradataAsterR為R語言分析師提供企業(yè)級就緒的商業(yè)分析解決方案,可以幫助R語言分析師從多個(gè)數(shù)據(jù)源訪問及整合詳細(xì)數(shù)據(jù),通過更廣泛的分析方法獲得更準(zhǔn)確的結(jié)果,具有高度可擴(kuò)展性、可靠性和易用性。
針對Hadoop,Teradata則選擇了合作與收購的方式。通過與Hortonworks的合作,為客戶提供Hadoop相關(guān)的平臺和工具。通過收購Revelytix和Hadapt,進(jìn)一步完成了對Hadoop的整合。
“未來在Teradata的統(tǒng)一數(shù)據(jù)架構(gòu)中,Hadoop將主要作為數(shù)據(jù)獲取和整合平臺,Aster主要作為數(shù)據(jù)挖掘和分析平臺。”孔宇華表示。
平臺、人員、流程:大數(shù)據(jù)落地三要素
怎樣做才能實(shí)現(xiàn)大數(shù)據(jù)的落地?孔宇華給出的答案是:平臺、人員和流程。
首先,需要有一個(gè)合適易用,并且能夠和企業(yè)現(xiàn)有平臺輕易進(jìn)行結(jié)合;其次,需要內(nèi)部人員具備一定的技能;最后,流程制度方面,需要結(jié)合大數(shù)據(jù)需求的敏捷項(xiàng)目管理方法,根據(jù)業(yè)務(wù)需求快速讓技術(shù)人員利用平臺提升數(shù)據(jù)的價(jià)值。
企業(yè)如何利用現(xiàn)有人員的技能,找出數(shù)據(jù)里的價(jià)值,恰恰是TeradataAster平臺能夠賦予客戶的??子钊A表示,通過TeradataAster大數(shù)據(jù)探索平臺,企業(yè)可以在很短的時(shí)間內(nèi),利用原有的技能進(jìn)行大數(shù)據(jù)分析,讓管理者看到大數(shù)據(jù)背后的真正價(jià)值。
目前,Teradata在全球范圍內(nèi)已經(jīng)積累了大量的成功案例,與超過十個(gè)行業(yè)的用戶進(jìn)行了合作,從傳統(tǒng)的優(yōu)勢行業(yè),如電信、金融、保險(xiǎn),到電商、醫(yī)療、制造與零售等,TeradataAster能夠?qū)Ω鞣N場景進(jìn)行深入分析,并通過豐富的可視化形式進(jìn)行展現(xiàn)。
據(jù)悉,Teradata在中國成立了大數(shù)據(jù)技術(shù)研發(fā)團(tuán)隊(duì),主要負(fù)責(zé)平臺、數(shù)據(jù)庫與分析函數(shù)的開發(fā)。另外,Teradata在中國還擁有優(yōu)秀的大數(shù)據(jù)實(shí)施團(tuán)隊(duì)和實(shí)施合作伙伴,能夠幫助客戶充分呈現(xiàn)其大數(shù)據(jù)的價(jià)值。