大數(shù)據(jù)分析服務供應商Teradata天睿公司(Teradata Corporation,紐交所:TDC)宣布推出一種全新的數(shù)據(jù)湖部署“設(shè)計模式”,利用多年在大數(shù)據(jù)咨詢和優(yōu)化方面豐富的經(jīng)驗,幫助客戶建設(shè)數(shù)據(jù)湖并獲益。作為業(yè)內(nèi)首次推出,全新的設(shè)計模式方法將使得Teradata繼續(xù)領(lǐng)先同業(yè),幫助企業(yè)用戶、數(shù)據(jù)科學家和IT專業(yè)人員建立數(shù)據(jù)湖,并產(chǎn)生卓越的業(yè)務價值。
企業(yè)正在探索數(shù)據(jù)湖的功能,在激增的數(shù)據(jù)量中產(chǎn)生洞察和機會。然而,一些嚴重的問題也令其IT團隊備受困惑,包括:缺乏最佳實踐、缺少數(shù)據(jù)科學家,甚至存在數(shù)據(jù)湖定義的混亂等。除了這些挑戰(zhàn),技術(shù)的選擇也越來越多。例如,數(shù)據(jù)湖通常被假定為Hadoop的代名詞,盡管Hadoop是處理大量數(shù)據(jù)湖工作負載的良好選擇,但是數(shù)據(jù)湖構(gòu)建可以使用多種技術(shù),如Hadoop、NoSQL、Amazon S3、關(guān)系型數(shù)據(jù)庫(RDBMS),以及各種技術(shù)組合等。雖然技術(shù)選擇攸關(guān)洞察結(jié)果,但是成功的數(shù)據(jù)湖亦需要周密的計劃。數(shù)據(jù)湖設(shè)計模式包含一系列基于企業(yè)級最佳實踐的知識產(chǎn)權(quán),以及在大量的客戶成功項目中共同開發(fā)的產(chǎn)品等。
全球知名的科技分析研究公司OVUM高級分析師Tony Baer表示:“Teradata已經(jīng)率先為數(shù)據(jù)湖確定了實施模式。數(shù)據(jù)湖不同于操作型數(shù)據(jù)存儲系統(tǒng),Teradata的價值主張源自真正的實踐經(jīng)驗,幫助客戶應對不同環(huán)境中的數(shù)據(jù)管理。收購Think Big后,Teradata獲得了設(shè)計模式這一寶貴的知識產(chǎn)權(quán),將有助于構(gòu)建透明的數(shù)據(jù)湖。”
通過訪問新的數(shù)據(jù),例如存儲在數(shù)據(jù)湖中的客戶服務記錄、點擊流數(shù)據(jù)、IP流、日志信息和傳感器數(shù)據(jù)等,用戶能夠解決通常需要多次同步解讀的數(shù)據(jù),并進行相互驗證的難題。這些應用案例包括:
?通過提取存儲在數(shù)據(jù)湖中客服通話的文本信息,創(chuàng)建客戶流失偵測的改善模型,再應用預測性文本分析方法。
?通過將大量機器數(shù)據(jù)和消費數(shù)據(jù)組合提供趨勢分析。在電力行業(yè),數(shù)據(jù)湖能夠運行多個數(shù)據(jù)模型,評估安裝節(jié)能設(shè)備的影響,以及數(shù)月后降低能耗帶來的潛在影響。
Teradata天睿公司旗下Think Big公司創(chuàng)始人兼總裁Ron Bodkin表示:“數(shù)據(jù)湖實施的挑戰(zhàn)巨大,這也成為幫助我們獲得快速發(fā)展的原因:我們應邀幫助企業(yè)處理因各種原因而停滯的困難且昂貴的數(shù)據(jù)湖項目,為不同的情形定制數(shù)據(jù)湖設(shè)計模式方法。這些模式以及相關(guān)軟件框架是強大且可靠的價值加速器。遺憾的是,很多企業(yè)很難發(fā)現(xiàn)大數(shù)據(jù)的雷區(qū),我們協(xié)助客戶擺脫危機,幫助企業(yè)、IT和數(shù)據(jù)科學家完成數(shù)據(jù)湖的規(guī)劃、實施并獲益,產(chǎn)生巨大的商業(yè)價值。當客戶獲得實踐經(jīng)驗時,他們應該并愿意去創(chuàng)建數(shù)據(jù)湖。”
自創(chuàng)立伊始,Think Big就一直堅持技術(shù)和平臺中立的原則,專注于通過Apache™ Hadoop®、Apache Spark™和 NoSQL等開源技術(shù)產(chǎn)生實際價值。Think Big 提供數(shù)種數(shù)據(jù)湖設(shè)計模式服務:針對剛開始數(shù)據(jù)湖項目或者尋求最佳實踐咨詢的團隊的數(shù)據(jù)湖基礎(chǔ)(Data Lake Foundation);針對尋求數(shù)據(jù)湖最佳實踐和技術(shù)選擇的企業(yè)的數(shù)據(jù)湖架構(gòu)(Data Lake Architecture);以及針對分析周期執(zhí)行中數(shù)據(jù)準備的數(shù)據(jù)湖分析(Data Lake Analytics)等。
Think Big已經(jīng)幫助大量行業(yè)領(lǐng)導企業(yè)和創(chuàng)新公司建立數(shù)據(jù)湖,并提供Hadoop和大數(shù)據(jù)部署的工程服務,并擁有典型的客戶案例,如西部數(shù)據(jù)硬盤旗下HGST公司、一家全球最大的金融服務商、領(lǐng)先的半導體制造商、領(lǐng)先的計算機存儲和數(shù)據(jù)管理公司、著名的體育用品服裝制造商,以及全球著名的軟飲料生產(chǎn)商等。
Teradata還提供多種產(chǎn)品和技術(shù),強化數(shù)據(jù)湖環(huán)境中的應用。包括:通過智能、自助服務軟件解決方案簡化數(shù)據(jù)湖中流數(shù)據(jù)(streaming data)的Teradata Listener;低成本的數(shù)據(jù)存儲選項Teradata Appliance for Hadoop;提供流行的SQL-on-Hadoop架構(gòu)的Presto;以及被稱為管道控制器(Pipeline Controller)和緩沖服務器(Buffer Server)等知識產(chǎn)權(quán)的數(shù)據(jù)湖加速器,能夠?qū)?shù)據(jù)高效地從本地服務器移動到Hadoop上。