建議互聯(lián)網(wǎng)分析人員用嘗試錯誤的方式來找出數(shù)據(jù)價值。一旦分析人員有了新發(fā)現(xiàn),立即就要丟進(jìn)市場測試水溫,如此才有辦法確定新發(fā)現(xiàn)有沒有價值。愈快發(fā)現(xiàn)錯誤就代表愈快成功,不斷地從錯誤中淬煉,才能找出數(shù)據(jù)黃金。
看重互聯(lián)網(wǎng)所能造就的影響力,自2011年Big Data一詞興起以來,如何從大量且龐雜數(shù)據(jù)找出商業(yè)價值,就成為眾所矚目的焦點(diǎn)。這個繼云計算之后,另一個被視為為IT帶來變革的概念,正快速地邁開發(fā)展的腳步,不僅解決方案紛呈,全球企業(yè)也爭相投入。
然而,互聯(lián)網(wǎng)并非全然美好,至少在現(xiàn)今仍有成本過高,企業(yè)存在實際應(yīng)用的困難;數(shù)據(jù)太過龐雜,無法從中找出正確的洞見與方針;互聯(lián)網(wǎng)分析還是一個陌生領(lǐng)域,分析人員普遍存在專業(yè)技能不足或是企業(yè)人才缺乏等問題。
從事技術(shù)顧問輔導(dǎo)企業(yè)多年,Teradata臺灣分公司資深技術(shù)顧問郭柏森坦承,現(xiàn)今臺灣真正導(dǎo)入互聯(lián)網(wǎng)分析平臺的企業(yè)并不多,最先愿意嘗試的產(chǎn)業(yè)主要是電子商務(wù)領(lǐng)域。因獨(dú)特的產(chǎn)業(yè)條件,先天上就不是采用與顧客面對面交易的策略,因而在網(wǎng)站或交易系統(tǒng)的設(shè)計方面,就會想方設(shè)法收集客戶所有資訊,「這是電子商務(wù)行業(yè)所具備的優(yōu)勢,一開始就帶有收集資訊的基因,不管是在思維以及實際導(dǎo)入應(yīng)用,都比其他行業(yè)的腳步要來得快些。」
分析客戶行為與觀感
▲Teradata臺灣分公司資深技術(shù)顧問郭柏森提到,僅僅只收集交易型數(shù)據(jù)已經(jīng)不足,企業(yè)還要關(guān)注使用者在網(wǎng)站、App上的使用行為,進(jìn)一步找出市場。
從數(shù)據(jù)中萃取出企業(yè)營運(yùn)商業(yè)智慧并不是一個嶄新的概念。過往商業(yè)智慧(Business Intelligence)、數(shù)據(jù)倉儲(Data Warehouse)也藉由分析所有顧客往來的交易數(shù)據(jù),企望能對公司的決策者提出一個具有整體視野的建議,以促進(jìn)決策的制定,創(chuàng)造更好的營收。
不過,商業(yè)智慧或是數(shù)據(jù)倉儲所分析的數(shù)據(jù)型態(tài)都屬於交易型數(shù)據(jù),像是銀行卡費(fèi)、貸款、保單等等可透過關(guān)聯(lián)式數(shù)據(jù)庫進(jìn)而分析的資訊,這種結(jié)構(gòu)化的數(shù)據(jù)與現(xiàn)今所論及的互聯(lián)網(wǎng)分析,就數(shù)據(jù)的形態(tài)的包容性上就有明顯的區(qū)隔。
郭柏森解釋,互聯(lián)網(wǎng)有三V,Volume(量)、Velocity(速度)以及Variety(多樣性),其中多樣性即是包括語音、文字、影像以及圖片等非結(jié)構(gòu)化數(shù)據(jù)。簡單地說,互聯(lián)網(wǎng)包含了結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù),這兩種不同的數(shù)據(jù)型態(tài),同時都會被納入分析的范疇。
「許多因素造就了互聯(lián)網(wǎng)環(huán)境,例如使用者行為改變也是原因之一。你可能很久沒有臨柜交易,但銀行的網(wǎng)站以及交易卻從來沒有中斷過。過往金融行業(yè)只要專注營造分行氣氛,維持窗明幾凈自然就有顧客上門,現(xiàn)在使用者則透過任何可能的管道,例如智慧型手機(jī)或平板電腦與銀行接觸。」他提到,正是因為如此,僅僅只收集交易型數(shù)據(jù)已經(jīng)不足,企業(yè)還要關(guān)注使用者在網(wǎng)站、App上的使用行為,「互聯(lián)網(wǎng)的多樣性,隱含的是從分析交易,轉(zhuǎn)向分析客戶的行為、觀感,從而找出市場。」
只分析有價值的數(shù)據(jù)
在數(shù)據(jù)經(jīng)濟(jì)年代,數(shù)據(jù)就是黃金。即使是看似不起眼的對話、分享或按贊,都可能是新契機(jī)的來源。於是每一筆數(shù)據(jù)都不應(yīng)該被遺漏,也都應(yīng)該匯入分析平臺參與分析。郭柏森提醒,實務(wù)上,真正有價值的數(shù)據(jù)僅僅只是其中的一小部份而已,將復(fù)雜又大量的互聯(lián)網(wǎng)一股腦兒地倒進(jìn)分析平臺,其結(jié)果可能會令人失望。一方面,互聯(lián)網(wǎng)分析平臺需要一個兼具效能與可靠度的儲存環(huán)境,但是要將這么龐大的數(shù)據(jù)都存放在高階的儲存環(huán)境中,造價相當(dāng)高昂。例如國內(nèi)某電子商務(wù)(EC)龍頭業(yè)者每天至少產(chǎn)生1GB的數(shù)據(jù)量,換算下來,365天就要365GB,硬碟容量是一個很大的挑戰(zhàn)。而另一方面,企業(yè)將會發(fā)現(xiàn)里面所隱含有價值的數(shù)據(jù)量可能只有幾MB。
郭柏森認(rèn)為,在還不清楚數(shù)據(jù)的價值之前,企業(yè)應(yīng)該先選擇一個相對便宜的存放空間。一旦經(jīng)過數(shù)據(jù)探索等手法,把數(shù)據(jù)價值找出來之后,再把數(shù)據(jù)引入分析平臺內(nèi)。「一個統(tǒng)一的平臺已經(jīng)沒有辦法滿足企業(yè),企業(yè)該思考的是分析平臺是否能夠很容易地與各個平臺進(jìn)行數(shù)據(jù)交換。」他舉例,企業(yè)不妨把最重要的數(shù)據(jù)放在數(shù)據(jù)倉儲,如果有其他數(shù)據(jù)的需求,可以從Hadoop、甲骨文、MongoDB中把需要的數(shù)據(jù)抓過來合并分析,這就是Teradata Data Grid概念,只把確定有價值的數(shù)據(jù)放進(jìn)企業(yè)數(shù)據(jù)倉儲平臺,就能讓企業(yè)避免高昂投資成本,同時保有良好的分析成效。
從錯誤中累積判斷力
高昂的投資成本是現(xiàn)階段企業(yè)導(dǎo)入巨量分析平臺過程中一道相當(dāng)大的門檻,而另一方面,如何在茫茫的數(shù)據(jù)海中,確定該筆數(shù)據(jù)確有價值,也是一項很大的挑戰(zhàn)。當(dāng)企業(yè)在面對互聯(lián)網(wǎng)議題時,分析人員將會是其中非常關(guān)鍵的一環(huán)。
郭柏森提到,對分析人員來說,互聯(lián)網(wǎng)是一個陌生的領(lǐng)域,「我們會建議分析人員用嘗試錯誤的方式來找出數(shù)據(jù)價值。一旦分析人員有了新發(fā)現(xiàn),立即就要丟進(jìn)市場測試水溫,如此才有辦法確定新發(fā)現(xiàn)有沒有價值。愈快發(fā)現(xiàn)錯誤就代表愈快成功,不斷地從錯誤中淬鏈,才能找出數(shù)據(jù)黃金。」
當(dāng)然,企業(yè)也必須提供給分析人員更多培訓(xùn)與嘗試錯誤的機(jī)會。「并不是要導(dǎo)入互聯(lián)網(wǎng)分析就要舍棄舊有技術(shù)。對企業(yè)來說,交易型的數(shù)據(jù)分析還是有存在的必要,因此,不妨以此為基礎(chǔ),再讓分析人員的技能向外延伸。」他舉例說明,例如把分析人員分組,有一組人可以將交易型的數(shù)據(jù)與客戶使用行為的數(shù)據(jù)透過新技術(shù),合在一起分析,而另一組人也可玩玩Open Data,從人口、天氣到不動產(chǎn)實價登錄的資訊都可以把它納入,看看能不能與企業(yè)收集到的客戶資訊,激蕩出火花。
料理包還是廚師
互聯(lián)網(wǎng)分析討論日益熱絡(luò),市場上提出的解決方案也琳瑯滿目。該如何從中找出適合企業(yè)應(yīng)用的解決方案?郭柏森認(rèn)為,這得看企業(yè)有多少決心,在技術(shù)的層次上并沒有好壞與對錯,但是企業(yè)是希望在短時間內(nèi)就有一套解決方案可以支應(yīng),還是希望真正在企業(yè)內(nèi)部打造出數(shù)據(jù)分析團(tuán)隊,就有很大的差別。
「一位前輩曾這么說,如果你去市場上買一個已經(jīng)包裝好的解決方案,就像買到一個料理包,每天微波,吃的是同樣的口味與食材。但是當(dāng)你一開始先打造一個簡單的廚房、培養(yǎng)幾個初級的廚師。慢慢地,他們的菜會煮得愈來愈好吃。」他再次強(qiáng)調(diào),目前市場上確實有很多速成包,但企業(yè)該培養(yǎng)的卻是這些數(shù)據(jù)分析人員。
當(dāng)然,如果完全對技術(shù)不了解,目前有幾款解決方案都提供了免費(fèi)的版本,企業(yè)若想嘗試或測試這樣的技術(shù),不妨從免費(fèi)的版本開始。等到真正對企業(yè)有幫助時,再來慎密規(guī)劃,唯有對產(chǎn)品有更進(jìn)一步的了解,未來需要規(guī)劃時才不會走錯方向。
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/14127.html