「尿布、啤酒、星期五」是20幾年前Walmart分析人員從數(shù)據(jù)意外發(fā)現(xiàn)的正相關(guān),Walmart為驗(yàn)證兩者的相關(guān)性,開(kāi)始將原本毫不相干的尿布與啤酒擺放在同一貨架上販?zhǔn)?,造成兩者銷量大幅成長(zhǎng)了三成之多,這是數(shù)據(jù)挖掘的經(jīng)典案例,也是數(shù)據(jù)分析的濫觴。
數(shù)據(jù)分析與大數(shù)據(jù)分析,一字之差,天壤之別。新加坡大數(shù)據(jù)行銷公司Gherlock的執(zhí)行長(zhǎng)Jonathan提到:「巨量數(shù)據(jù)的重點(diǎn)已不再是搜集和挖掘,而在于運(yùn)用與預(yù)測(cè)?!?,在Google推出Google Analytics網(wǎng)站流量分析的服務(wù)之后,只要嵌入了追蹤程式碼,任何人都可以輕易搜集到巨量數(shù)據(jù),而當(dāng)時(shí)Walmart所處理的數(shù)據(jù)與現(xiàn)今的數(shù)據(jù)數(shù)據(jù),規(guī)模不可同日而語(yǔ)。
一個(gè)購(gòu)物網(wǎng)站僅于短短一個(gè)月內(nèi)便可有超過(guò)上千萬(wàn)的流量,且同時(shí)上線的人次可能逾千位,瀏覽行為的復(fù)雜性提高、訪客行為的豐富度增加,所產(chǎn)生的數(shù)據(jù)量已超乎想像,因此以「巨量數(shù)據(jù)」一詞概括這些無(wú)法計(jì)算的龐大數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)挖掘通常指的是從無(wú)意義的數(shù)據(jù)中萃取出有意義的資訊,用過(guò)去的data mining來(lái)看如此龐大的數(shù)據(jù),猶如大海撈針。但是現(xiàn)今的巨量數(shù)據(jù),所呈現(xiàn)出的是消費(fèi)者行為的事實(shí),具意義的資訊俯拾即是,端看行銷人員如何善加運(yùn)用。因此,面對(duì)現(xiàn)今的巨量數(shù)據(jù),我們應(yīng)走出過(guò)去data mining的框架,仔細(xì)鉆研這些龐大數(shù)據(jù)所呈現(xiàn)出的故事,并加以發(fā)展運(yùn)用。