1、市面上關(guān)于大數(shù)據(jù)的各種定義太多,不一而足,此處寫在前面的,我先定義一下: 大數(shù)據(jù),表示極多的數(shù)據(jù),而其來源,凡能通過技術(shù)手段觸達(dá)的都算。
2、商業(yè)化,即如何使數(shù)據(jù)產(chǎn)生價(jià)值,這個(gè)價(jià)值并不來源于數(shù)據(jù)本身,而是來源于數(shù)據(jù)的被需求方(被需求方可以是甲方也可以是乙方)是否能夠在其業(yè)務(wù)范圍內(nèi)被滿足具備一定價(jià)值的數(shù)據(jù)。 數(shù)據(jù)商業(yè)化的核心非數(shù)據(jù),而是數(shù)據(jù)模型。
3、 數(shù)據(jù)模型:建立滿足需要的業(yè)務(wù)導(dǎo)向的數(shù)據(jù)模型(算法),輸入需要的可觸達(dá)來源的獲取的數(shù)據(jù),并輸出相應(yīng)的結(jié)果。 比如用戶畫像分析、數(shù)據(jù)結(jié)構(gòu)化等等都算數(shù)據(jù)模型。
這里為什么說是業(yè)務(wù)導(dǎo)向的數(shù)據(jù)模型?我舉個(gè)例子,如果比方說我做一個(gè)數(shù)據(jù)模型要過濾出所有姓名筆畫超過20畫的人的名字并序列化其信息,這里可能它是一個(gè)數(shù)據(jù)模型,我也可以在互聯(lián)網(wǎng)獲取大量的可輸入的數(shù)據(jù),問題是這個(gè)數(shù)據(jù)模型沒卵用。
所謂業(yè)務(wù)導(dǎo)向(業(yè)務(wù)邏輯導(dǎo)向),比如百度鳳巢系統(tǒng),利用鳳巢客戶系統(tǒng)對(duì)百度搜索推廣信息進(jìn)行更為高效地管理與優(yōu)化,對(duì)推廣效果更為科學(xué)地進(jìn)行評(píng)估。這里輸入的就是鳳巢客戶以及可以收集到的與之相關(guān)的所有數(shù)據(jù),業(yè)務(wù)導(dǎo)向的邏輯就是輸出可用于決策的對(duì)百度搜索推廣信息進(jìn)行更為高效地管理與優(yōu)化、對(duì)推廣效果更為科學(xué)地進(jìn)行評(píng)估的數(shù)據(jù)。
業(yè)務(wù)邏輯定義了數(shù)據(jù)模型。
4、成熟的大數(shù)據(jù)商業(yè)變現(xiàn),背后有極其復(fù)雜的業(yè)務(wù)邏輯,比如就像剛剛提到百度鳳巢系統(tǒng)。其通過技術(shù)實(shí)現(xiàn)建模(業(yè)務(wù)導(dǎo)向),并實(shí)現(xiàn)的一個(gè)個(gè)數(shù)據(jù)模型,進(jìn)而不斷收集輸入物以通過這些又業(yè)務(wù)邏輯定義的數(shù)據(jù)模型,輸出成具備價(jià)值的數(shù)據(jù)。
5、 對(duì)于業(yè)務(wù)邏輯的優(yōu)化和延展(新特性),業(yè)務(wù)邏輯決定了數(shù)據(jù)模型,而輸出不一定是最好的結(jié)果,所以數(shù)據(jù)模型要被優(yōu)化,而數(shù)據(jù)模型是被業(yè)務(wù)邏輯定義的,所以業(yè)務(wù)邏輯要做優(yōu)化;當(dāng)有新的業(yè)務(wù)需求需要在原有業(yè)務(wù)邏輯上生長出來,從而在定義了業(yè)務(wù)邏輯后數(shù)據(jù)模型相應(yīng)改變從而得到新的輸出。
簡單畫了張圖說明下:
6、總結(jié)下:大數(shù)據(jù)的商業(yè)化,我從數(shù)據(jù)、模型到業(yè)務(wù)邏輯簡單梳理了一下,核心是在業(yè)務(wù)邏輯找到商業(yè)化的方向以使得技術(shù)實(shí)現(xiàn)和數(shù)據(jù)結(jié)果滿足業(yè)務(wù)導(dǎo)向的數(shù)據(jù)模型落地,從而實(shí)現(xiàn)商業(yè)化。