消費品企業(yè)應(yīng)該如何使用內(nèi)部產(chǎn)生以及外部采集的數(shù)據(jù),像互聯(lián)網(wǎng)公司一樣建立用戶畫像與會員體系,以數(shù)據(jù)驅(qū)動的方式進(jìn)行精細(xì)化的生產(chǎn)、運營和銷售?
傳統(tǒng)的管理咨詢公司,雖然有無數(shù)頂尖的大腦,但是他們的大腦只靠 Excel 等簡單工具的輔助,這樣的算力,能不能滿足上述的需求?
在 2015年 上半年,數(shù)據(jù)冰山團隊有幸為國內(nèi)一家時尚消費品行業(yè)的龍頭公司進(jìn)行數(shù)據(jù)平臺的建設(shè),歷時半年,完成了內(nèi)部數(shù)據(jù)的打通和洞察,用戶畫像,會員體系的搭建,以及外部數(shù)據(jù)獲取與跟蹤。在這里和大家分享我們的一些體會,希望更多的消費品企業(yè)可以用數(shù)據(jù)驅(qū)動的方式來進(jìn)行精細(xì)化的運作。
其實作為龍頭消費品企業(yè),其數(shù)據(jù)生產(chǎn)能力與中等規(guī)模的互聯(lián)網(wǎng)公司不相上下,支撐日常業(yè)務(wù)的 IT 系統(tǒng)大大小小共有十余個,比如:
1)分銷系統(tǒng):支撐全國上千家線下門店每日的銷售配貨,每日訂單量在數(shù)十萬量級;
2)電商訂單系統(tǒng):負(fù)責(zé)處理十余個主流電商(京東,天貓,唯品會,一號店,聚美,亞馬遜,當(dāng)當(dāng)網(wǎng),有贊等)的訂單管理與客服;
3)倉庫管理系統(tǒng):負(fù)責(zé)全國各大區(qū)域的倉儲物流,數(shù)千個 SKU 的備貨情況;
4)BI 系統(tǒng):負(fù)責(zé)各主要業(yè)務(wù)系統(tǒng)的數(shù)據(jù)聚合,制成日常統(tǒng)計報表;外加大大小小的財務(wù)系統(tǒng),人力系統(tǒng),績效系統(tǒng),品牌 / 分公司訂貨系統(tǒng)等,每日產(chǎn)生的數(shù)據(jù)維度以及量級其實已經(jīng)相當(dāng)龐大。
但和互聯(lián)網(wǎng)公司相比,消費品企業(yè)的數(shù)據(jù)消費,數(shù)據(jù)分析能力存在明顯的短板。越來越多的管理層也十分希望像互聯(lián)網(wǎng)公司一樣管理用戶和數(shù)據(jù),使用數(shù)據(jù)驅(qū)動他們的決策。
面對這樣龐雜而分散的數(shù)據(jù)以及對快速實時產(chǎn)生數(shù)據(jù)的渴求,不僅傳統(tǒng)企業(yè)的 IT 及經(jīng)營分析部門束手無策,再高端的管理咨詢公司也只能撓撓頭說 “臣妾做不到呀”,實在是超越了這群聰明人大腦的算力。
接下來會從三個角度分享如何為傳統(tǒng)行業(yè)搭建數(shù)據(jù)平臺,首先介紹大數(shù)據(jù)(數(shù)據(jù)科學(xué))與商業(yè)智能(BI)在消費品領(lǐng)域的應(yīng)用,然后詳細(xì)講解用戶畫像與用戶體系搭建,最后分享如何利用外部數(shù)據(jù)(電商,社交媒體)對行業(yè)趨勢與其他企業(yè)的運營進(jìn)行監(jiān)控。
在這里面所用到的數(shù)據(jù)相關(guān)的技術(shù),已經(jīng)大大超越管理咨詢顧問的算力。如同封面圖中的《魔戒》水晶球 Palantiri,它如同數(shù)據(jù)技術(shù)賦予了人類及精靈看到任何地方的能力。而傳統(tǒng)的人類,無論如何提高人肉的眼力,也只能到目力所及的有限范圍。
1大數(shù)據(jù)和商業(yè)智能(BI)
我們很少說自己是一家大數(shù)據(jù)公司,因為大數(shù)據(jù)這三個字的意義更多是指一種概念和思維方式,并沒有什么具體的含義,既不是一種工作也不是一種技術(shù),可能勉強算得上是一些門檻稍高的,和數(shù)據(jù)科學(xué)有關(guān)的算法,技術(shù)以及工具的統(tǒng)一稱謂,比如數(shù)據(jù)挖掘 (聚類,關(guān)聯(lián)),機器學(xué)習(xí) (邏輯回歸,神經(jīng)網(wǎng)絡(luò)),比如自然語言處理,比如分布式運算 (Hadoop, Spark)。但在服務(wù)具體企業(yè)的時候,我們難免會被套上大數(shù)據(jù)的殼子,畢竟大家都在找能做 “大數(shù)據(jù)” 的公司。
相比大數(shù)據(jù),Business Inteligence (BI) 的歷史就要久遠(yuǎn)許多,在各大軟件廠商的不斷教育下,大中型公司幾乎都采購了 BI 軟件。其實 BI 也是一個比較寬泛的概念,和大數(shù)據(jù)一樣包含了許許多多的技術(shù)和工具,像是數(shù)據(jù)倉庫,OLAP cubes,Data Mart,Star schema,數(shù)據(jù)挖掘等等。那么他們究竟是不是同一個東西呢?
1.1商業(yè)智能(BI)
其實軟件廠商所提供的 BI 軟件與廣義的 BI 概念還是有很大程度的區(qū)別。
為了追求高度的抽象化與通用性,BI 軟件大部分時間所承擔(dān)的責(zé)任是一家公司的各類報表應(yīng)用:將各個 IT 系統(tǒng)的數(shù)據(jù)聚合至 BI,然后進(jìn)行統(tǒng)計匯總,并統(tǒng)一在前端通過 BI portal 呈現(xiàn)出圖表與數(shù)值,便于業(yè)務(wù)人員了解日常數(shù)據(jù)和運營情況。
所以除了 ETL 部分以外,BI 軟件絕大多數(shù)的功能都是通用性極強的,跨行業(yè),非定制化。ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程。其實傳統(tǒng)的消費品企業(yè)面對零散的數(shù)據(jù)庫,特別需要 ETL 的服務(wù)。
ETL 看似低端,其實當(dāng)今的大數(shù)據(jù)頂尖企業(yè) Palantir,在最初為 CIA 服務(wù)的時候,也是從 ETL 開始的,讓美帝特工不用在分散的多個數(shù)據(jù)庫上分別做一次查詢。
這也就決定了 BI 軟件的 sweet spot 在于監(jiān)控和繪制通用性的統(tǒng)計報表,比如時間序列統(tǒng)計,分布統(tǒng)計,分段統(tǒng)計等等。
圖 1 展示了這家消費品企業(yè)兩年間平均價格變動與總銷量的時間序列,可以看出銷量兩年來穩(wěn)步增長,有小周期性(一二月份賣得少,換季的月份賣得多),而賣出商品的價格兩年保持基本一致,并呈明顯周期性變化(對于時尚消費品,冬款的造價自然要高出夏款許多)。
圖 2 展示了集團旗下各品牌的銷量分布和占比,可見此集團有一個相當(dāng)強悍的主品牌,以及 2-3 個在垂直領(lǐng)域表現(xiàn)不菲的子品牌,定期輸出銷量分布,可以監(jiān)控各品牌的發(fā)展情況并衡量品牌策略是否成功。
BI 軟件的強項是將這些業(yè)務(wù)數(shù)據(jù)匯總起來,無需編程即可繪制出可供長期監(jiān)控的可視化報表,同時實現(xiàn)隨時更新,而不是傳統(tǒng)管理咨詢的一份靜態(tài)報告。傳統(tǒng)咨詢提供的報告,往往在出爐的第一天就過時了。
1.2數(shù)據(jù)科學(xué)
反觀數(shù)據(jù)科學(xué),如果站在一個數(shù)據(jù)工程師的立場上,BI 軟件做的事情其實也屬于數(shù)據(jù)分析的范疇,任何數(shù)據(jù)洞察,數(shù)據(jù)挖掘工作都需要涉及到這些通用維度的基本統(tǒng)計。但在這種淺層分析的基礎(chǔ)之上,數(shù)據(jù)科學(xué)家可以通過帶入較強的人為干預(yù)和行業(yè)性輸入,做到許多高于 BI 的數(shù)據(jù)洞察。而將這些洞察落地,運用至具體產(chǎn)品設(shè)計,營銷方案,會員體系和售后服務(wù)中,便可以像互聯(lián)網(wǎng)公司一樣,實現(xiàn)以數(shù)據(jù)驅(qū)動業(yè)務(wù)。
舉一個實際的例子,圖 3 是用戶重復(fù)購買間隔的 CDF 曲線 (Cumulative distribution function)。橫坐標(biāo)代表天數(shù),縱坐標(biāo)代表百分比。數(shù)據(jù)顯示,有 37%的用戶在第一次購買后的一個月(30 天) 內(nèi)會進(jìn)行第二次購買,而 45%的用戶在第二次購買后的一個月內(nèi)進(jìn)行了第三次購買,51%的用戶在第三次購買后的一個月內(nèi)進(jìn)行了第四次購買。隨著購買次數(shù)的增加,CDF 曲線向左傾斜,也就意味著用戶在建立了品牌認(rèn)知后,購買頻率顯著增高,兩次購買之間的間隔明顯縮短。
因此,誘發(fā)新用戶建立品牌意識,進(jìn)行二次購買的窗口為 3-4 個月的換季檔,而對老客戶的消費喚醒窗口期則更短,以 1-2 個月為最優(yōu)。這是一個很典型的數(shù)據(jù)工程師利用自己的行業(yè)知識和經(jīng)驗來實現(xiàn)數(shù)據(jù)洞察的例子,也是 BI 軟件無法做到的。首先研究復(fù)購間隔是消費品行業(yè)獨有的場景,更重要的是想要完成這個洞察,其中所涉及的統(tǒng)計工作具有很強的定制性,也較為復(fù)雜,需要編寫統(tǒng)計腳本或是使用多條復(fù)合 SQL 來實現(xiàn),數(shù)據(jù)工程師的價值也在此有了體現(xiàn)。
除了復(fù)雜和高定制性的統(tǒng)計邏輯外,對于非結(jié)構(gòu)化數(shù)據(jù)的處理和挖掘也并非 BI 軟件的強項。對于大型消費品公司來說,全電商渠道的運營已經(jīng)成了常態(tài),每日來自京東,天貓,唯品會,一號店,聚美這些大型電商平臺的訂單數(shù)高達(dá)數(shù)萬個。而這些訂單中的郵寄地址里包含了巨大的信息量,比如用戶所在的城市,地理位置,甚至是身份,職業(yè),消費能力等等。通過程序和地圖 API 將這些郵寄地址轉(zhuǎn)化為經(jīng)緯度后,可以對用戶群做大量的精細(xì)研究。
圖 4 便是我們利用送貨地址做的用戶群分布的熱力圖,以北京的海淀區(qū)為例,大量的用戶密集集中在中關(guān)村周邊,其次便是各大高校宿舍聚集的區(qū)域,如五道口,知春路等地。紅色標(biāo)簽為品牌線下店鋪位置,可見門店已經(jīng)覆蓋了中關(guān)村,北京大學(xué)和五道口等地,但對于知春路片區(qū),以及用戶相對集中的牡丹園并未開設(shè)分店。相比之下安貞里分店四周并沒有特別多的目標(biāo)用戶群出沒。于是有了圖 4 的用戶分布及店鋪選址。
熱力圖這樣的算力往往超過了管理咨詢公司的能力范圍,然而對于用戶的選址卻是很有價值。
對于一些并無日常監(jiān)控必要的統(tǒng)計,有時也會貢獻(xiàn)許多有價值的洞察。
圖 5 展示了線上用戶購買時間的分布情況。可以看得出,周末線上購物的時間十分均勻,除了半夜之外大部分時間段都有網(wǎng)購發(fā)生。相比之下工作日的線上購物時間分布就變得十分有趣,大量的訂單集中產(chǎn)生在早上九點和十點之間,也就是說大量的時尚白領(lǐng)在上班途中,或是步入辦公室后的第一件事便是敗一件自己心儀的寶貝,然后才能心情舒暢地開始一天的工作。
那么不管是自營電商促銷,短信推廣,還是各宣傳陣地的推送,工作日早上 8 點至 10 點都是一個不錯的窗口。和圖 5 類似,圖 6 將線上用戶的購買數(shù)據(jù)按照一周七天進(jìn)行分布統(tǒng)計,也會出現(xiàn)一些有意思的現(xiàn)象,比如周六周日上網(wǎng)買東西的用戶極少,每周網(wǎng)購的高峰出現(xiàn)在周一和周二?;蛟S上班族們都是通過線上血拼來撫慰自己,治愈周一綜合征的。而越臨近周末,大家在線買東西的熱情也就越低。
像圖 5,圖 6 這樣的數(shù)據(jù)洞察往往也是 BI 軟件無法捕捉到的。數(shù)據(jù)工程師們可以將這些沒有長期監(jiān)控的意義的指標(biāo)轉(zhuǎn)化成擁有商業(yè)價值的洞察。同時這又是傳統(tǒng)的管理咨詢公司無法做到的,因為他們?nèi)狈δ芰φ先绱撕A康臄?shù)據(jù)并按天甚至按小時進(jìn)行實時輸出。
個人認(rèn)為,數(shù)據(jù)科學(xué) (大數(shù)據(jù)) 和廣義的商業(yè)智能原本沒有本質(zhì)區(qū)別,兩者都涵蓋了非常廣泛的內(nèi)容,并且兩者的核心都是通過數(shù)據(jù)處理和分析的方式,提升業(yè)務(wù)表現(xiàn)。
但我們平時所談?wù)摰?“BI” 很多時候其實指是軟件廠商所提供的 BI 軟件 / 套件,用于實現(xiàn)業(yè)務(wù)報表和統(tǒng)計監(jiān)控的功能。暫且不提廠商們是否有故意偷換概念的嫌疑,BI 軟件和數(shù)據(jù)科學(xué)還是有著比較大的差異。可以說 BI 軟件通過高度抽象的方法,提供了一種非常便利的數(shù)據(jù)匯總,統(tǒng)計,可視化的工具,從而完成了數(shù)據(jù)科學(xué)的一部分工作,而許多深層次的,帶有行業(yè)性的,高于 BI 軟件的分析與洞察,仍然需要數(shù)據(jù)工程師的參與,以及特定數(shù)據(jù)系統(tǒng)的支撐來共同完成。
總結(jié)
與傳統(tǒng)的管理咨詢公司相比,在 BI 層面,大數(shù)據(jù)的相關(guān)技術(shù)勝在算力:數(shù)據(jù)整合能力、實時處理能力以及呈現(xiàn)能力。
這一期只是小小的開胃菜,而在后續(xù)的章節(jié)(關(guān)于建立用戶畫像和利用外部數(shù)據(jù)理解行業(yè)及趨勢),大數(shù)據(jù)的相關(guān)技術(shù)將進(jìn)一步將算力的差距拉得更大,讓傳統(tǒng)的腦力無法追趕。