結合零售行業,在闡述大數據給傳統零售業帶來的思維、商業、管理這一系列變革的同時,著重從傳統零售業數據統計步驟的數據采集、整理、分析、詮釋這幾個方面分析大數據給零售業統計帶來的影響與變革,同時分析大數據應用在零售業所帶來的關于隱私問題的挑戰,給出零售業統計應如何應對變革的一些探討,諸如擴大數據的采集面、增加數據采集的廣度與深度、采用數據挖掘技術進行大數據分析、引入數據可視化技術進行數據詮釋等。
關鍵詞: 大數據時代,零售業,零售思維,零售管理,零售業統計;數據挖掘
大數據是指傳統數據庫管理工具難以處理的大量的、多樣化的數據。當前普遍認為大數據有三個特點(3V):第一Volume,是數據容量非常大,第二Velocity,是數據增長速度非常快,處理速度非常快,第三Variety,是數據類型越來越多樣化[1]。
零售行業隨著數據采集與存儲技術的進步也逐步形成了零售業大數據。通過對這些數據進行挖掘分析,能夠給零售企業帶來巨大的商業價值以及服務創新,諸如能夠更好地了解和洞察消費者,從而實現精準化營銷,或者變革供應鏈模式,實現貨品精細化管理等。但是在這之前,必須首先要清楚大數據究竟從哪些方面給零售業帶來了變革需求,才能有針對性地利用好零售業大數據。
一、大數據時代零售思維、商業與管理變革
(一)零售思維的變革
維克托 邁爾在《大數據時代》一書中提出了大數據思維的三個最顯著的變化:一是樣本等于總體。這與過去基于樣本進行統計分析的思維截然不同;二是不再追求精確性。在大數據中往往存在“噪音”和罕見事件,這樣的數據影響了結果的精確性;三是相關分析比因果分析更重要,在大數據時代我們將注意力更多地放在“是什么”而不是“為什么”。將這種全新的思維結合傳統零售業考慮,我們也許會得到如下幾個方面的啟示:
要分析與零售商特定目標相關的全部數據,而不是采用對樣本的分析來推斷總體的方式。當采集并存儲所有的數據并不再只是一種可能,基于樣本的統計分析也就越來越難以適應企業對數據的使用需求。零售商通過分析利用大量的銷售等數據,可以準確地預測客戶的需求,實行精準營銷,給零售企業帶來實質性的效率與利潤提升。
放棄追求精確性,并接受數據的噪音。倘若零售企業只追求精確的數據,那么只有大約5%的結構化數據能夠被合理使用,而大約有95%的半結構化及非結構化數據都無法被使用,這會造成數據資源的巨大浪費。只有接受數據的噪音,容許部分冗余甚至錯誤數據的存在,才能更充分地利用數據,挖掘零售數據的價值,實現零售商的經營管理目標。
零售行業在進行數據分析時應該更加注重分析事物的相關關系而不是因果關系。相關關系可以使零售商們從不同的角度觀察、分析、解決問題,以確定怎么做可以達到更好的效果。而且相關關系是一種比因果關系更加有效的關系。例如,沃爾瑪在經過數據分析后得到,蛋撻的銷量在颶風到來之際大幅增加,因此將蛋撻擺放在颶風用品附近的位置,提高了蛋撻的銷售量[2]。在這個例子中,通過分析蛋撻銷售量與颶風的相關關系,找到了提高銷售量的新方法,這體現了在大數據時代相關關系分析的必要性與重要性。
(二)零售商業的變革
在以電商為首的“數據巨頭”的沖擊下,傳統零售業面臨著巨大的挑戰。我們可以觀察到的一個現象是目前許多唱空百貨等線下零售業的聲音不絕于耳。這主要是由于互聯網電商巨頭諸如阿里、京東等已經在中國零售行業中占據了大量的份額,傳統的零售諸如百貨行業由于線下市場萎縮以及商品定價的弱勢性在無形之中已經被慢慢擠掉了許多利潤。目前傳統零售業面臨著零售商品價格體系管理的滯后、營銷的不便利性,例如相同商品不同銷售商之間的比價,快遞送貨服務以及年輕消費客戶的流失等問題。而且傳統零售行業的營銷方式無法像互聯網電商一樣通過各種數據分析消費者的喜好,從而無法做到一對一的精準營銷。所有的這些問題,導致傳統零售行業面臨著重大的商業變革。
為了應對零售業面臨的挑戰,一個可行的思路便是線下購物體驗化。這主要是指通過改善線下購物的環境與方式,給予消費者更多在線上購物中享受不到的愉悅體驗,其表現的特征主要體現在傳統百貨購物中心化。這其中的典型例子譬如上海的購物中心K11在其店內專門布置了一個小型的農場,顧客可以零距離接近自然體驗種植的樂趣。而北京的喬福芳草地則巧妙地打造了一個具有濃厚藝術氣息氛圍的購物中心,給予顧客藝術之美的體驗與熏陶。毫無疑問,這種傳統零售企業的轉型必然要建立在了解客戶的心理需求與偏好的基礎上,這就在客觀上要求傳統零售業紛紛進入大數據領域挖掘客戶的商業需求。國內企業如銀泰是進入大數據領域掘金的典型零售企業,銀泰通過設置在購物中心的WIFI來獲取用戶數據。通過抓取的數據分析消費者的性別、年齡,購物偏好、習慣,以及購物頻率、搭配等。同時,銀泰官網也在收集消費者的品牌偏好的數據,并結合實體店的數據進行分析,獲得新開商店的品牌組合、門店位置選擇以及品牌位置組合。
隨著科技的進步以及建設大數據成本的降低,將會有更多傳統零售企業采用高新科技技術收集客戶的購物喜好、購物組合、購物頻率等購物信息,并積累了大量的數據資本,開創零售行業商業變革。
(三)零售管理的變革
傳統零售業的經營決策在相當程度上依靠企業管理者主觀判斷,其體現在依靠管理者的知識水平、經驗、直覺等。這種決策方式缺乏對決策過程的監控,缺乏對決策執行過程中數據的收集、提取和分析,未能明確數據決策與決策結果之間的關聯關系[3]。這種過于主觀不夠嚴謹的決策方式主要是由于傳統零售業的運營銷售等系列數據分散在不同的部門,把它們搜集在一起進行合并分析具有較多困難,導致很難高效地利用這些數據。大數據時代的來到使得傳統零售企業決策過程由管理者主觀判斷變為以數據為導向進行決策成為趨勢。 沃爾瑪百貨是世界性連鎖企業,其率先應用大數據分析作為企業決策的基礎。沃爾瑪為了提高大數據成果在不同部門之間的高效利用、并增加存貨管理和供應鏈管理的投入回報率,其開發了Retail Link工具。供應商使用該工具可以預先知道不同店鋪的商品銷售和庫存情況,從而能夠在沃爾瑪發出指令前自行補貨,極大地減少商品斷貨和供應鏈的庫存水平[4]。因此,供應商能夠更多地控制商品的陳設,沃爾瑪也可以降低庫存成本,減少投入成本。綜合起來,沃爾瑪百貨不僅提高了服務質量,而且削減了供應鏈管理的開支,提高了企業的運作效率與利潤。沃爾瑪百貨在銷售管理中應用大數據,以大數據為決策的基礎,開創了以大數據為決策基礎的零售業管理的新局面。
在互聯網時代,隨著信息技術的不斷發展,使得零售企業能夠記錄并存儲其銷售、采購以及員工行為的一切信息。這些數據存儲到企業的數據庫中,通過數據挖掘方法進行處理分析,從而成為企業以數據為導向進行決策的基礎。隨著大數據時代的到來,傳統零售業管理決策過程必將向大數據決策轉變。
二、大數據時代零售業統計的變革
在傳統的統計步驟中,包含了數據的采集、整理、分析、詮釋四個部分,每個部分都已經在傳統的數據統計理論下形成了各自的內容與方法論。而在大數據時代,其帶給零售業重大的影響之一便是其數據統計方法的變革,這種統計變革集中體現在零售業數據的采集、整理、分析、詮釋四個方面,涉及傳統統計分析的完整流程。以中國人民大學網絡與移動數據管理實驗室開發的Scholar Space為例,大數據背景下進行數據分析的完整流程如圖1所示。可以發現,與傳統統計步驟相比,對大數據的處理分析引入了更多的計算機軟硬件技術。
(一)在零售業數據的采集方面
零售行業進行的數據采集工作主要針對其客戶購買行為、商品的銷售情況、企業的財務狀況等一系列數據,企業利用這些數據對日常的生產經營進行分析決策。在傳統的統計方式下,企業的原始數據采集行為往往主要是依靠客戶群隨機抽樣進行問卷調查,對各項銷售報表以及財務報表進行收集,進而對這些原始數據進行處理分析與應用。在這種數據采集方式下,零售行業所能采集到的數據多以結構化數據為主,且其應用有很大的局限性[5]。
而在現在以及未來,日常各種行為所產生的信息處于一個大爆炸的狀態,傳統數據采集方法的效率日趨低下,絲毫跟不上信息產生的節奏,已經不能滿足新時期企業進行生產經營創新的需要,故零售業企業在數據采集方式方法上面迫切需要發生重大的變革。現在看來,這種變革的方向將會在線上與線下數據采集工作中同時進行,所采集數據的結構將會由結構化數據轉向半結構化乃至非結構化數據。具體而言,我們可以采集客戶群在互聯網上的一系列線上行為數據并存儲進而進行整理與分析,同時,由于物聯網以及云計算技術的發展,我們也可以通過電子設備采集消費者在實體商店的一系列線下行為數據[6]。就線上數據采集而言,我們將主要收集顧客在零售網站上留下的信息,包括保存在瀏覽器cookies中的系列點擊行為以及直接存入系統后臺的網站交易行為。而線下的數據采集則可以通過各種電子設備與技術例如pos機、藍牙4.0、NFC技術等來記錄顧客在店內的行為數據。
(二)在零售業數據的整理方面
不管是傳統的零售業統計還是在大數據背景下的統計,在完成數據采集之后必須對數據進行整理。數據整理是指對所采集的統計數據進行匯總,去除其中的冗余與錯誤數據,同時篩選出其中的有效指標,確定對數據總體的處理方法。傳統的零售業數據整理主要包含對所采集數據的查核,對數據進行分類與聚類,根據數據編制統計表圖,積累與保管統計資料數據[7]。一般意義下,傳統數據的整理方式更能夠凸顯群體水平――例如零售行業門店商品總成交額、單個商品成交數目等。這些數據沒有必要也無法實現實時采集,只需能保證在周期性、階段性的對數據的評估中獲取即可。傳統數據反映的是零售行業的因變量水平,即零售行業的整體經營狀況如何,企業內部的財務水平如何,顧客對企業的整體主觀感受如何等問題。這些數據,譬如顧客對企業的主觀評價,由于事先顧客對其行為完全知情,因此帶有很強的刻意性與隨意性――因其主要是通過標準的量表統計與調查方法進行。
相較之下,大數據賦予了我們去關注每一位個體顧客的微觀表現能力,譬如顧客在某個特定時間段偏愛于購買何種商品,顧客在某類商品貨架旁的時間停留長度,顧客最終決定購買商品所花費的時間等。這些數據是高度個性化特征的體現,對于其余個體沒有什么意義。同時,這些數據在每時每刻顧客購買與企業銷售的交互行為中產生,其產生完全是過程性的。對于這些數據的整理將能夠詮釋零售行業微觀銷售經營過程中自變量的水平,如應該怎樣才能盡可能長時間使消費者逗留,怎樣的物品擺放方式可以提高兩種物品的銷售量,怎樣的店鋪選址可以最大化顧客流量。
在大數據背景下,零售業大數據由于進行采集數據行為的數據源及數據內容存在交互性重疊,導致原始數據需要進行清理以去除數據噪聲與數據冗余并同時對所抽取數據進行聚類。首先,需要對所采集的數據進行清洗、重構與填補以去除冗余彌補缺失。其次,在新的背景下零售業所采集的數據中必定包含大量的半結構化以及非結構化數據,我們需要將這部分數據進行處理,使之變為應用軟件能夠識別處理的機器語言。最后,我們需要對已完成前兩步處理的數據進行相關性與關聯性檢測,將相關性高的數據融合在一起開始進行下一步的數據分析。
(三)在零售業數據的分析方面
數據分析是發掘出數據價值的關鍵步驟。一般而言,在傳統的零售業統計分析領域,在完成對數據的采集整理后,要構建一系列模型對處理過的數據進行分析。傳統的統計研究分析方法主要包括線性或非線性回歸方程的建立、回歸模型參數的估計、參數估計結果的檢驗,同時對數據進行相關分析、回歸分析、方差分析等。傳統的統計研究分析過程一般先進行定性分析,對分析對象做出一個主觀性質的判斷,這主要是為隨后的定量分析提供一個方向,然后進行定量分析,通過各種模型估計參數以及進行一定置信度范圍內的顯著性與有效性檢驗,最后再回歸到定性分析,主要是對定量分析的結果進行統計詮釋。傳統的統計實證過程則是先設立假設再進行檢驗,檢驗部分就是根據抽樣分布理論以一定的概率保證程度進行對總體的推斷[8]。在實際中,傳統零售業分析企業數據是將原始數據錄入到企業信息系統中由系統自動產生分析結果,零售業只能依賴于這些片面的結構化數據以及純粹的經驗理論假設對企業做出經營決策。
而在零售業的大數據統計分析中,傳統的統計分析方法過程顯然已經不再適用。在分析思路方面,傳統的假設檢驗流程也已不能凸顯其優勢,目前對大數據的統計分析是以相關關系為基礎進行的數據挖掘。數據挖掘也可以稱作現代統計學,其跟傳統的統計分析有很大的不同。因為傳統的統計分析主要是針對結構化數據進行線性相關分析,而大數據條件下的數據挖掘,則是要對更多的半結構化非結構化數據進行非線性相關以及不明確函數形式的線性關系進行探索、推斷與評價。在大數據分析的前提下,相關關系的分析將并不依賴于傳統的“假設中的因果關系”,其將直接分析數據庫中所存儲的經過整理的數據之間的聯系,由此可以避免受到人為的假設限制,發掘數據深處的意義。
現代意義上的統計學分析也即數據挖掘,是傳統的統計分析方法的擴展和延伸,其常用的技術有關聯規則挖掘、神經網絡模擬、支持向量機、隨機森林樹、遺傳算法、貝葉斯網絡等。如果能夠將這些數據挖掘技術應用于大數據時代的零售業數據統計分析過程中,無疑將會給企業帶來巨大的價值回報。譬如關聯規則挖掘,關聯規則指的是一個已發生事件和其他已發生事件之間相互依賴或關聯的信息,其一般包括簡單、因果、時序關聯等。而關聯規則經典算法Aprior的基本思想就是通過迭代算法發掘數據中的具有一定支持度的高頻項目集并進而構造置信度不低于用戶設定的最低值的關聯規則,此時如果某個事件集中有因素存在關聯,則可以由其中一項因素的屬性值依據推斷出其他因素的屬性值。在大數據背景下,運用關聯規則挖掘進行數據相關性分析的一個典型應用便是購物籃子分析,通過分析系統交易數據庫之中不同商品之間的銷售情況的聯系,譬如某種商品的購買量與另外品類商品購買量之間的相互影響,從而可以探尋出顧客的購物行為模式。利用這種算法分析得到的結果在企業銷售的很多方面都可以運用,例如對商品擺放的布局、商品庫存的閥值設立以及對用戶群分類進而實施差異化營銷。眾所周知的沃爾瑪超市發掘出啤酒與尿布之間相關性的案例便是關聯規則應用于數據挖掘的典型案例。
(四)在零售業數據的詮釋方面
在完成對零售業數據的分析之后,就要將所分析得到的結果應用于實際的解釋與預測之中。如果沒能運用適當的數據詮釋方法,那么即使我們的數據分析結果沒有錯誤,我們得到的預測結果也必將不能很好地與現實的發展趨勢擬合。在大數據時代由于數據的分析結果的繁多以及結果之間復雜的相關性,傳統的以文本為主要輸出形式的解釋結果將不再適用,這就在客觀上造成了傳統的詮釋預測方法變革的需要[9]。大數據背景下的數據詮釋,首先需要引入數據可視化技術,使用圖形來表示數據分析的輸出結果,從而幫助零售商能夠更加形象地觀察到數據之間隱性的關系與規律。其次需要引入人機交互與數據起源技術,這能夠讓零售企業各部門能夠熟悉和參與數據分析詮釋的具體過程。
目前零售業的數據詮釋,大數據運用在零售業的最終營銷過程中表現得很好。運用挖掘出的結果對銷售及顧客數據進行解釋并預測,能夠顯著提高預測的精確性與適時性,同時,也可運用其進一步細分市場,提高企業的目標群體營銷水平,降低企業銷售風險。目前,英國領先的零售商樂購(TESCO)已經開始運用大數據來解釋分析顧客的行為。其主要運作流程是首先在系統中建立一個顧客關系型數據庫,給予每個顧客唯一的一個編號,然后通過各種線上與線下方式采集顧客的一系列消費數據諸如所購買商品的種類、金額等,接著再通過利用已經開發出的數據模型對這些海量交易數據進行分析,從而大致可以得到關于單個顧客的一些信息諸如其消費習慣、近期可能需要的商品等。樂購通過這些結果指導其促銷計劃的制定與商品價格的及時調整。同時,樂購通過對每個門店的店員結賬數據、貨品上下架數據、商品購買與退貨率進行統計匯總生成門店的日營業分析報告,這使得其能夠對銷售過程進行即時性把控,這為其提供了更加高效的盈利方法[10]。
三、零售業應用大數據的挑戰
隨著基于云計算的應用以及社交網絡的普及,“隱私”成為大數據發展繞不開的一個挑戰。在零售行業中,不論是商品的銷售信息,還是顧客的消費習慣,都以不同的數據形式被存儲到數據庫中;另一方面,大數據相關法律不健全,網絡監管不力也使各類數據泄露事件無法得到有效的解決。大數據堪稱一把雙刃劍。零售企業,會在大數據分析中獲得巨大利益,但同時消費者的隱私也都以數據形式被存儲起來。零售業大數據出現以后,肯定會帶來更多的隱私泄露或者是與隱私泄露相關的問題,但是,不能因噎廢食,必須解決這些問題才能推動零售業大數據環境的發展。零售企業可以通過安裝殺毒軟件、建立防火墻來防止信息泄露的問題發生。
四、結語
相比于互聯網電商利用大數據已經取得的各種令人驚嘆的成果,傳統的線下零售業在挖掘大數據價值方面落后了很多。但是,落后的同時也意味著,傳統零售業有著充分的潛力去利用大數據實現自己的商業模式轉型。傳統零售業在大數據時代下的各種變革中,統計思想與方法的變革無疑是最根本而又最重要的。唯有從傳統零售業統計的數據采集、整理、分析、詮釋這一完整流程的各個方面進行改革,才能使得傳統零售業在未來仍然能適應市場的需求。具體而言,在數據采集方面零售業要能夠通過運用行業最新技術以各種線上與線下方式擴大數據采集面,保證數據來源多樣性;數據整理方面需要將所采集數據細分為企業層面的宏觀數據以及顧客層面的微觀數據并分別應用不同的處理方式進行整理;在數據分析過程中則要變革傳統的以假設檢驗為核心的統計分析為基于大數據算法下的相關性數據挖掘;同時引入可視化技術以及人機交互與數據起源技術運用于數據詮釋過程以改革傳統的統計數據詮釋。與此同時,零售行業在運用大數據的過程中,不能忽略的一點是大數據也并不是沒有缺點,需要充分重視如何回避大數據帶來的負面效果。正如維克托?邁爾在撰寫《大數據時代》一書的同時,還寫了另外一本名為《刪除》的書,就是要告訴我們,大數據是一把雙刃劍,在運用的時候一方面必須處理好數據與隱私之間的界限,另一方面也必須要處理好已掌握的數據的取舍問題。