曾創造了"啤酒與尿布"的經典商業案例的沃爾瑪是最早開始投資和部署大數據應用的傳統企業巨頭之一,通俗得講,大數據天然不是沃爾瑪,但沃爾瑪天然是大數據。
在大數據概念引爆流行產業界之前,沃爾瑪已經開始了網站數據庫整合遷移和Hadoop集群擴展工作,收購Kosmix,在此基礎上建立Walmart Labs,并在近年著手收購專注于數據挖掘或移動社交的初創公司如OneOps、Inkiru,Tasty Labs,OneRiot,進軍互聯網。
沃爾瑪希望通過大數據應用讓消費者成為bigger spender,同時在電子商務領域奮起直追領導者亞馬遜。
通過自身數據積累整合及并購研發,沃爾瑪已然擁有一個涵蓋消費者線下交易數據、沃爾瑪網絡商城電子數據與社交媒體應用數據為一體的實時更新積累的大數據庫,為沃爾瑪在做出決策前,將執行成本降到最低,并且創造新的消費機會。
可以虛擬一個場景來講沃爾瑪的數據操作:
Sam,是沃爾瑪的資深會員,其近五年來購買商品的品種、數量、型號、時間信息,支付方式信息,商品配送信息,會員卡信息,住址、聯系方式,甚至包括Sam在沃爾瑪的購物流程監控視頻、門禁數據等線下消費信息都已被沃爾瑪的信息系統詳細記錄。
當Sam近日再一次驅車來到最近的沃爾瑪大賣場時,剛進入停車場,Sam的手機或者iPad等移動終端的沃爾瑪App可能已經收到購物清單上百分之八十以上商品的推薦信息和電子優惠券信息,App上還按商場流程標注了每件商品的具體位置、型號信息,沃爾瑪測試中的“Scan and Go”的系統未來允許Sam用手機掃描商品,然后收銀臺手機掃描支付。而移動支付完成的瞬間,沃爾瑪已經在數據端開始更新Sam的相關消費信息,并開始預判Sam下一次購買比如牛奶和啤酒等商品的時間和數量,并提交數據給APP推薦業務。
另外,Sam很喜歡一款899美金威爾遜網球拍但沒有加入掃描清單,球拍旁邊的塑膠運動模特腦袋里邊的攝像頭記錄下了他的一舉一動,包括Sam的停留時間,拿起網球拍的次數及觀察端詳球拍的視角,甚至他是左手握拍還是右手握拍等等,而第二個月,Sam的手機推送信息中已經有了沃爾瑪推薦的性價比更高的一款Babolat輕碳球拍。
在Sam案例風光的背后,是沃爾瑪實驗室及相關團隊在維持其大數據工作。Walmart Labs著手整合了沃爾瑪旗下網站,將試點Hadoop數據節點正式集群擴展,把分散存放在Oracle、Neteeza、Greenplum等數據庫中資源統一存入Hadoop數據倉庫,并嘗試進行內部數據共享分析。通過開發大數據工具加載交易數據,體量相對較小但結構化程度較高的線下零售數據結合電子商務網站數據為前向購物選擇預測提供了基本支撐。
2000年網上商店作為應景產品上線,但ebay和亞馬遜讓沃爾瑪認識到電子商務的可怕,便在隨后幾年開始發力線上。Walmart Labs 推出的 The Social Genome 能夠讓沃爾瑪將消費者線下購物數據、網絡瀏覽點擊數據、社交網絡關系數據及消費者個人數據等組合成實時更新擴展且具有定向預測功能的強大數據庫,逐步解決線上環節與線下渠道數據匹配上的難點,并借助于消費者在社交網絡上展現的興趣,預測他們可能在Walmart下一個購買的產品。
通過對社交網絡進行深度的數據挖掘,實現網站主頁、商品搜索個性化,依據消費者的興趣來排列頁面上的結果。數據顯示,截止到13年1月31日,沃爾瑪全球互聯網銷售額增長30 %增幅十年來第一次超越亞馬遜。
接著講Sam的沃爾瑪購物故事:
月末Sam車被借走了,所以選擇去沃爾瑪的網上商城,cookie自動登錄后顯示自己上一次登陸沃爾瑪網店是在六個月前。Sam的首頁推薦上有會員八折的罐裝威爾遜網球,還有新款特價的全鋼西門子榨汁機,Sam會心一笑:鄰居Peter在twitter上抱怨自家的榨汁機真垃圾,自己前天點了贊,沃爾瑪竟然知道了!隨后Sam發現自己的facebook上的唯一關注音樂人Robbie Williams的新專輯就在眼前。
另外,自家附近的一家健身房年卡正在打折出售,Sam摸摸肚子上的贅肉一咬牙把年卡加入了購物車,心里還抱怨沃爾瑪你TM怎么都知道這么多。
實際上,沃爾瑪電子商城的消費者線上數據如瀏覽商品種類時間,購物車狀態及支付方式,搜索記錄等都將結構化然后匯入全球統一的Hadoop數據倉庫,半年前Sam通過Polaris搜索引擎尋找網球拍的數據已經為沃爾瑪實體店通過APP給Sam推Babolat輕碳球拍做好了準備。沃爾瑪的線上大數據已經能夠為其線下營收帶來銷售增量。
收編Kosmix團隊,沃爾瑪看重的是Kosmix對社交媒體的語義分析功能,利用Facebook和Twitter的數據,工程師從每天熱門消息中,推出與社會時事呼應的商品,創造消費需求,同時,針對社交網絡快消息流的性質,沃爾瑪內部的大數據實驗室專門發展出一套追蹤系統,結合手機上網,專門管理追蹤龐大的社交動態,每天能處理的資訊量超過10億筆。
沃爾瑪資訊中心副總經理特瑞爾指出,“沃爾瑪本身就是一個海量資料系統,適用各種商業上的分析行為”。媒體稱沃爾瑪擁有將近七成美國人的相關消費數據,八成以上的境內郵箱信息。通過其強大數據庫的算法推薦和預測方案,個人消費數據能夠預測一系列的高敏感個人信息,沃爾瑪將清楚地知道你是誰,你要買什么,甚至你下一步要干什么。
由于缺乏個人信息保護意識,很多有色,低收入,邊緣化社區人群個人數據信息受到大數據商業計劃侵犯,而弱勢人群在沃爾瑪的數據標簽化分類中很容易被識別區分出來,遭受弱歧視化待遇。
大數據會隨著數據的結構化和規模化滾動雪球,越來越“大”,越來越“快”,這個世界上最大的零售商在利用數據技術追逐利潤的同時也逐漸引起人們的擔憂:
科技在帶來商業大發展的同時會不會催生出類似《一九八四》中的Big Brother 2.0。