在過去幾年,全球零售商一直試圖利用大數據創造價值。由于其大數據分析基礎架構的限制,許多工作被一再推遲。Hadoop為這些零售商打開了新的大門,它可以解決他們在過去幾年在大數據領域面臨的許多問題和挑戰。
Hadoop:跨多門編程語言的大數據解決方案
Hadoop背后的技術最初是由Google大約在10年前開發的。核心代碼主要是用Java編寫的,但有一些是用C編寫的。然而,它運行在一個稱為MapReduce的編程模型中,這允許開發人員用其他語言創建新的Hadoop代碼。
由于MapReduce環境可以接受不同的編程語言代碼,因此它非常通用。它可以提取,分析和操作許多不同來源的大數據。它使用各種算法來進行關聯規則學習,聚類,分類和回歸。這些算法依賴于各種函數,包括貝葉斯,期望最大化和FP-Grown算法。
Cloudera的首席執行官Mike Olson表示,Hadoop目前仍處于起步階段,但它已經在塑造零售和金融領域廠商使用大數據的方式了。
“Hadoop平臺旨在解決大量數據(可能是復雜的和結構化的,并且不能很好地融入表中的數據)的混合問題。它適用于深度和計算量大的分析,例如聚類和定位...在在線零售中,如果想為客戶提供更好的搜索答案,以提高用戶的購買欲望,Hadoop可以很好地解決這一問題。
Sears控股公司分部副總裁Aashish Chandra表示,Hadoop已經幫助公司降低了運營成本,提高了銷售額。Chandra說,以前的大數據提取工具缺乏他們所需要的功能。
使用Hadoop挖掘銷售點大數據
銷售點數據在零售業中起著非常重要的作用。公司依靠銷售點大數據來預測未來銷售,管理庫存和項目人員需求。
有許多銷售點工具可以聚合銷售信息并將其存儲在大數據集中。然而,零售商難以用常規工具從PoS中挖掘大數據,即使它就存儲在SQL數據庫中。Hadoop使零售商更容易從客戶數據庫訪問信息,此數據可以轉換為其他格式,并與其他文件中的數據集合并。
New Horizons CLC的John Soto聲稱Hadoop是零售業主要的改變者。
“大型零售商永遠不可能利用其傳統的大數據基礎設施進行這種分析。存儲如此多的歷史數據是十分昂貴的,并且數據類型復雜,并且需要相當多的準備以允許它與PoS事務組合。Hadoop解決了這兩個問題,并且可以運行比舊系統更復雜的分析。”
Hadoop可以讓零售商預測分析挑戰
Hadoop消除了零售商在利用大數據方面的一些障礙。這里有一些該技術帶來的好處:
1、數據挖掘能力強。許多零售商都存儲了TB級別的數據。這些數據集往往難以提取,因為它們有很深的嵌套。Hadoop有非常復雜的索引算法,因此它可以提取以前無法為大數據應用程序使用的數據。
2、與不同的數據格式兼容。零售商以許多不同的格式存儲數據。內部財務數據通常存儲在.csv文件中。零售商一直在努力進行審計,因為他們無法比較結構化和非結構化數據集的數據。Hadoop可以提取多種格式的數據,進行分析并以更具凝聚力的形式呈現,它使大數據分析專家能夠從多個來源的數據集之間尋找相關性。
零售商已經發現了使用Hadoop的好處:
1、Staples使用Hadoop分析大數據和預測未來的銷售,這有助于他們更有效地分配資源給人員和庫存。 據報道,自使用Hadoop以來,Staples的促銷成本降低了25%。
2、亞馬遜使用Hadoop來改進欺詐檢測模型。據報告,他們將信用卡欺詐減少了50%,因為他們可以更容易地識別出信用不佳的人。
3、相比之前,Brands可以得到更詳細的客戶信息,這有助于他們改進營銷策略。使用Hadoop和預測分析的零售商的銷售額增長了73%。
零售商只是開始認識到Hadoop和大數據的潛力。根據DeZyre所說,Hadoop最大的優勢之一是它可以幫助零售商實時識別和應對挑戰。這對防止欺詐尤其重要,因為罪犯總是在考慮新的騙局。
“操縱者總是在發明新的欺詐工具和技術,零售商必須使用零售分析來識別欺詐活動,防止它們再次發生。使用大數據技術(如Hadoop,MapReduce和Spark),可以對超過50 PB的數據執行分析,以準確預測潛在風險。”