數據挖掘是從大量數據中提取知識。從數據庫的觀點出發其次,“預測型數據挖掘”包括一系列在數據中查找特定變量(稱為“目標變量”)與其他變量之間關系的技術。
每個企業都會有客戶流失的情況發生,已經失去或是即將失去的,這中情況對企業來說是正常現象,在面對這些常見的正常現象時,關鍵是企業從中能學到什么,得到重要信息并加之分析,找出弊端加以改善,防止客戶的再次流失CRM (Custom Relationship Management)的意思是客戶關系管理。它強調把客戶放在核心位置,其理念要求企業完整地認識整個客戶生命周期,圍繞“客戶接觸點”,提供與客戶溝通的統一、集成的平臺和工具,涉及企業一切與客戶有關的信息交互進行處理。提高員工、客戶接觸的效率和客戶反饋率,為客戶提供整體的服務!同時采用數據挖掘技術對有關信息進行分析,得到有價值的信息和知識。
一、獲取信息
當前企業間的競爭不僅僅是產品的競爭、企業資源的競爭:而更多的是以客戶為中心的服務。如,獲取競爭信息贏取客戶,認真聆聽客戶的心聲,由客戶方反饋信息,讓企業了解競爭對手的銷售策略方式,獲取競爭對手是否采取了低價策略、出奇的營銷計劃等信息,一邊企業做出最快最準的判斷,與競爭對手爭奪客戶源以便采取培訓或投資項目的啟動決策,通過與客戶的溝通,大量重要信息的獲取后,就可以進行相應的員工培訓。設備投入與投資項目決策階段,將資金投入到需要加以改善的地方,意識企業降低成本將資金用在刀刃上。
識別有價值的客服,已得到關鍵有益信息是企業掌握主動的關鍵。以服務類企業為例,這類公司經常能夠很容易就能識別出那些即將與他們終止業務往來的客戶 他們也知道如何聯系到這些客戶,并加以防范。從相關的統計數據來看,一家企業平均每年會失去一到三成的老客戶。在這些流失的客戶中,哪些是企業自動淘汰的,為什么要淘汰?哪些是由于企業維持不善造成的,或是客戶主動聯系企業與企業達成合作意向的?客戶的流逝對企業所造成的影響非常大,由于在尋找新客戶,建立新的合作關系的過程中,企業將付出維持老客戶成本的3到7倍,因此迅速準確的是被那些即將流失的客戶群,并予以進行正確的維護,做出幾十的判斷對一個企業的發展極為重要。CRM系統,能夠幫企業收集分析這些數據,既然失去的客戶已經無法挽回,那么企業接下來的工作,就只能是總結教訓,防止再犯。而CRM正好可以幫企業的總結提供數據方面的幫助。
二、數據挖掘
數據挖掘(data Mining),又稱數據庫中的知識發現(Knowledge Discovery in Database,KDD),是指從大型數據庫或數據倉庫中提取隱含的,位置的,非平凡的及有潛在應用阿志的信息或模式,是數據庫研究中的一個很有應用價值的新領馭,融合了數據庫、人工智能、機器學習、統計學等多個領域的理論和技術,數據挖掘工具能夠對獎勵啊的趨勢和行為驚醒預測,從而很好的支持人們的決策,今天的技術可以使挖掘過程自動化,把數據挖掘與商業數據倉庫相結合,并以適當的形式把結果表示給從事商業活動的用戶看。
數據挖掘是從大量數據中提取知識。從數據庫的觀點出發其次,“預測型數據挖掘”包括一系列在數據中查找特定變量(稱為“目標變量”)與其他變量之間關系的技術。下面具體介紹幾種預測型數據挖掘技術。
a.決策樹
決策樹方法的起源是概念學習系統(CLS),發展到ID3方法時為高潮,后又演化為能處理連續屬性的C4.5,最后發展成為加入了Boosting思想的C5.0 決策樹是一種常用的分類算法、它通過系統地分解和分離數據集中包含的信息來發現規律和關系,它尋求在數據集中找到那些提供記錄中最大分離信息的影響因素,每次選取能最大程度地區分記錄的影響因素,決策樹據此法則往下生長,當找不到類似的影響因素時,決策樹就形成了。考慮到決策樹的可用性,還要對其“剪枝”和優化。決策樹通過把對象從根節點排列到某個葉子節點來分類,葉子節點即為對象所屬的分類。樹上的每一個節點說明對對象的某個屬性的測試,并且該節點的每一個后繼分支對應于該屬性的一個可能值。現有的客戶流失分析方法多采用決策樹及其變形算法來進行,典型的有英國Lightbride公司開發的Churn Prophet(CART,分類回歸樹)。
b.神經網絡
神經網絡主要用于分類、聚類、估計和預測。神經網絡是一種人腦思考仿真的數據分析模式,用輸入變量與數值來自我學習,并根據學習經驗所得之知識不斷調整參數,以期得到一個較好的模式。神經網絡使用許多參數來建立一個模式。這個模式由一組輸入值來預測一個連續值或分類值。每個結點都是一個函數,這個函數使用該結點的相鄰結點值的加權總和進行運算。函數的形式可以選擇,權的確定可以由一種叫反向傳導的方法通過把輸出結果和已知真實結果的比較來不斷調整,整個神經網絡的分析過程是一個“黑盒子”(不透明),無法展現可讀的模型,每階段的加權與轉換亦不明確顯示,所以神經網絡大多數都用于處理高度非線性且變量有相當程度交互效應的數據。
c.回歸分析方法
回歸分析是研究響應變量(或稱因變量)Y與n個預測變量(或稱自變量)X1,X2,…,Xn之間的相關關系并求出關系方程式,是將相關現象間不確定的數量關系一般化,是配合直線或曲線來代表現象之間的一般數量關系。回歸技術主要包括以下幾個方面:
(1)線性回歸
在線性回歸中,數據用直線建模。線性回歸是最簡單的回歸形式,是量化兩個連續變量之間關系的一種統計技術。將一個響應變量Y視為另一個隨機變量 X 的線性函數,即:Y=α+βX其中假定Y的方差為常數,α和β是回歸系數,分別表示直線在Y軸的截距和直線的斜率系數可以用最小二乘法求解,線性回歸常用于建立消費模型。
(2)多元線性回歸
多元回歸是線性回歸的擴展,涉及多個自變量。響應變量Y可以是一個多維特征變量的線性函數。
同樣也可以采用最小二乘法(OLS)求解回歸系數。
(3)Logistic回歸
Logistic回歸是多元線性回歸的變形和推廣,是為二元因變量(二分類變量)設計的非線性回歸模型,用來考察多個屬性變量在識別將要流失客戶方面的集成貢獻。
(4)其他非線性回歸
三、數據挖掘在CRM 中的應用
在企業管理客戶生命周期的各個階段都會用到數據挖掘技術,數據挖掘技術可以幫助企業確定客戶的特點,從而可以為客戶提供有針對性的服務;通過數據挖掘可以發現使用某一業務的客戶特征,從而可以向那些也同樣具有這些特征卻沒有使用該業務的客戶進行有目的推銷;還可以找到流失的客戶特征,在那些具有相似特征的客戶還未流失之前,采取針對性的措施。
首先,客戶關系管理理論中有一個經典的2、8原則,即80%的利潤來自于20%的客戶。通過數據挖掘中的決策樹分析法和分類分析算法對客戶消費行為、盈利能力進行分析。從而將客戶進行分類。其次,企業爭取一個新客戶的成本是保留一個老客戶7-10倍,因此,CRM 管理中,首先提倡的是保持現有客戶,實現現有客戶的重復購買,其次才是開拓新市場、吸引新客戶。通過數據挖掘技術首先為已流失客戶建模,是被他們的流逝模式,然后用這些模式找出當前客戶中相似背離者,以便采取相應預防措施。最后,客戶獲得。企業的增長要不斷獲得新客戶 數據挖掘技術能夠預測并識別潛在客戶群,從而使企業的促銷推廣活動更有針對性。
四、總結
本文介紹了數據挖掘技術在企業CRM系統中對客戶流失及保持的應用,在對客戶關系管理研究以及數據挖掘技術研究的理論背景之上,通過數據挖掘算法分析客戶群體特征,類別。并據此預測現有客戶的流失傾向,并采取相應的措施進行挽留,給出有效控制客戶流失的建議。
在客戶導向時代,客戶成為了企業利潤的最終來源,客戶關系管理則是企業提升經濟效率的一種重要途徑。數據挖掘技術與CRM 相結合完善了客戶關系管理系統,有助于提升企業的商業價值,為企業與客戶之間建立一個互動的長期穩定關系,使得客戶價值、企業利潤達到“雙贏”。