用友UAP曾小青:基于數據挖掘的客戶細分方法
近日商務部發布數據,1-2月,全國社會消費品零售總額增長11.8%。我國的消費市場繼續保持著平穩較快發展的態勢。隨著電子商務和移動互聯網的普及,消費數據大量積累,數據挖掘需求越加強烈。企業和商家更加重視客戶的消費行為,用友集團UAP中心大數據專家曾小青表示,將消費數據進行挖掘,以此作為客戶分類的參考依據,可以更好提高客戶滿意度,并提供更準確的決策依據。
在消費市場異常激烈的競爭格局中,企業都在從以產品為核心向以客戶為核心的商業模式轉變。企業成功的關鍵在于重視客戶需求,通過維持長期的良好的客戶關系來獲取持續競爭優勢。曾小青認為,企業需要解決三個基本問題,即獲得客戶、留住客戶和極大化客戶價值。而這三個問題的基本前提都是將客戶進行細分,以此歸納需要什么類型的客戶,并升華他的價值,進而提供差異化服務。
企業都擁有自己的商業數據,尤其消費型企業,其數據是海量的。“領先的企業不只是存儲這些數據,而且借助基于BI的高級數據分析系統,幫助企業制訂并實現企業戰略。”曾小青提到了現在企業都很關注的商業分析。“如果在對客戶進行分類時,利用商業分析技術進行數據挖掘,可以避免人為因素帶來的數據偏差,為企業提供更為完整的客戶細分解決方案,提高客戶細分的科學性和準確性。”
常用客戶細分方法比較
“客戶細分”是指企業根據客戶屬性、行為、需求、偏好以及價值等因素對客戶進行分類,并提供有針對性的產品、服務和銷售模式的過程??蛻艏毞址椒ú⒉还潭ǎ髽I常根據客戶數據庫中已有信息和自身管理的需要進行具體客戶分類。一般有定性和定量兩種方法:定性客戶細分是根據不同客戶價值的側重點不同對客戶進行分類。該方法沒有嚴格的論證過程,主要依賴于決策者的判斷,在分析過程中會出現偏差,容易造成決策失誤。
定量分類法以具體的客戶變量(客戶特征、客戶價值、消費行為特點等)為依據,運用定量分析技術進行客戶分類的方法。曾小青告訴記者,當前用于定量客戶分類研究的數據挖掘技術主要有兩大類:一是傳統統計方法,主要包括主成分分析、貝葉斯分類、因子分析等;二是非統計方法,如神經網絡、決策樹、遺傳算法和模糊集等。但是傳統的統計方法無法處理復雜、數據量大的問題,而且處理結果的精確性也不高。當前客戶細分使用的數據挖掘技術主要是非統計的方法或者兩種方法的結合。
客戶細分另外一個非常重要的問題就是分類變量的選擇??蛻艏毞指鶕蛻魧傩詣澐挚蛻纛愋停⒁源朔治鲱A測客戶的購買模式。分類變量選擇方式通??梢曰诳蛻艚y計特征、客戶價值和消費行為。
一、基于客戶統計特征的細分。通常這類客戶細分使用人口統計特征為變量,如性別、年齡、收入、地理位置等。其優點在于變量數據易于收集,在簡單外部環境下,具備一定有效性。但是,這種基于客戶特征的細分方法無法反映客戶的價值貢獻,也無法分析和預測客戶的消費行為。
二、基于客戶價值的細分。主要基于客戶當前價值、潛在價值及客戶忠誠度三個方面分析客戶價值,最終實現客戶分類。由于沒有建立完整的客戶價值評估體系,在客戶細分的時候通常采用客戶生命周期價值作為細分依據。如ShuiHua Han利用客戶歷史價值、當前價值、長期價值、忠誠和信用五個指標,結合決策樹算法,對客戶群體進行細分。同樣,這類客戶在反應客戶消費行為方面力度不夠。
三、基于消費行為的客戶細分。消費行為真實描述了客戶的購買,同時也表現了客戶對企業各種服務和產品的真實反應。最常用的基于消費行為的客戶細分是1994 年Hushes提出的RFM 模型細分。
基于消費數據挖掘的行為細分
通過對常用的客戶分類方法比較和分析,曾小青表示,基于消費數據挖掘的行為細分是更為科學的細分方式?;谙M數據挖掘的客戶細分方法依據客戶以往和現在的行為來預測將來的行為,是一種以行為模式數據為基礎、以信息技術為支撐的細分方法。該方法是通過分析數據庫中已有客戶的消費行為模式來將客戶分類。
Hushes(1994)提出了RFM(R:Recency,F:Frequency,M:Monetary)模型,以3 個行為變量來區分客戶。R 是最近一次購買至現在的時間間隔,F 是購買次數,M 是某一期間內購買的金額。RFM 分析針對客戶的每個指標打分,計算三個指標的加權和,再按這個結果排序。
針對傳統RFM 模型,Hui-Chu Chang指出R、F 的值越大,相關客戶與企業開展新交易的可能性越大;M 的值越大,相關客戶與企業重復購買的可能性越大。Fang-Ming Hsu從客戶交易數據庫中查詢客戶最近一次購買產品的時間,并按照購買先后順序進行排序,然后將客戶群劃分成5 等份,最近購買的客戶記5分,購買時間最遠的客戶記1 分。用類似的方法,對所有客戶按照其購買的頻率和總金額由高到低進行打分,每個客戶都具有反映其RFM 狀況的三個分值。例如,得分為111 的客戶是最近沒有購買且購買頻率和金額都很低的客戶,得分為555的客戶是擁有最近購買行為、購買頻率和金額都很高的客戶。
但是該方法對于分值代表范圍有不確定性,人為影響較為嚴重。并且購買次數F和同期總購買額M 兩個變量之間會存在多重共線性。Ching-Hsue Cheng利用粗糙集結合RFM 模型,得出最合適的客戶分類數,改進了傳統RFM 細分模型。從以上眾多方法可以看出,目前無論是客戶細分技術還是客戶分類變量的選擇都較為分散,而且往往只給出了某一個或幾個環節的方法,缺乏現實指導性。
曾小青在總結了前人的經驗后,提出了一種更加完整的針對消費數據挖掘的客戶細分新方法——基于消費數據挖掘的多指標RFM客戶細分。