基于概率隱層模型的購物搭配推送:阿里巴巴提出新型用戶偏好預測模型
論文鏈接:https://arxiv.org/abs/1707.08113
這篇文章中,阿里研究者們對電商領域營銷推送場景進行了點擊率的優化。營銷推送場景和傳統電商推薦場景有很多類似的地方,但也有所不同。首先,營銷推送的點擊率受文案影響很大,和用戶直接相關的文案的點擊率會明顯高于通用的推送文案;其次,每次營銷推送只有一個展示坑位,因為對推送商品的準確度要求更高。
為解決***個問題,我們進行「購物搭配」場景的推薦。購物搭配場景推送一個和用戶已購買商品的搭配商品,比如當用戶買了高級茶壺后對上好茶葉進行推送(下圖第二個推送信息)。購物搭配的好處是文案中可以透出用戶已購商品,消息可以和用戶建立強烈的 attachment,提升消息打開率。
為尋找搭配商品對,我們定義如下兩個指標:
1)同時購買分數(Co-Purchase Graph)
2) 看了又買分數(View-and-then-Purchase Graph)
***個指標衡量了兩個商品之間的互補性(complementarity),第二個指標衡量了兩個商品的替代性(substitutivity)。購物搭配場景下,我們希望尋找高互補性、低替代性的商品對進行推薦。因此,我們把商品對「搭配性」的得分定義為:
這個分數是我們推薦模型中的一個重要特征。
為了解決推薦準確性的問題。我們對用戶分層進行更細致的刻畫。我們的主要思想是基于用戶行為對用戶的向量表示(Embeddings)進行學習,然后我們用這些向量表示對用戶的行為進行預測。向量表示可以理解為對用戶在高維度的一個量化的抽象表示。
向量表示的好處是可以更精準,更靈活的對目標進行表達。舉個例子,我們對用戶的描述不僅僅局限于年齡、消費能力等人可以 Intuitively 容易想到的維度,人工智能可以自動從消費者數據中學習到更全面更抽象的維度,比如用戶對推薦平臺的依賴程度,用戶對選擇商品的創新性等。
用戶向量的學習我們采用的是概率隱層模型(Probabilistic Latent Class Modeling)。首先我們定義用戶點擊模型如下:
這個模型分為兩層,***層是隱層用來刻畫用戶在高維度下的分層,采用多維邏輯回歸分類的形式。
第二層是點擊率預測模型。我們這里選擇了一個二維邏輯回歸模型。不過可以很容易的擴展使用深度神經網絡。
我們要在已知用戶特征和點擊數據的條件下估計模型參數。我們采用經典的 EM(Expectation-Maximization)算法。
EM 算法需要先求解 Q 函數:
為優化 Q 函數我們對參數進行迭代優化如下:
上面兩個更新很容易通過 Gradient Decent 方法求解。
下圖是我們對求解模型的一個解釋。我們發現高活躍用戶更加看中自己的傾向,預測模型的權重在用戶偏好類的特征中高(high model weights on user preference features);低活躍用戶更加依賴于平臺的推薦,更喜歡平臺選擇的搭配性好的商品,預測模型權重在商品搭配性的特征權重高 (high model weights on )。這可以直觀的理解為深度用戶在選擇商品上更有自己主見,而新手更依賴于平臺。
目前該工作在線上取得了不錯的效果,購物搭配的推送推薦場景上看到~50% 點擊率的提升。
更廣義地來講,這項技術給行業帶來的好處的是可以更精準和全面的刻畫用戶,進一步推廣可以用來描述商品、資訊、視頻等其他目標。該技術可以幫助使我們的營銷推薦更友好(了解用戶),同時從商業上提高轉化率(高點擊率)。