eBay使用機器學習完善促銷列表
譯文?譯者 | 布加迪
審校 | 孫淑娟
在線市場eBay在其機器學習模型中加入了額外的購買信號,比如“添加到關注列表”、“出價”和“添加到購物車”,根據搜索的初始商品提高所推薦的廣告列表具有的相關性。Chen Xue在最近的??這篇文章??中作了非常詳細的介紹。
eBay的促銷列表標準(PLS)是面向賣家的收費選項。使用PLSIM這個選項,eBay的推薦引擎會推薦類似潛在買家剛點擊的某個商品的贊助商品。PLSIM按CPA模式支付(賣家僅在銷售達成時向eBay付費),因此這對于創建最有效的模式來促銷最佳列表非常有動力。這往往對賣家、買家和eBay都卓有成效。
PLSIM旅程如下所示:
1. 用戶搜索商品。
2. 用戶點擊來自搜索的結果——>登錄查看商品(VI)頁面,以查看列出的商品(eBay稱之為種子商品)。
3. 用戶向下滾動VI頁面,可在PLSIM中看到推薦的商品。
4. 用戶點擊來自PLSIM的商品,執行操作(觀看、添加到購物車和立即購買等),或者查看另一組新的推薦商品。
從機器學習的角度來看,PLSIM旅程如下:
- 檢索與種子商品最密切相關的子集候選促銷列表標準(“查全集”)。
- 運用經過訓練的機器學習排序器,根據購買的可能性對查全集中的商品列表進行排序。
- 根據廣告費率對商品列表重新排序,以便將通過促銷實現的賣家售賣速度與推薦相關性作一番權衡。
排序模型
排序模型基于以下歷史數據:
- 推薦商品的數據
- 與種子商品相似的推薦商品
- 上下文(國家和產品類別)
- 用戶個性化功能
eBay使用梯度提升樹,對于特定的種子商品而言,該梯度提升樹根據商品的相對購買概率對商品進行排序。
從二元反饋到多重相關反饋
在過去,購買概率依賴二元購買數據。如果是與種子商品一起購買的,它就是“相關”的,不然就是“不相關”的。這是一種失敗的方法,不過有幾個主要的方面可加以優化:
- 漏報:由于用戶通常只從推薦列表中購買一件商品,因此在購買沒有進行的情況下,好的推薦可能被視為不好的推薦,從而導致誤報。
- 購買很少:與其他用戶事件相比,訓練具有足夠購買數量和多樣性的模型來預測正向類正變得頗具挑戰性。
- 遺漏數據:從點擊到添加到購物車,眾多用戶操作揭示了大量用戶信息,揭示了可能出現的結果。
綜上所述,eBay工程師除了考慮初始點擊以及如何將它們添加到排序模型外,還考慮以下用戶操作:
- 立即購買(僅適用于Buy-It-Now即BIN列表)
- 添加到購物車(僅適用于BIN列表)
- 出價(僅適用于最佳出價列表)
- 叫價(僅適用于拍賣列表)
- 添加到關注列表(適用于 BIN、最佳出價或拍賣列表)
用戶界面示例
多重相關反饋的相關級別
eBay現在知道購買極具相關性,因此需要添加其他操作,但新的問題是:這些操作在相關性等級內處于什么位置?
下圖說明了eBay如何對剩余的可能操作進行排序——“出價”、“立即購買”、“添加到關注列表”和“添加到購物車”。
在種子商品的歷史訓練數據中,每個潛在商品都按以下等級標記為相關性級別。
標記的結果是,在訓練期間,排序器對排序錯誤的購買實行的懲罰比排序錯誤的“立即購買”更嚴重,往下依此類推。
多重相關反饋的樣本權重
梯度提升樹支持多個標簽來捕獲一系列相關性,但沒有直接的方法來實現相關性的大小。
eBay不得不迭代運行測試,直至得出使模型工作的數字。研究人員加入了額外的權重(名為“樣本權重”),這些權重被饋送到成對損失函數中。他們優化了超參數調整工作,并運行了25次迭代,然后得出最佳的樣本權重——“添加到關注列表”(6)、“添加到購物車”(15)、“出價”(38)、“立即購買”(8)和“購買”(15)。如果沒有樣本權重,新模型的表現會較差。有了樣本權重,新模型的表現優于二元模型。
他們嘗試僅添加點擊作為額外的相關反饋,并運用經過調整的超參數“Purchase”樣本權重150。下面還顯示了離線結果,其中“BOWC”代表“立即購買”、“出價”、“添加到關注列表”和“添加到購物車”這些操作。購買排序反映了所購商品的平均排序。越小越好。
結論
訓練的模型總共有超過2000個實例。A/B測試分兩個階段進行。第一階段僅包括額外的選擇標簽,在eBay移動應用程序上的購買數量顯示增加2.97%,廣告收入顯示增加2.66%,這被認為足夠成功,可以將模型投入到全球生產環境。
第二階段在模型中加入了更多操作,比如“添加到關注列表”、“添加到購物車”、“出價”和“立即購買”,A/B測試顯示出更好的客戶參與度(比如更多的點擊和BWC)。
原文標題:??EBay Uses Machine Learning to Refine Promoted Listings???,作者:Jessica Wachtel?