如何利用零樣本全序列排序學習進行推薦
譯文作者 | 汪昊
審校 | 重樓
推薦系統領域是一個子領域繁多,覆蓋技術面廣博的技術領域。因為推薦系統能給網站帶來低成本流量從而極大的推動網站的發展,因此被各大互聯網公司青睞。推薦系統團隊和產品的維護費用,與推薦系統帶來的經濟收益相比,對大公司而言是微不足道的,因此幾乎所有的大型互聯網公司都給自己配備了推薦系統團隊。
所有的推薦系統工程師在設計和搭建推薦系統的過程中,都會碰到冷啟動問題。也就是當一個新用戶或者新物品進入我們系統的時候,因為缺乏相關歷史數據,所以沒有辦法給用戶進行推薦。最簡單的解決辦法是推薦熱門商品。近幾年來流行的遷移學習和元學習算法,也是常見的解決冷啟動問題的方式。
2021 年,ZeroMat 算法被中國科學家發明,這是人工智能歷史上第一個非啟發式,不利用遷移學習/元學習的零樣本學習算法。該算法可以很好的解決推薦系統冷啟動問題。隨后DotMat、PoissonMat、RankMat、PowerMat 和 LogitMat 等一系列不需要數據就能進行推薦的零樣本算法被相繼提出。在 2024 年結束的國際學術會議 ICCAI 2024 上,中國科學家提出了零樣本全序列排序學習算法。本文將帶領讀者學習該算法的細節,從而對該技術一探究竟。
作者首先回顧了全序列 Order Statistics 的公式。全序列的 Order Statistics 公式沒有大多數人想象的那么復雜,它其實就是全概率公式乘以變量數的階乘。而推薦系統的輸入數據中,評分越高的物品,打分人數就越多,因此作者在這里用評分本身來代替評分的分布。比如,我們認為得分為 5 的電影的打分觀眾人數是得分為 1 的觀眾的 5 倍。而得分為 5 的電影,在評分數據集合中出現的次數也是得分為 1 的電影的 5 倍。作者用矩陣分解的方式近似用戶物品評分。由此,我們得到下列損失函數:
為了求解最大似然函數的參數,作者采用了隨機梯度下降算法,因此得到了下列公式:
我們發現在上述公式中,沒有出現歷史數據,因此該算法是真正意義上的零樣本學習算法。作者隨后在 MovieLens 1 Million Dataset 和 LDOS-CoMoDa Dataset 兩個數據集合上測試了算法的效果:
圖 1 和 圖 2 顯示在 MovieLens 數據集合上,該算法性能優越,超過了經典的矩陣分解算法和其他零樣本學習算法。
圖 3 和 圖 4 顯示在 LDOS-CoMoDa 數據集合上,該算法性能優越,超過了經典的矩陣分解算法和其他零樣本學習算法。
綜上所述,我們發現該算法不僅實現簡單,并且性能優越。值得每一個推薦系統從業者認真學習和積極關注。
論文名稱:Zeroshot Listwise Learning to Rank Algorithm for Recommendation
論文下載地址:https://www.researchgate.net/publication/383585074_Zeroshot_Listwise_Learning_to_Rank_Algorithm_for_Recommendation
作者簡介
汪昊,達評奇智董事長兼創始人。前 Funplus 人工智能實驗室負責人。在 ThoughtWorks、豆瓣、百度、新浪、網易等公司有超過 13 年的技術和技術管理經驗。精通推薦系統、風控反欺詐、聊天機器人和爬蟲等領域。在國際學術會議和期刊發表論文 44 篇。5 次獲得最佳論文獎/最佳論文報告獎。2006 年 ACM/ICPC 北美落基山區域賽金牌。