盤點四種常用的推薦算法
本文轉載自微信公眾號「大數據DT」,作者劉強。轉載本文請聯系大數據DT公眾號。
01 基于內容的推薦
推薦系統是通過技術手段將標的物與人關聯起來,標的物包含很多屬性,用戶通過與標的物的交互會產生行為日志,通過這些行為日志可以挖掘出衡量用戶對標的物偏好的標簽(將標的物的屬性賦予喜歡它的用戶,讓用戶具備這個標簽),通過這些偏好標簽為用戶做推薦就是基于內容的推薦算法。
拿視頻推薦來說,視頻有標題、國別、年代、演職員、標簽等信息,用戶以前看過某類視頻,就代表用戶對這些視頻有興趣,比如用戶偏好恐怖、科幻類電影,這樣用戶的電影偏好就被打上了恐怖、科幻的標簽,我們就可以根據這些興趣特征為用戶推薦恐怖、科幻類電影。
02 協同過濾
用戶在產品上的交互行為為用戶留下了標記,我們可以利用“物以類聚、人以群分”的樸素思想來為用戶提供個性化推薦。
具體來說,“人以群分”就是找到與用戶興趣相同的用戶(有過類似的行為),將這些興趣相同的用戶瀏覽過的標的物推薦給用戶,這就是基于用戶的協同過濾算法。
“物以類聚”就是如果有很多用戶都對某兩個標的物有相似的偏好,說明這兩個標的物是“相似”的,我們可以通過推薦與用戶喜歡過的標的物相似的標的物這種方式為用戶提供個性化推薦,這就是基于物品的協同過濾推薦算法。
圖1-2簡單說明了這兩類協同過濾算法。
▲圖1-2 兩類協同過濾推薦算法
03 基于模型的推薦
一般來說,可基于用戶行為記錄、用戶相關信息(年齡、性別、地域和消費習慣等)及標的物相關信息來構建算法模型,預測用戶對物品的偏好,常用的算法包括logistic回歸、矩陣分解、分解機等。
隨著深度學習技術的發展,目前有很多深度學習相關的算法落地到了推薦系統上,并產生了很好的效果。
04 基于社交關系的推薦
我們在日常生活中經常為別人或者要求別人給我們推薦書籍、 餐廳、電影等,這種推薦方式往往效果較好,大家也更容易接受。
微信“看一看”模塊中的“在看”就是通過將你的微信好友看過的文章展示給你來實現推薦的,張小龍在2019年微信8周年的微信公開課上說到,“在看”比“看一看”模塊中的“精選”效果好很多,而“精選”就是通過算法來實現的推薦。
在這些推薦算法中,基于內容的推薦和協同過濾推薦是最古老、最常用的推薦算法,實現相對簡單,效果也很不錯,在工業界得到了大規模的應用。
關于作者:劉強,碩士學歷,09年畢業于中國科學技術大學數學系。有12年大數據與推薦系統實踐經驗,精通企業級推薦系統的構建。從零到一打造過千萬級DAU視頻APP的推薦系統,推薦系統產生的流量占全APP流量的30%。在過去的3年內為多家中小型互聯網公司(流媒體、在線教育、跨境電商等)提供技術咨詢,幫助他們從零到一構建推薦系統。
本文摘編自《構建企業級推薦系統》,經出版方授權發布。