MovieMat:如何利用場景數(shù)據(jù)進(jìn)行基于場景的電影推薦
原創(chuàng)【51CTO.com原創(chuàng)稿件】推薦系統(tǒng)是發(fā)展了數(shù)十年的技術(shù)體系,被廣泛應(yīng)用于電商、新聞APP、流媒體等領(lǐng)域。推薦系統(tǒng)的技術(shù)脈絡(luò)多種多樣,從主流的準(zhǔn)確率等技術(shù)指標(biāo)的提升和優(yōu)化,到近年來流行的基于公平性的推薦,吸引了成千上萬的研究者和從業(yè)者。
推薦系統(tǒng)的一個(gè)非常重要的子領(lǐng)域是基于場景的推薦。基于場景的推薦,顧名思義,就是利用用戶所在場景的信息輔助給用戶推薦感興趣的物品。一些著名的企業(yè),比如 Burger King 就在自己的服務(wù)中增加了基于場景的推薦。
基于場景的推薦的技術(shù)有許多, 然而并沒有形成一個(gè)主要的演化脈絡(luò)。比較著名的基于場景的推薦思路包括線性模型和張量分解。然而線性模型不利于處理復(fù)雜的關(guān)系,而張量分解本身又消耗大量的存儲空間,都存在著許多可以優(yōu)化之處。
在2021 年的國際學(xué)術(shù)會議 ICISCAE 2021,有學(xué)者發(fā)表了一篇題為 MatMat: Matrix Factorization by Matrix Fitting 的論文。提出了利用矩陣擬合的方式近似求解包含場景信息的評分矩陣。
首先,作者回顧了基于矩陣分解的推薦系統(tǒng)的框架:
???
我們可以觀察到,矩陣分解的本質(zhì)其實(shí)就是用向量的點(diǎn)乘去擬合標(biāo)量值。如果我們將矩陣分解的算法框架進(jìn)行推廣,用矩陣的乘法代替向量的點(diǎn)乘,用矩陣代替標(biāo)量進(jìn)行擬合。我們將得到 MatMat 框架:
???
矩陣的每個(gè)元素都是矩陣,矩陣元素的對角線對應(yīng)原始矩陣分解框架的標(biāo)量值,而矩陣對角線之外的元素是場景信息。
基于場景的推薦系統(tǒng)的研究難點(diǎn)之一是如何獲得開放的數(shù)據(jù)集合。由于場景信息本身難以獲取,可用的數(shù)據(jù)集合就顯得尤為珍貴。難能可貴的是國外的高校公開了一個(gè)名為 LDOS-CoMoDa 的數(shù)據(jù)集合,包含了大量的觀看電影的場景信息,使得基于場景的推薦系統(tǒng)的研究成為可能。
在 2021 年 12 月舉辦的國際學(xué)術(shù)會議 ICCC 上,有學(xué)者利用 LDOS-CoMoDa 數(shù)據(jù)集合和 MatMat 算法框架,提出了名為 MovieMat 和 MovieMat+ 的電影推薦算法。MovieMat 算法設(shè)定的用戶評分矩陣如下:
???
而 MovieMat+ 算法設(shè)定的用戶評分矩陣如下:
???
作者隨后利用 LDOS-CoMoDa 數(shù)據(jù)集合做實(shí)驗(yàn),對比了 MovieMat v.s 經(jīng)典矩陣分解,和 MovieMat+ v.s 經(jīng)典矩陣分解的結(jié)果。實(shí)驗(yàn)比較了 MAE 和 Degree of Matthew Effect 兩個(gè)指標(biāo)。其中 MAE 指代 Mean Absolute Error,用來衡量評分預(yù)測的準(zhǔn)確性; 而 Degree of Matthew Effect 用來衡量算法的公平性。
實(shí)驗(yàn)的結(jié)果如下:
???
???
根據(jù)觀察, 我們發(fā)現(xiàn) MovieMat 和 MovieMat+ 在測評數(shù)據(jù)上的表現(xiàn)都要優(yōu)于經(jīng)典矩陣分解的模型,最優(yōu) MAE 在 0.6 - 0.7 的水平。
MovieMat 和 MovieMat+ 都是依托于 MatMat 框架的電影推薦系統(tǒng)。MovieMat 和 MovieMat+ 表現(xiàn)都優(yōu)于沒有場景信息的推薦系統(tǒng),是非常有前景的技術(shù)。在下一代的電影院中,如果電影院可以利用傳感器和人臉識別算法記錄下用戶的場景信息,將會有效提升電影院產(chǎn)業(yè)的利潤,而 MovieMat 和 MovieMat+ 將在這一波的技術(shù)革新中大方異彩。
參考文獻(xiàn)地址:
1. ??MatMat: Matrix Factorization by Matrix Fitting??
2. ??MovieMat: Context-aware Movie Recommendation with Matrix Factorization by Matrix Fitting??
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】