成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

LogitMat:不需要數(shù)據(jù)的推薦系統(tǒng)

原創(chuàng) 精選
開發(fā)
推薦系統(tǒng)誕生于 1992 年的一篇論文。自推薦系統(tǒng)誕生以來,無數(shù)的科學(xué)家和工程師為這一領(lǐng)域傾注了心血。

作者 | 汪昊

審校 | 重樓

推薦系統(tǒng)誕生于1992 年的一篇論文。自推薦系統(tǒng)誕生以來,無數(shù)的科學(xué)家和工程師為這一領(lǐng)域傾注了心血。在過去32 年里,許多大學(xué)成立了研究推薦系統(tǒng)的研究組(比如科羅拉多大學(xué)的THAT 組),而各種各樣的公司(百度、字節(jié)跳動等)也充分利用了推薦系統(tǒng)的獲客屬性,實現(xiàn)了低成本高收益的引流渠道。據(jù)報道,推薦系統(tǒng)能夠幫助大型網(wǎng)站實現(xiàn)30% 40% 的流量提升。據(jù)咨詢公司Modor Intelligence 預(yù)測, 2024 年推薦系統(tǒng)的世界市場份額會達(dá)到500 億元人民幣以上。

目前,全世界推薦引擎增長最快的地區(qū)是亞太地區(qū),而推薦系統(tǒng)的主要玩家都是大規(guī)模的云計算公司和老牌巨頭企業(yè)。在過去幾年中,沒有哪家創(chuàng)業(yè)公司能夠快速發(fā)展,吃掉大公司的市場份額。因此,我們可以初步認(rèn)為,推薦系統(tǒng)在全球范圍內(nèi)的發(fā)展已經(jīng)進(jìn)入了穩(wěn)定期。

2017 年以來,越來越多的專家關(guān)注到了推薦系統(tǒng)算法性能之外的問題,特別是推薦系統(tǒng)公平性。然而有一個非常棘手的問題,推薦專家們一直沒能很好的解決。那就是推薦系統(tǒng)的冷啟動問題。在沒有數(shù)據(jù)的情況下,我們該怎么解決推薦的難題?為了介紹相關(guān)知識,我們先介紹一下零樣本學(xué)習(xí)的發(fā)展歷程。零樣本學(xué)習(xí)發(fā)端自21 世紀(jì)的頭十年,然而過去20 年的零樣本算法,基本都需要遷移學(xué)習(xí)或者元學(xué)習(xí),沒有一個算法能成為真正的零樣本學(xué)習(xí)。這一狀況一直等到了2021 ZeroMat 被發(fā)明出來后才得以改變(ZeroMat 的源代碼地址:https://github.com/haow85/ZeroMat),后續(xù)陸陸續(xù)續(xù)有新的零樣本算法出現(xiàn),讓人們意識到即便不使用任何數(shù)據(jù),我們也可以把推薦做的很好。

2023 Ratidar Technologies LLC 公司公司官網(wǎng):http://ratidar.mysxl.cn推出了一款不需要數(shù)據(jù)的推薦系統(tǒng)算法 LogitMat(論文下載地址:https://arxiv.org/ftp/arxiv/papers/2307/2307.05680.pdf。該算法利用了邏輯回歸和矩陣分解結(jié)合的方式,在不使用輸入數(shù)據(jù)的情況下,完美完成了推薦的任務(wù)。下面我們來看一下這個算法的細(xì)節(jié):

上面這個公式是矩陣分解的損失函數(shù)。簡單來說,就是我們需要計算出用戶特征向量 U 和物品特征向量V, 以便使得他們的點乘和用戶評分的差值最小。可以看出來,矩陣分解算法本質(zhì)上是一個降維算法。我們利用向量點乘將用戶評分矩陣的O(mn) 空間復(fù)雜度降為 O(k(m+n)),其中m 是用戶數(shù)、n 是物品數(shù)、k 是向量長度。通常k 遠(yuǎn)小于m 或 n ,因此矩陣分解算法有效的降低了算法的空間復(fù)雜度。

我們發(fā)現(xiàn)電影評分服從冪律分布,因此我們可以用評分值本身來替換評分的分布。如果我們用邏輯回歸來表示評分的分布,也就等價于用邏輯回歸來計算評分值。我們得到下面的公式:

其中 U 和 V 就是矩陣分解中的 U 和 V,而 W Z 是系數(shù)。的值就是下標(biāo)I 本身。那么我們把這個公式帶入到矩陣分解的損失函數(shù)公式中去,得到下面的損失函數(shù)公式:

利用隨機梯度下降對該損失函數(shù)求導(dǎo)。我們得到了如下的公式:

雖然公式看起來非常復(fù)雜,但其實實現(xiàn)起來只需要比對公式正常輸入就可以,因此實現(xiàn)難度并不大。

LogitMat 的發(fā)明人隨后在MovieLens 1 Million Dataset 和 LDOS-CoMoDa Dataset 兩個不同的數(shù)據(jù)集合上驗證了該算法的準(zhǔn)確率和公平性。MovieLens 1 Million Dataset 6040 名用戶和3952 部電影的評分組成,而LDOS-CoMoDa Dataset 是個更小的數(shù)據(jù)集合。作者在測評準(zhǔn)確率的時候使用了MAE 指標(biāo)。之所以作者使用 MAE 指標(biāo),是因為該指標(biāo)歷史最為悠久,能夠和海量論文實驗數(shù)據(jù)作對比。而在測評公評性的時候,作者采用了 Degree of Matthew Effect

實驗結(jié)果如下:

上圖顯示了LogitMat 4 種零樣本學(xué)習(xí),2 種排序?qū)W習(xí)和經(jīng)典的矩陣分解算法的對比效果,LogitMat 取得了第2 名的好成績。

上圖顯示了算法在 LDOS-CoMoDal 數(shù)據(jù)集合上的測評結(jié)果。同樣的,LogitMat 算法的效果非常理想,讓人拍案叫絕。

LogitMat 是不需要數(shù)據(jù)的推薦系統(tǒng)算法,因為在算法的求解過程中沒有出現(xiàn)評分矩陣的評分值 R。利用這個思路,我們可以設(shè)計出許多新的零樣本學(xué)習(xí)算法。這一切聽上去似乎非常可怕——我們可以不利用任何數(shù)據(jù)預(yù)測我們喜歡什么電影。而這并不需要花多少的計算資源就可以實現(xiàn)。事實上,我只要有一臺 2024 年的手提電腦就可以預(yù)測成千上萬人的興趣愛好。

需要注意的是,我們只需要修改 W 和 Z ,把他們改成更為復(fù)雜的形式,就可以把 LogitMat 變?yōu)樯疃葘W(xué)習(xí)模型。基于深度學(xué)習(xí)的零樣本學(xué)習(xí)算法,其實離我們也并不太遙遠(yuǎn)了。也許有一天,我們會發(fā)現(xiàn),所謂的推薦系統(tǒng)和評分體系不過是一場人類歷史上的美麗誤會。僅僅因為我們跑的太快,我們忘了自己的數(shù)學(xué)根基并不牢靠。或許,推薦系統(tǒng)有著我們長久忽略的社會學(xué)意義,就像下面這篇論文中描述的:Human Culture: A History Irrelevant and Predictable Experience (論文下載地址:https://arxiv.org/ftp/arxiv/papers/2307/2307.13882.pdf),人類的文化因為冪律現(xiàn)象和時間無關(guān)現(xiàn)象被鎖死了。

作者簡介

汪昊,前 Funplus 人工智能實驗室負(fù)責(zé)人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司擔(dān)任技術(shù)和技術(shù)高管職務(wù)。在互聯(lián)網(wǎng)公司和金融科技、游戲等公司任職 13 年,對于人工智能、計算機圖形學(xué)和區(qū)塊鏈等領(lǐng)域有著深刻的見解和豐富的經(jīng)驗。在國際學(xué)術(shù)會議和期刊發(fā)表論文 42 篇,獲得IEEE SMI 2008 最佳論文獎、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳論文報告獎。

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2017-03-13 13:54:40

戴爾

2012-12-24 10:41:00

大數(shù)據(jù)數(shù)據(jù)分析

2013-07-18 09:21:32

代碼文檔

2010-11-23 10:55:47

跳槽

2010-05-07 10:28:52

Linux系統(tǒng)

2018-01-29 13:18:42

前端JavaScript

2012-08-23 09:50:07

測試測試人員軟件測試

2009-11-23 12:45:22

2015-09-30 09:57:53

天分熱情工程師

2016-10-26 13:35:43

云自動資源負(fù)載

2016-10-26 20:21:34

自動縮放可擴展性

2018-05-29 10:01:31

2011-11-07 16:42:21

光纖技術(shù)數(shù)據(jù)中心

2015-08-20 10:56:19

算法界面開發(fā)

2013-12-02 09:43:29

字符串編程

2022-09-14 15:10:40

前端架構(gòu)

2022-02-15 07:26:34

web前端算法題

2014-01-17 13:09:48

Linux碎片整理

2021-12-12 22:20:47

Docker開發(fā)容器

2009-06-11 10:59:07

HTML5Flash插件
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久综合一区 | 亚洲国产免费 | 久久蜜桃精品 | 国产欧美一区二区三区久久 | 国产在线播 | 精产嫩模国品一二三区 | www.久| www.99精品 | 超碰在线久 | 国产不卡在线观看 | 在线午夜 | 亚洲高清av在线 | 亚洲精品99999 | av黄色在线 | 国产一区二区三区免费 | 国产小视频在线观看 | 亚洲有码转帖 | 中文字幕高清 | 国产精品女人久久久 | 国产午夜一级 | 中日韩欧美一级片 | 精品av| 成人av电影天堂 | 天天拍夜夜爽 | 亚洲伊人久久综合 | 青草青草久热精品视频在线观看 | 精品一区二区三区在线观看 | 91五月天 | 亚洲天堂一区 | av片网站 | 在线看片网站 | 日韩精品一区二区三区中文字幕 | 亚洲国产精品一区二区久久 | 波多野结衣二区 | 午夜久久久久久久久久一区二区 | 自拍偷拍亚洲一区 | 一区二区在线不卡 | 99这里只有精品视频 | 色综合一区二区 | 中文字幕在线看人 | 日韩精品在线观看视频 |